Новаторское использование гиперспектральных данных и DCGAN улучшает оценку содержания белка в рисе

Рис (Oryza sativa L.) — ключевая культура, кормящая более половины населения мира. Растёт спрос на высококачественный, богатый белком рис, что делает точную оценку содержания белка в зерне (GPC) жизненно важной для селекции улучшенных сортов.

Несмотря на прогресс в геномных инструментах, таких как GWAS, традиционное фенотипирование остаётся трудоёмким и дорогим, создавая узкое место. Оптическое и спектральное сканирование предлагает решения для высокопроизводительного фенотипирования, но небольшие и несбалансированные наборы данных ограничивают производительность и обобщаемость моделей.

Исследование, опубликованное в Plant Phenomics, направлено на решение этих проблем с помощью генеративно-состязательной сети (DCGAN) для создания симулированных данных, повышения точности модели GPC и изучения потенциала генетического анализа.

В работе использовались гиперспектральные данные и DCGAN. Необработанные и нормализованные спектральные данные выявили ключевые особенности поглощения, важные для анализа GPC. Сгенерированные DCGAN после 8 000 эпох симулированные данные близко соответствовали измеренным, что повысило точность модели.

Модель регрессии на основе метода частичных наименьших квадратов (PLSR) с использованием этих признаков достигла высокой точности валидации (R2 = 0.58, RRMSE = 6.70%).

Кроме того, полногеномный поиск ассоциаций (GWAS) с симулированными данными выявил значимые SNP, включая ген OsmtSSB1L, связанный с запасными белками зерна.

Этот подход демонстрирует потенциал для создания моделей GPC с высокой обобщающей способностью, способствуя углублённому генетическому анализу и селекции сортов риса.

По словам ведущего исследователя Хэнбяо Чжэна, «это исследование предоставляет новую методику для эффективного генетического изучения фенотипических признаков риса на основе гиперспектральной технологии».

В перспективе дальнейшая доработка и валидация метода на различных экологических участках и более обширных наборах данных повысят его надёжность и применимость, открывая путь к более точной и эффективной селекции высококачественных сортов риса.

2024-07-08