Новаторское использование гиперспектральных данных и DCGAN улучшает оценку содержания белка в рисе
Рис (Oryza sativa L.) — ключевая культура, кормящая более половины населения мира. Растёт спрос на высококачественный, богатый белком рис, что делает точную оценку содержания белка в зерне (GPC) жизненно важной для селекции улучшенных сортов.
Несмотря на прогресс в геномных инструментах, таких как GWAS, традиционное фенотипирование остаётся трудоёмким и дорогим, создавая узкое место. Оптическое и спектральное сканирование предлагает решения для высокопроизводительного фенотипирования, но небольшие и несбалансированные наборы данных ограничивают производительность и обобщаемость моделей.
Исследование, опубликованное в Plant Phenomics, направлено на решение этих проблем с помощью генеративно-состязательной сети (DCGAN) для создания симулированных данных, повышения точности модели GPC и изучения потенциала генетического анализа.
В работе использовались гиперспектральные данные и DCGAN. Необработанные и нормализованные спектральные данные выявили ключевые особенности поглощения, важные для анализа GPC. Сгенерированные DCGAN после 8 000 эпох симулированные данные близко соответствовали измеренным, что повысило точность модели.
Модель регрессии на основе метода частичных наименьших квадратов (PLSR) с использованием этих признаков достигла высокой точности валидации (R2 = 0.58, RRMSE = 6.70%).
Кроме того, полногеномный поиск ассоциаций (GWAS) с симулированными данными выявил значимые SNP, включая ген OsmtSSB1L, связанный с запасными белками зерна.
Этот подход демонстрирует потенциал для создания моделей GPC с высокой обобщающей способностью, способствуя углублённому генетическому анализу и селекции сортов риса.
По словам ведущего исследователя Хэнбяо Чжэна, «это исследование предоставляет новую методику для эффективного генетического изучения фенотипических признаков риса на основе гиперспектральной технологии».
В перспективе дальнейшая доработка и валидация метода на различных экологических участках и более обширных наборах данных повысят его надёжность и применимость, открывая путь к более точной и эффективной селекции высококачественных сортов риса.
