GenoDrawing: Автоэнкодеры и SNP-маркеры для фенотипирования растений
Прогресс в полногеномном секвенировании произвел революцию в характеристике видов растений, предоставив огромный массив генотипических данных. Сочетание геномной селекции и нейронных сетей, особенно глубокого обучения и автоэнкодеров, стало многообещающим методом для прогнозирования сложных признаков.
Однако в таких областях, как фенотипирование растений, остаются трудности с точным переводом визуальной информации из изображений в измеримые данные для геномных исследований.
В ноябре 2023 года журнал Plant Phenomics опубликовал статью "GenoDrawing: An Autoencoder Framework for Image Prediction from SNP Markers".
В исследовании представлен инновационный подход, использующий сеть автоэнкодера и предиктор эмбеддингов для упрощения изображений яблок до 64 измерений и предсказания формы плодов на основе молекулярных данных (SNP-маркеров).
Метод, названный GenoDrawing, включает обучение автоэнкодера на большом наборе изображений яблок. Полученные эмбеддинги вместе с данными SNP затем используются для предсказания и реконструкции формы яблок.
Метод показал, что целевые SNP (tSNPs) последовательно превосходят случайно выбранные SNP (rSNPs) в предсказании эмбеддингов изображений, что приводит к более точным прогнозам формы плода.
Лучшие модели, использующие tSNPs, достигли более низких средних абсолютных ошибок (MAEs) и давали распределения, более близкие к исходным данным, по сравнению с моделями на rSNPs. Кроме того, версия на основе tSNPs предсказывала более широкий диапазон форм плодов, демонстрируя свою эффективность в захвате разнообразия фенотипов яблок.
Однако исследование выявило ограничения, включая неспособность модели точно захватывать определенные особенности плодов и влияние факторов окружающей среды на фенотипы яблок.
Несмотря на эти проблемы, подход представляет собой значительный прогресс в геномном предсказании, демонстрируя потенциал объединения анализа изображений с молекулярными данными для понимания сложных признаков у сельскохозяйственных культур.
В итоге, результаты показывают, что выбор релевантных SNP имеет решающее значение для точных прогнозов и что GenoDrawing может эффективно научиться предсказывать форму плодов при наличии правильных маркеров.
Это исследование закладывает основу для будущих работ, направленных на повышение точности и применимости моделей геномного предсказания путем включения данных изображений и улучшения стратегий отбора SNP.
