Новый подход делает ИИ адаптируемым для компьютерного зрения в селекции растений
Учёные разработали инструмент машинного обучения, который может самостоятельно, с минимальным внешним руководством, отличать аэрофотоснимки цветущих и нецветущих злаков. Это достижение значительно ускорит полевые сельскохозяйственные исследования. Работа проводилась на изображениях тысяч разновидностей травы мискантус, каждая из которых имеет свои особенности и сроки цветения.
Точное определение признаков растений в различных условиях и в разные моменты вегетационного цикла — сложная задача, отметил Эндрю Лики, профессор биологии растений и растениеводства в Университете Иллинойса в Урбане-Шампейне, руководивший работой совместно с Себастьяном Варелой из Центра инноваций в области передовой биоэнергетики и биопродуктов.
Новый подход должен быть применим ко многим другим культурам и задачам компьютерного зрения, заявил Лики. Результаты опубликованы в журнале Plant Physiology.
"Время цветения — ключевой признак, влияющий на продуктивность и адаптацию многих культур, включая мискантус, к разным регионам выращивания. Но повторяющиеся визуальные осмотры тысяч отдельных растений в обширных полевых испытаниях очень трудоёмки", — сказал Лики.
Автоматизация этого процесса с помощью сбора изображений с дронов и использования искусственного интеллекта для извлечения данных может его упростить. Однако создание моделей ИИ, способных различать тонкие признаки на сложных изображениях, обычно требует огромного количества размеченных человеком данных, что очень затратно по времени. Кроме того, методы глубокого обучения, как правило, сильно зависят от контекста.
Это означает, что при изменении контекста — например, при переходе к другой культуре или к той же культуре в другом месте или сезоне — модель, вероятно, потребуется переобучать на новых размеченных изображениях, отражающих новые условия.
"Существует множество примеров, где люди продемонстрировали возможность использования ИИ для ускорения применения сенсорных технологий — от датчиков на листьях до спутников — в селекции, почвоведении и растениеводстве, но широкого внедрения пока не происходит. Мы считаем, что одна из главных причин — огромный объём усилий, необходимых для обучения инструмента ИИ", — пояснил Лики.
Чтобы сократить потребность в размеченных человеком данных для обучения, Варела использовал известный метод, заставляющий две модели ИИ соревноваться друг с другом в так называемой "генеративно-состязательной сети" (GAN). Часто одно из применений GAN — генерация одной моделью поддельных изображений нужной сцены, а вторая модель оценивает, какие изображения фальшивые, а какие настоящие.
Со временем модели улучшают друг друга: первая генерирует более реалистичные подделки, а вторая лучше отличает подделки от оригинала. В процессе модели приобретают визуальную экспертизу в конкретной предметной области, что позволяет им лучше анализировать детали любых новых изображений.
Варела предположил, что можно использовать эту самонакопленную экспертизу, чтобы сократить количество размеченных изображений, необходимых для обучения моделей различению разных культур. В результате он создал "эффективно контролируемую генеративно-состязательную сеть" (ESGAN).
В серии экспериментов исследователи сравнили точность своей ESGAN с существующими протоколами обучения ИИ. Они обнаружили, что ESGAN "сократила потребность в размеченных человеком данных на один-два порядка" по сравнению с "традиционными полностью контролируемыми подходами".
Новые результаты означают значительное сокращение усилий, необходимых для разработки и использования специально обученных моделей машинного обучения для определения времени цветения "в других местах, селекционных популяциях или видах". Этот подход открывает путь к решению аналогичных задач в других областях биологии и цифрового сельского хозяйства.
Лики и Варела продолжат работу с селекционером мискантуса Эриком Саксом, применяя новый метод к данным многолетних межгосударственных испытаний. Цель испытаний — вывести регионально адаптированные линии мискантуса, которые можно использовать в качестве сырья для производства биотоплива и высокоценных биопродуктов на землях, не приносящих в настоящее время прибыли.
"Мы надеемся, что наш новый подход могут использовать другие, чтобы облегчить внедрение инструментов ИИ для улучшения сельскохозяйственных культур с более широким спектром признаков и видов, тем самым способствуя укреплению биоэкономики в целом", — заключил Лики.
