Новый инструмент для анализа генетического разнообразия ускорит селекцию сельскохозяйственных культур
Исследователи создали новый вычислительный инструмент, который быстро и эффективно выявляет генетическое разнообразие в базах данных ДНК различных видов растений.
Этот инструмент с открытым исходным кодом ускорит поиск генетических вариаций, ключевых для создания культур с улучшенной устойчивостью, урожайностью и питательной ценностью.
Команда KAUST под руководством геномика растений Рода Уинга, используя передовые алгоритмы и возможности высокопроизводительных вычислений (HPC), продемонстрировала способность инструмента обнаруживать небольшие различия в ДНК — однонуклеотидные полиморфизмы (SNPs) — у различных линий риса, кукурузы, сои и сорго.
На примере риса команда применила инструмент к сложному генетическому набору данных — последовательностям ДНК тысяч различных образцов (accessions). Этот комплексный "пан-геном" для азиатского риса (Oryza sativa) был собран исследователями ранее.
Используя этот набор данных и новый аналитический метод, учёные обнаружили более 2 миллионов генетических вариантов, которые ранее упускались при стандартном анализе с использованием одного референсного генома риса.
Это первый шаг к открытию новых путей улучшения сельскохозяйственных культур и устойчивого земледелия, отмечает соавтор исследования, генетик растений Юн Чжоу. По его словам, эти скрытые SNPs теперь можно немедленно использовать в селекционных программах, а также для идентификации новых функциональных генов, отвечающих за хозяйственно-ценные признаки.
Такой поиск SNPs также помогает выявить генетические и эволюционные связи между различными линиями риса. Ранее Уинг и Чжоу возглавили создание высококачественного референсного генома для красного риса Хассави — культуры, произрастающей в Саудовской Аравии и известной своей устойчивостью к местной засухе и высокому засолению.
С помощью нового инструмента исследователи смогли установить генетическую связь между рисом Хассави и подгруппой риса, включающей сорта из Австралии, Индии и некоторых частей Юго-Восточной Азии.
Ключевая особенность инструмента, названного HPC-GVCW (high-performance computing genome variant calling workflow), — способность разделять большие участки генома на отдельные фрагменты и использовать технологии параллельной обработки для решения сложных вычислительных задач с крупномасштабными многомерными геномными данными.
«Это колоссально сокращает время выполнения, — говорит соавтор работы, специалист по вычислительным наукам Нагараджан Катиресан, — позволяя обработать 3000 геномов в течение 24 часов».
По словам Юна Чжоу, в условиях беспрецедентного роста числа секвенируемых геномов новый инструмент окажется бесценным для оптимизации их анализа и ускорения селекции культур следующего поколения.
Исследование опубликовано в журнале BMC Biology.
