Учёные создали высококачественный графовый геном сои

Масло сои — одно из важнейших растительных масел в мире, а сама соя — ключевая белковая кормовая культура. Культурная соя была одомашнена из диких родственников в Китае примерно 5000 лет назад. В настоящее время выведено более 60 000 образцов, адаптированных к разным экорегионам. Обширное генетическое разнообразие среди образцов сои показало необходимость создания полного пан-генома.

Группа под руководством профессора Тянь Чжиси из Института генетики и биологии развития Китайской академии наук (CAS) совместно с другими командами и компанией Berry Genomics провела de novo сборку 26 геномов сои и создала высококачественный графовый пан-геном сои.

На основе филогенетического анализа 2898 образцов сои были отобраны 26 образцов, для каждого из которых выполнили de novo сборку генома. Контиг N50 в этих сборках варьировался от 18,8 до 26,8 млн пар оснований (в среднем 22,6 Мпн), а скаффолд N50 — от 50,3 до 52,3 Мпн (в среднем 51,2 Мпн).

Сравнительный анализ 26 новых и трёх ранее опубликованных геномов выявил:

  • 14 604 953 однонуклеотидных полиморфизма (SNP)
  • 12 716 823 малых инсерций и делеций
  • 723 862 вариации присутствия/отсутствия (PAV)
  • 27 531 вариацию числа копий (CNV)
  • 21 886 событий транслокации
  • 3 120 событий инверсии

Интегрировав эти структурные вариации, учёные построили графовый геном, используя геном сорта ZH13 в качестве стандартной линейной референсной последовательности.

Дальнейшее исследование показало, что эти структурные вариации играют важную роль в эволюции генома, вариациях структуры генов и функциональном расхождении генов, что, в свою очередь, влияет на вариации агрономических признаков в популяции сои.

Хотя референсный геном открывает путь к функциональной геномике и молекулярной селекции, одного или нескольких референсных геномов недостаточно для отражения всего генетического разнообразия вида, что делает создание пан-генома необходимым. Кроме того, линейные референсы не могут показать генотипы разных аллелей в каждом локусе.

Это первый в мире графовый геном растения. Его можно использовать для повторного анализа данных повторного секвенирования, что даст более полную информацию и «оживит» эти данные, значительно облегчив функциональные исследования и селекцию. Анонимный рецензент назвал эту работу «знаковой статьей для геномики».

2020-06-17