Новый китайский геном сои поможет улучшить элитные сорта

Соя (Glycine max [L.] Merr.) — одна из важнейших сельскохозяйственных культур, обеспечивающая более половины мирового производства масличных семян и более четверти мирового белка для питания людей и животных. Культурная соя была одомашнена в Китае около 5000 лет назад, а затем распространилась по всему миру. В процессе интродукции и распространения соя прошла через строгие генетические «бутылочные горлышки», что привело к высокой генетической изменчивости между образцами из разных географических регионов. Текущий референсный геном сои был секвенирован с американского сорта Williams 82. Азия — один из крупнейших регионов выращивания и потребления сои, и её производство здесь критически важно для глобальной продовольственной безопасности. Высококачественный референсный геном необходим для функционального анализа вида. Поэтому важно собрать новый высококачественный геном сои из азиатских образцов для развития функциональной геномики и улучшения элитных сортов в Азии.

Учёные из Института генетики и биологии развития Китайской академии наук, Научно-технического университета Китая, Цзянсуской академии сельскохозяйственных наук и компании Berry Genomics собрали новый геном сои из китайского образца «Чжунхуан 13» (Zhonghuang 13), комбинируя данные SMRT, Hi-C и оптического картирования.

«Наш собранный геном имеет размер 1,025 Гб. Его contig N50 составляет 3,46 Мб, а scaffold N50 — 51,87 Мб. Насколько нам известно, это четвёртый по контигуозности растительный геном из когда-либо опубликованных», — заявила старший автор работы доктор Яньтин Шэнь (Yanting Shen). По сравнению с предыдущим широко используемым референсным геномом сои, качество нового генома значительно улучшилось: он имеет большую общую длину последовательности, более высокие показатели contig N50 и scaffold N50 и меньше пробелов (gaps). Кроме того, после тщательного сравнения геномных последовательностей Чжунхуан 13 и Williams 82 исследовательская группа обнаружила, что между ними существует большое количество генетических вариаций. «Мы идентифицировали более 250 000 событий структурных вариаций, включая 1404 транслокации, 161 инверсию, 1233 комбинации транслокации и инверсии, 505 506 инделов (1–99 п.н.) и 17 409 специфичных для образца вставок (≥100 п.н.)», — сообщила Яньтин.

«Эта работа — результат отличного сотрудничества учёных из разных областей. Например, чтобы сделать новую аннотацию генома более точной и информативной, мы обратились за помощью к эксперту по изучению транспозонных элементов доктору Цзяньчану Ду (Jianchang Du)», — сказал автор-корреспондент доктор Чжиси Тянь (Zhixi Tian), учёный, занимающийся функциональной геномикой сои. В результате комплексного анализа в новом геноме было аннотировано в общей сложности 36 429 транспозонных элементов и 52 051 белок-кодирующий ген. «QTL- и GWAS-анализ — полезные подходы для исследования локусов, контролирующих признаки. Однако напрямую выявить причинный ген по их результатам сложно, так как они обычно указывают на большие кандидатные регионы. Сеть коэкспрессии генов — мощный инструмент для изучения регуляторных взаимодействий и предсказания функции генов. Мы предположили, что такая сеть может помочь в поиске важных агрономических генов в сочетании с QTL и GWAS. Поэтому мы обратились за помощью к эксперту по сетям коэкспрессии генов из Научно-технического университета Китая доктору Шисону Ма (Shisong Ma)», — пояснил Чжиси.

«Чтобы проверить эту гипотезу, мы построили комплексную сеть коэкспрессии для аннотированных генов, используя транскриптомные наборы данных из 1978 RNA-seq экспериментов с соей, депонированных в архиве SRA базы данных NCBI. Эта сеть содержит 39 967 генов и 330 864 пары коэкспрессируемых генов», — сообщил соавтор и один из авторов-корреспондентов доктор Шисон Ма. Полезность сети коэкспрессии была протестирована на поиске новых генов, связанных со временем цветения сои и содержанием линолевой кислоты. «Наша сеть коэкспрессии сократила количество кандидатных генов времени цветения сои с 7971 до 26, что доказало её эффективность для поиска кандидатных генов», — сказала Яньтин. — Более того, мы подтвердили функцию одного из кандидатных генов, SoyZH13_16G177400, сопоставив информацию о его гаплотипе и фенотипе в ранее секвенированной нами естественной популяции». Помимо гена, связанного со временем цветения, тем же стратегическим подходом был подтверждён и ген, контролирующий содержание линолевой кислоты в сое.

Доктор Баогэ Чжу (Baoge Zhu), биолог с более чем 20-летним опытом работы в селекции сои из Института генетики и биологии развития Китайской академии наук, прокомментировал: «Этот метод очень нов и полезен для исследователей и селекционеров сои. Мы можем использовать его для эффективного отбора кандидатных генов, важных для агрономических признаков».

Все авторы надеются, что этот новый геном будет способствовать исследованиям в области геномики бобовых и улучшению сортов сои в будущем.

2018-08-03