Расшифрован огромный геном сосны ладанной

Геном сосны ладанной (Pinus taeda) — самого коммерчески важного вида деревьев в США и источника большинства американских бумажных продуктов — был секвенирован общенациональной исследовательской группой под руководством учёного из Калифорнийского университета в Дэвисе.

Черновой вариант генома, примерно в семь раз больше человеческого, является крупнейшим из когда-либо секвенированных и наиболее полной последовательностью генома хвойного дерева. Секвенирование стало возможным благодаря использованию нового, более быстрого и эффективного аналитического процесса. Результаты описаны в двух статьях в мартовском выпуске журнала Genetics за 2014 год и в одной статье в журнале открытого доступа Genome Biology.

Последовательность генома поможет в селекции улучшенных сортов сосны ладанной, которая также рассматривается как сырьё для биотоплива. Новые данные также позволят лучше понять эволюцию и разнообразие растений.

"Это огромный геном. Но проблема не только в сборе всех данных последовательности. Проблема в сборке этой последовательности в правильном порядке", — сказал Дэвид Нил, профессор наук о растениях в Калифорнийском университете в Дэвисе, руководивший проектом.

Чтобы справиться с огромным размером генома, который долгое время был препятствием для секвенирования, исследователи использовали новый метод, ускоряющий сборку генома путём сжатия исходных данных последовательности в 100 раз.

Современные методы секвенирования относительно легко читают отдельные "буквы" ДНК, но только в коротких фрагментах. В случае сосны ладанной 16 миллиардов отдельных фрагментов нужно было собрать воедино — вычислительную головоломку, называемую сборкой генома.

"Мы смогли собрать человеческий геном, но это было близко к пределу наших возможностей; в семь раз больше — это было слишком", — отметил Стивен Сальцберг из Университета Джонса Хопкинса.

Ключом к решению стал новый метод, разработанный в Университете Мэриленда, который предварительно обрабатывает данные последовательности, устраняет избыточность и даёт в 100 раз меньше данных. Этот подход, впервые опробованный в данном исследовании, позволил собрать гораздо более полную последовательность генома, чем черновые сборки двух других видов хвойных, опубликованные годом ранее.

"Размеры собранных нами последовательных фрагментов на порядки больше, чем всё, что публиковалось ранее", — сказал Дэвид Нил, отметив, что геном сосны ладанной теперь служит высококачественным "референсным" геномом, значительно ускоряющим будущие проекты по геномике хвойных.

Исследование проводилось в режиме открытого доступа, и данные были свободно доступны на протяжении всего проекта, начиная с июня 2012 года.

Секвенирование подтвердило, что 82% генома сосны ладанной состоит из инвазивных элементов ДНК и других фрагментов, которые копировали себя по всему геному. Также были обнаружены гены, возможно, участвующие в защите от патогенов, что поможет понять устойчивость сосен к болезням.

Например, исследователи из Института лесной генетики Лесной службы США идентифицировали важный кандидатный ген устойчивости к пузырчатой ржавчине — самой разрушительной болезни южных сосен.

"Картирование генов устойчивости к пузырчатой ржавчине, проведённое нашими учёными, предоставляет ценную информацию для лесоводов, поскольку более 500 миллионов сеянцев сосны ладанной с этими генами устойчивости высаживаются каждый год", — сказала Дана Нельсон, руководитель проекта в институте.

Проект по секвенированию генома сосны ладанной возглавляла команда из Калифорнийского университета в Дэвисе, а этапы сборки — Университет Джонса Хопкинса и Университет Мэриленда.

2014-03-20