Новые технологии чтения длинных последовательностей ДНК улучшают понимание эволюции приматов и болезней человека

Геном западной равнинной гориллы был секвенирован и собран с высоким качеством, приближающимся к качеству геномов мыши и человека.

Новая технология секвенирования, основанная на длинных считываниях (long reads), впервые позволила обнаружить отсутствующие гены и ранее неизвестные формы генетической вариации. Эта сборка дает новые биологические данные о виде, который по эволюционной близости к человеку уступает только шимпанзе.

Как сообщается в выпуске журнала Science от 1 апреля, предыдущие сборки генома гориллы и других млекопитающих были фрагментированными, неполными и потенциально вводящими в заблуждение. Причина в том, что технологии массового параллельного секвенирования, хотя и увеличивают скорость и точность, а также снижают стоимость, обычно производят только короткие фрагменты последовательностей — «риды» (reads). Программы сборки генома пытаются восстановить исходный геном, используя перекрытия между ридами. Однако длинные повторы ДНК, обычные для геномов человека и других приматов, «сбивают с толку» программное обеспечение, заставляя его разбивать геном на очень мелкие фрагменты.

«Такие сборки могут быть похожи на швейцарский сыр, — сказал ведущий исследователь Эван Эйхлер, профессор наук о геноме Вашингтонского университета, — с большим количеством отсутствующей биологической информации в пробелах».

Оригинальный опубликованный геном западной равнинной гориллы, созданный с использованием технологии коротких ридов, был разбит на более 400 000 фрагментов.

Исследователи использовали технологию Single Molecule, Real-Time (SMRT) секвенирования, инструменты сборки Falcon и QUIVER для генерации длинных ридов. Их длина более чем в сто раз превышала длину ридов самых популярных технологий. Это позволило пройти через большинство повторов в геноме гориллы.

В результате была получена новая сборка генома гориллы, которая стала больше и состояла из гораздо меньшего числа фрагментов. Вместо 400 000 фрагментов теперь их всего 1 800. Средний размер фрагментов генома увеличился в 800 раз, при этом было закрыто примерно 90% всех пробелов из первоначальной сборки.

Эта дополнительная информация значительно улучшила аннотацию генов для этого вида горилл. Она также привела к открытию тысяч ранее пропущенных сегментов, кодирующих белки и пептиды, и новых регуляторных элементов.

Различия в регуляции генов или даже утрата определенных регуляторных элементов могут объяснять, почему предки человека эволюционировали так сильно по сравнению с другими человекообразными обезьянами.

Ученые также обнаружили десятки тысяч новых структурных вариантов (например, делеций или вставок ДНК), которые, вероятно, важнее, чем более мелкие различия в одну пару оснований, каталогизированные ранее.

«Моя мотивация в изучении геномов человека и человекообразных обезьян, — сказал Эйхлер, — попытаться понять, что заставляет нас "тикать" как вид. Я хотел бы увидеть повторное секвенирование всех геномов человекообразных обезьян... чтобы получить полное представление о генетических вариантах, которые отличают человека от них. Я считаю, что генетической вариации гораздо больше, чем мы думали ранее. Первый шаг — найти ее».

Среди областей, где исследователи увидели интригующие различия между людьми и гориллами, — гены, связанные с сенсорным восприятием, производством кератина, регуляцией инсулина, иммунитетом, репродукцией и клеточной сигнализацией.

Новая сборка генома также дает новые подсказки об эволюционной истории равнинной гориллы. Анализ показывает, что популяция горилл пережила в недавнем прошлом более серьезное «бутылочное горлышко» (резкое сокращение численности), чем считалось ранее.

Эйхлер подчеркивает, что эти достижения, вероятно, внесут большой вклад в исследование генетических основ болезней человека, особенно если больше человеческих геномов будет секвенировано таким способом.

«Как медицинские исследователи, если мы полагаемся только на короткие риды, в нашей броне есть брешь. Работа над геномами гориллы и человека ясно показывает, что большие пласты генетической вариации нельзя понять с помощью подходов с короткими ридами. Секвенирование длинными ридами позволяет нам получить доступ к новым уровням генетической вариации, которые ранее были недоступны».

Однако он отмечает, что при цене в $80 000 за геном эта технология еще не готова для клинического секвенирования геномов человека. Но, учитывая снижение стоимости и дальнейшее развитие технологии в ближайшие годы, он готов предположить, что именно так мы будем секвенировать человеческие геномы для обнаружения болезнетворных мутаций в будущем.

2016-03-31