Учёные впервые полностью собрали X-хромосому человека

Хотя текущий референсный геном человека — самый точный и полный из когда-либо созданных для позвоночных, в последовательности ДНК всё ещё остаются пробелы даже после двух десятилетий улучшений. Теперь учёные впервые определили полную последовательность человеческой хромосомы от одного конца до другого («от теломеры до теломеры») без пробелов и с беспрецедентной точностью.

Публикация сборки X-хромосомы человека от теломеры до теломеры 14 июля в Nature — это знаковое достижение для исследователей в области геномики. Ведущий автор Карен Мига, научный сотрудник Института геномики Калифорнийского университета в Санта-Крузе, заявила, что проект стал возможен благодаря новым технологиям секвенирования, обеспечивающим «ультрадлинные прочтения», таким как технология нанопорового секвенирования, разработанная в UC Santa Cruz.

Повторяющиеся последовательности ДНК распространены по всему геному и всегда создавали проблему для секвенирования, поскольку большинство технологий дают относительно короткие «прочтения» последовательности, которые затем нужно собрать воедино, как пазл. Повторяющиеся последовательности дают множество коротких прочтений, которые выглядят почти идентично, что затрудняет их сборку.

«Эти богатые повторами последовательности раньше считались непреодолимыми, но теперь мы совершили гигантский скачок в технологиях секвенирования», — сказала Мига. «С помощью нанопорового секвенирования мы получаем ультрадлинные прочтения в сотни тысяч пар оснований, которые могут охватить целую повторяющуюся область, что обходит некоторые проблемы».

Заполнение оставшихся пробелов в последовательности генома человека открывает новые области, где исследователи могут искать связи между вариациями последовательности и заболеваниями, а также другие ключи к важным вопросам биологии и эволюции человека.

«Мы начинаем обнаруживать, что некоторые из этих областей, где в референсной последовательности были пробелы, на самом деле являются одними из самых богатых вариациями в человеческих популяциях. Таким образом, мы упускали много информации, которая может быть важна для понимания биологии человека и болезней», — отметила Мига.

Мига и Адам Филиппи из Национального исследовательского института генома человека (NHGRI), оба — ответственные авторы новой статьи, стали соучредителями консорциума Telomere-to-Telomere (T2T) для достижения полной сборки генома после совместной работы над статьёй 2018 года, продемонстрировавшей потенциал нанопоровой технологии для получения полной последовательности генома человека. Этот проект использовал секвенатор Oxford Nanopore Technologies MinION, который определяет последовательность ДНК, обнаруживая изменение тока при прохождении отдельных молекул ДНК через крошечное отверстие («нанопору») в мембране.

Новый проект развил эти усилия, объединив нанопоровое секвенирование с другими технологиями от PacBio и Illumina, а также оптическими картами от BioNano Genomics. Используя эти технологии, команда создала сборку полного генома, которая превосходит все предыдущие сборки человеческого генома по непрерывности, полноте и точности, даже превзойдя по некоторым показателям текущий референсный геном человека.

Тем не менее, в последовательности всё ещё оставалось несколько разрывов. Чтобы завершить сборку X-хромосомы, команде пришлось вручную разрешить несколько пробелов. Две сегментарные дупликации были разрешены с помощью ультрадлинных нанопоровых прочтений, которые полностью охватывали повторы и были однозначно закреплены с обеих сторон. Оставшийся разрыв находился в центромере — печально известной сложной области повторяющейся ДНК, присутствующей в каждой хромосоме.

В X-хромосоме центромера охватывает область высокоповторяющейся ДНК протяжённостью 3,1 миллиона пар оснований. Команда смогла идентифицировать варианты внутри повторяющейся последовательности, чтобы использовать их в качестве маркеров, которые затем были применены для выравнивания длинных прочтений и соединения их для охвата всей центромеры.

«Для меня идея, что мы можем собрать тандемный повтор размером в 3 мегабазы, просто потрясающая. Теперь мы можем достичь этих повторяющихся регионов, охватывающих миллионы оснований, которые ранее считались недоступными», — сказала Мига.

Следующим шагом стала стратегия «полировки» с использованием данных нескольких технологий секвенирования для обеспечения точности каждого основания в последовательности.

«Мы использовали итеративный процесс с тремя различными платформами секвенирования, чтобы отполировать последовательность и достичь высокого уровня точности», — пояснила Мига. «Уникальные маркеры обеспечивают систему закрепления для ультрадлинных прочтений, и как только вы закрепите прочтения, вы можете использовать несколько наборов данных для определения каждого основания».

Нанопоровое секвенирование, помимо предоставления ультрадлинных прочтений, также может обнаруживать основания, модифицированные метилированием — «эпигенетическим» изменением, которое не меняет последовательность, но влияет на структуру ДНК и экспрессию генов. Составив карту паттернов метилирования на X-хромосоме, команда смогла подтвердить предыдущие наблюдения и выявить некоторые интригующие тенденции в паттернах метилирования внутри центромеры.

Новая последовательность генома человека, полученная из человеческой клеточной линии CHM13, закрывает многие пробелы в текущем референсном геноме, известном как сборка 38 Консорциума по референсному геному (GRCh38).

Консорциум T2T продолжает работать над завершением сборки всех хромосом CHM13. «Это открытый консорциум, поэтому во многих отношениях это проект, движимый сообществом, с большим количеством людей, посвящающих ему своё время и ресурсы», — сказала Мига.

2020-07-14