Новый референсный геном человека открывает неисследованные регионы
Международный консорциум ученых наконец опубликовал полную последовательность генома человека. Новый референсный геном заполняет многие пробелы, оставленные предыдущими черновиками, особенно в центромерах в середине хромосом и крупных дупликациях.
Работа описана в серии статей, опубликованных 1 апреля в Science Консорциумом Telomere-to-Telomere (T2T). В исследования внесли вклад ученые из Калифорнийского университета в Дэвисе.
Оригинальная последовательность генома человека, опубликованная в 2001 году, пропускала около 8% ДНК. Эти области включали почти идентичные дупликации, содержащие функциональные гены, а также центромеры и теломеры. Они содержат длинные повторы последовательностей.
"Это важные регионы, но их сложно секвенировать", — сказала Меган Деннис.
Секвенирование генома похоже на разрезание книги на фрагменты текста с последующей попыткой восстановить книгу, собирая их вместе. Участки с большим количеством общих или повторяющихся слов и фраз сложнее правильно разместить.
Ранние технологии секвенирования ДНК могли считывать только относительно короткие последовательности.
"Основной прорыв в технологии — это секвенирование длинными ридами (long-read sequencing)", — отметила Деннис. Новые секвенаторы могут декодировать гораздо более длинные фрагменты — до миллиона пар оснований или "букв" ДНК. Это значительно упрощает сборку исходной последовательности.
"Это меняет правила игры", — сказала Деннис.
Новый референсный геном получен из одной человеческой выборки — клеточной линии, происходящей из пузырного заноса (гидатидиформной моле). ДНК произошла от сперматозоида человека европейского происхождения. В отличие от этого, исходный референсный геном человека был "сшит" из нескольких людей, что создавало ошибки и артефакты.
Исследование центромеры
Около 90% новой последовательности приходится именно на центромеры хромосом. Эти структурно обособленные регионы, содержащие длинные повторы ДНК, печально известны своей сложностью для изучения.
"Раньше мы говорили, что нужно предупреждать молодых генетиков не соваться в центромеру, потому что они никогда оттуда не выберутся", — сказал Чарльз Лэнгли.
Сейчас центромеры — горячая тема в биологии. Здесь прикрепляется аппарат, разделяющий парные хромосомы во время мейоза — фундаментальный шаг в наследовании. Они содержат большое количество гетерохроматина — областей, где ДНК и белки кажутся более конденсированными.
Современные представления предполагают, что гетерохроматин играет важную роль в регуляции генов, смещая части ДНК в другую фазу, подобно каплям масла в воде, создавая в ядре компартменты, где конкретные гены могут быть включены или выключены.
Другая загадка центромер — как и почему они consistently формируются в одном и том же месте, несмотря на отсутствие специфического генетического кода для этого. Их положение определяется эпигенетически. По сути, ваши центромеры находятся там, где они были в сперматозоиде и яйцеклетке, из которых вы произошли.
Сравнение последовательностей центромер нового референсного генома с другими опубликованными данными предоставило доказательства, что человеческие центромеры на самом деле могут немного перемещаться, что ранее находили у других видов животных.
"Теперь мы сможем лучше понять, как это происходит", — сказал Лэнгли.
Применение
Наличие исходной последовательности генома человека было мощным инструментом для открытий в биомедицинских науках за последние 20 лет. Новый референс поможет исследователям лучше понять вариацию, особенно в тех областях, которые ранее были плохо охвачены или содержали ошибки.
"Он уже используется для повторного анализа геномов, собранных в рамках проекта 1000 Genomes Project, открывая и подтверждая тысячи новых вариантов", — сказала Деннис.
Эти новые, подтвержденные генетические варианты можно затем, например, ассоциировать с заболеваниями и клиническими исходами, используя данные секвенирования пациентов, например, с аутизмом.
Консорциум T2T включает 114 ученых из 33 институтов.
