Повторы — ключ к пониманию генома человека
Человеческий референсный геном наконец заполнил все пробелы, и то, что мы упустили в первый раз, оказалось как повторяющимся, так и поучительным.
«Мы осознаём, что существует огромное человеческое разнообразие», — говорит генетик Рэйчел О'Нилл, директор Института системной геномики UConn. И, вопреки интуиции, это разнообразие во многом происходит из повторов.
Оказалось, что значительная часть генетического материала человека состоит из длинных повторяющихся участков, которые встречаются снова и снова. Хотя у каждого человека есть повторы, их количество у разных людей различается. Именно в разнице в числе повторов и заключается большая часть генетического разнообразия человека.
Это понимание — что повторы важны — является одним из многих значимых открытий проекта Telomere-2-Telomere (T2T), глобальной коллаборации институтов, заполнившей пробелы в первоначальной сборке генома человека. О'Нилл — главный исследователь этого проекта и соавтор четырёх из шести статей T2T, опубликованных в Science 31 марта.
«Потребовалось изобретение новых методов секвенирования ДНК и вычислительного анализа, а также самоотверженность выдающейся команды учёных, чтобы дочитать 8% генома человека, которые 20 лет назад были слишком сложны и повторяющи по структуре, чтобы их можно было разрешить. Ожидание того стоило — открылось богатое множество удивительных архитектурных особенностей с серьёзными последствиями для понимания эволюции, вариативности и биологической функции человека», — говорит Фрэнсис Коллинз, советник Белого дома по науке и бывший директор Национальных институтов здравоохранения (NIH).
Первоначальный проект «Геном человека», как бы удивителен он ни был в своё время, оставил незаполненными около 8% генома.
«Это эквивалентно целой хромосоме в ДНК человека», — говорит О'Нилл. Эти последние 8% включают множество генов и повторяющиеся области. Большинство вновь добавленных последовательностей ДНК находились рядом с повторяющимися теломерами (длинными концевыми участками каждой хромосомы) и центромерами (плотными средними участками каждой хромосомы).
Пробелы были результатом технологии «короткого чтения» (short-read), которую использовал проект «Геном человека». Это была единственная доступная 20 лет назад технология для картирования генома, и она могла считывать лишь эквивалент нескольких «слов» генетического кода за раз. Например, представьте, что участок генома состоит из предложения «All work and no play makes Jack a dull boy», повторённого девять раз подряд. Технология короткого чтения показывала бы только фрагменты, такие как «All work», «Jack a», «makes Jack» и т.д. Исследователи собирали эти короткие секции вместе, чтобы получить предложение «All work and no play makes Jack a dull boy», но у них не было возможности узнать, что оно повторяется девять раз.
Однако у проекта T2T были лучшие инструменты. Новая технология «длинного чтения» (long-read) ДНК может считывать целые предложения и даже абзацы за раз. Поэтому исследователи смогли увидеть большие блоки или даже целые секции повторов.
«Создание по-настоящему непрерывной последовательности генома человека — это важная веха. Мы бы с радостью сделали это 20 лет назад, но технологии должны были развиться. Этот новый референс — действительно прочный фундамент без трещин для понимания биологии человека. Больше нет недостающих частей!» — говорит Боб Уотерстон, биолог из Вашингтонского университета, работавший над оригинальным проектом «Геном человека».
Многие начинающие исследователи и стажёры сыграли ключевую роль в проекте T2T. В UConn в работе были глубоко вовлечены Саванна Хойт, Габриэль Хартли и Патрик Грейди из лаборатории Рэйчел О'Нилл, а также Люк Войенски из лаборатории Лейтона Кора. Одним из их основных вкладов стало создание компендиума повторов в геноме. Они обнаружили, что повторяющиеся участки содержат мобильные элементы (способные перескакивать из одной части генома в другую, классический пример — «прыгающие гены», меняющие цвет зёрен кукурузы), вирусы и новые повторы, которые никто ранее не идентифицировал, включая некоторые, несущие гены. Некоторые гигантские повторы с 10, 20 или 30 копиями, идущими подряд, содержат гены, которые могут объяснять большую часть человеческого разнообразия. В примере с предложением выше представьте, что «Jack» — это ген. У одного человека может быть 5 его копий. У другого — 25.
Команда T2T впервые увидела полные последовательности центральных частей каждой человеческой хромосомы. Называемые центромерами, они соединяют разные плечи каждой X-образной хромосомы. Команда О'Нилл обнаружила, что центромеры содержат как известные мобильные элементы, так и новые повторы. Большая часть ДНК в центромере, по-видимому, важна для сохранения генетической информации клетки через поколения. Уже известно, что центромеры играют роль в репликации ДНК при размножении клеток, и если они значительно смещают своё положение в хромосоме, это может привести к возникновению совершенно новых видов. Полные, непрерывные последовательности центромер, построенные проектом T2T, позволят гораздо более детально понять человеческие центромеры и их функции.
«Следующая фаза исследований будет секвенировать геномы многих разных людей, чтобы полностью понять человеческое разнообразие, болезни и наши отношения с нашими ближайшими родственниками — другими приматами», — говорит О'Нилл.
