Ученые на пути к секвенированию 1 миллиона человеческих геномов для раскрытия генетических секретов

Первый черновик генома человека, опубликованный 20 лет назад (2001 г.), потребовал почти три года и стоил от 500 млн до 1 млрд долларов США. Проект "Геном человека" позволил ученым прочитать почти от начала до конца 3 миллиарда пар оснований ДНК, которые биологически определяют человека.

Этот проект позволил новому поколению исследователей идентифицировать новые мишени для лечения рака, создавать мышей с человеческой иммунной системой и даже строить веб-страницы для навигации по геному.

Первый полный геном был создан из образцов нескольких анонимных доноров, чтобы получить референсный геном, представляющий не одного человека. Но он далеко не охватывал всё разнообразие человеческих популяций. Если исследователи хотят понять человечество во всем его разнообразии, потребуется секвенировать тысячи или миллионы полных геномов. Такой проект уже начат.

Понимание генетического разнообразия

Генетические изменения вызывают многие расстройства и делают некоторые группы людей более восприимчивыми к определенным заболеваниям.

Огромные усилия по созданию первых геномов привели к революции в технологиях их чтения. Вместо многих лет и сотен миллионов долларов полное секвенирование человеческого генома теперь занимает несколько дней и стоит около тысячи долларов. Это отличается от генотипирования (например, 23andMe или Ancestry), которое изучает лишь крошечную часть генома.

Ученые уже секвенировали полные геномы тысяч людей по всему миру. Инициативы, такие как Genome Aggregation Consortia, собирают и систематизируют эти разрозненные данные. На сегодня группа собрала почти 150 000 геномов, демонстрирующих огромное генетическое разнообразие. В этом наборе обнаружено более 241 миллиона различий в геномах людей, в среднем один вариант на каждые восемь пар оснований.

Большинство этих вариантов очень редки и не влияют на человека. Однако среди них скрыты варианты с важными физиологическими и медицинскими последствиями. Например, определенные варианты гена BRCA1 предрасполагают некоторых женщин (например, ашкеназских евреек) к раку яичников и молочной железы. Другие варианты этого гена приводят к более высокой смертности от рака молочной железы среди некоторых нигерийских женщин.

Лучший способ выявить такие варианты на уровне популяции — полногеномные ассоциативные исследования (GWAS), сравнивающие геномы больших групп людей с контрольной группой. Но болезни сложны. Влияние генетики на многие заболевания трудно выделить. Предсказательная сила современных геномных исследований слишком мала, потому что недостаточно геномных данных. Понимание генетики сложных заболеваний — это проблема больших данных.

1 000 000 геномов

Для решения проблемы нехватки данных Национальные институты здравоохранения (NIH) запустили программу All of Us. Проект направлен на сбор генетической информации, медицинских карт и данных о здоровье (опросы, носимые устройства) от более миллиона человек в США в течение 10 лет. Он также ставит цель собрать больше данных от недостаточно представленных меньшинств для изучения различий в состоянии здоровья.

Проект All of Us открыл набор для публики в 2018 году, и с тех пор образцы предоставили более 270 000 человек. Набор участников продолжается во всех 50 штатах. В проекте участвуют многие академические лаборатории и частные компании.

Этот массив данных может помочь ученым из разных областей. Например, нейробиолог может искать генетические варианты, связанные с депрессией, с учетом уровня физической активности. Онколог может искать варианты, коррелирующие со сниженным риском рака кожи, с учетом этнического происхождения.

Миллион геномов с сопутствующей медицинской и lifestyle-информацией предоставит огромный массив данных. Это позволит исследователям обнаружить влияние генетических вариаций на заболевания не только у отдельных людей, но и внутри разных групп.

"Темная материя" человеческого генома

Еще одно преимущество проекта — возможность изучить части человеческого генома, которые сейчас трудно исследовать. Большинство генетических исследований сосредоточено на частях генома, кодирующих белки. Однако они составляют лишь 1,5% человеческого генома.

Автор исследования фокусируется на РНК — молекуле, которая превращает сообщения ДНК в белки. Однако РНК, происходящие из 98,5% генома, не кодирующих белки, сами по себе имеют множество функций. Некоторые из этих некодирующих РНК участвуют в распространении рака, эмбриональном развитии или контроле X-хромосомы у женщин. В частности, автор изучает, как генетические вариации могут влиять на сложную укладку некодирующих РНК, позволяющую им выполнять свои функции.

Поскольку проект All of Us включает все кодирующие и некодирующие части генома, он станет крупнейшим набором данных, имеющим отношение к этой работе, и, надеюсь, прольет свет на эти загадочные РНК.

Первый геном человека дал старт 20 годам невероятного научного прогресса. Огромный набор данных о геномных вариациях, вероятно, откроет ключи к разгадке сложных заболеваний. Благодаря масштабным популяционным исследованиям и проектам больших данных, таким как All of Us, исследователи прокладывают путь к ответу в следующем десятилетии на вопрос, как наша индивидуальная генетика формирует наше здоровье.

2021-04-16