Атлас регуляторных элементов генома: итоги 17-летнего проекта ENCODE

Международный консорциум ENCODE завершил масштабный 17-летний проект, создав детальный атлас человеческого генома. Он раскрывает расположение сотен тысяч потенциальных регуляторных областей в «тёмной материи» ДНК — ресурс, который поможет всем будущим исследованиям в биологии человека.

Из трёх миллиардов пар оснований в геноме человека только 2% кодируют белки. Остальные 98% содержат, среди прочего, потенциальные регуляторные регионы — последовательности, которые дают клеткам инструкции для превращения «рецептов» белков в невероятно сложный организм. Однако, несмотря на важность, некодирующие регионы изучены гораздо меньше, чем кодирующие гены.

Проект «Энциклопедия элементов ДНК» (ENCODE) был запущен Национальным институтом исследования генома человека с целью разработать инструменты для изучения загадочного большинства нашего генома. В своём завершающем году ENCODE добился огромных успехов благодаря совместным усилиям нескольких сотен исследователей из десятков институтов.

«Мы секвенировали человеческий геном и в основном знаем, где находятся гены. Но за пределами генов картирование функции геномной "тёмной материи" гораздо сложнее. Для нас большой шаг вперёд — знать, как найти функционально важные области в пределах этих 98%», — сказал Лен Пеннаккио, старший научный сотрудник Национальной лаборатории Лоуренса в Беркли (Berkeley Lab) и соавтор четырёх из 15 новых статей ENCODE, опубликованных на этой неделе в специальном выпуске Nature.

По словам Пеннаккио, недавние достижения проекта будут особенно полезны учёным, изучающим болезни. При поиске причин заболевания исследователи ищут генетические варианты у поражённых людей. Иногда такие варианты находят в генах, но часто анализ указывает на область, далёкую от любой кодирующей белок последовательности, и не сразу ясно, что делает эта ДНК. Важна ли она для сердца или желудка? Важна всегда или только на определённых этапах развития?

«Наши наборы данных дают учёным подсказки о том, когда и где функционирует эта последовательность, и на какой ген или гены она влияет. Это даёт немедленный путь для дальнейшего изучения, тогда как раньше у нас было мало зацепок».

2020-08-06