Новый метод выявил сильное влияние вариаций числа копий генов на геном и здоровье человека

Вариации числа копий (CNV) — это участки генома, которые дублируются или удалены у некоторых людей. Это распространенный тип мутаций, инактивирующих гены. В человеческом геноме сотни тысяч CNV, но стандартные методы геномного анализа обнаруживают только самые крупные, и ученые не уверены в функции большинства из них.

Команда исследователей из Broad Institute MIT и Гарварда, Женской больницы Бригама и Гарвардской медицинской школы разработала вычислительный метод, который обнаружил 15 миллионов CNV в UK Biobank — в шесть раз больше, чем предыдущие анализы тех же данных. Ученые использовали метод, чтобы выявить сотни биологических связей между этими CNV и десятками человеческих признаков, обнаружив новые связи между конкретными генами и такими признаками, как рост, показатели крови и биомаркеры здоровья.

Результаты, опубликованные в Cell, представляют собой наиболее полный на сегодняшний день анализ связей между CNV и признаками. Метод предлагает новый способ обнаружения и изучения эффектов более крупных структурных вариантов, таких как CNV, которые сложным образом влияют на геном.

Обнаружение вариаций числа копий

Многие биобанки содержат данные об однонуклеотидных полиморфизмах (SNP) в больших популяциях. Хотя SNP очень распространены, они обычно оказывают незначительное влияние на признак. С другой стороны, CNV (длиной от 50 до миллионов пар оснований) инактивируют некоторые гены и могут вызывать более значительные изменения в геноме, например, увеличивая число копий гена. Команда По-Ру Ло стремилась улучшить обнаружение этих структурных изменений из существующих массивов данных SNP.

Исследователи создали алгоритм, который группировал данные интенсивности сигнала SNP-зондов UK Biobank от индивидов, отдаленно родственных друг другу на основе общего гаплотипа. Это снизило уровень шума в данных и позволило обнаружить в шесть раз больше CNV, чем предыдущие методы. Обнаруженные CNV составили половину всех инактиваций генов, ранее приписываемых структурным изменениям в геноме.

Затем команда искала ассоциации между CNV и 56 признаками. Они идентифицировали более 250 ассоциаций, затрагивающих почти 100 локусов (участков генома), которые, вероятно, были прямым результатом CNV. Многие выявили новые связи между конкретными генами и признаками. Например, люди с очень редкими CNV, инактивирующими ген UHRF2, были в среднем примерно на семь сантиметров ниже, чем те, у кого их не было.

Скрытые секреты

Ученые применили свою модель к данным BioBank Japan и подтвердили многие из тех же тенденций. Метод должен быть применим для проведения аналогичного анализа в других группах предков, что может выявить совершенно иные генетические ассоциации.

Подавляющее большинство CNV еще предстоит обнаружить, даже в UK Biobank. Поскольку крупные биобанки в основном генерируют данные SNP с помощью массивов, которые исследуют только определенные участки генома, они пропускают большинство CNV. Метод адаптируют для работы с данными полного экзомного секвенирования, которое исследует все белок-кодирующие области генома. Его также можно будет применить к данным полного геномного секвенирования для обнаружения CNV во всем геноме.

Работа представляет собой как методологию, полезную и адаптируемую к другим источникам данных, так и мотивацию для дальнейшего изучения того, как структурные вариации формируют человеческие признаки.

2022-10-28