Ученые разработали новый метод анализа генетической примеси популяций

Исследователи Международной лаборатории статистической и вычислительной геномики НИУ ВШЭ вместе с зарубежными коллегами предложили новый статистический метод анализа примеси популяций, который позволяет точнее определять время и количество волн миграции. История колумбийцев и мексиканцев (потомков коренных американцев, испанцев и африканцев) включает два эпизода смешения, произошедших примерно 350 и 200 лет назад для мексиканцев и 400 и 100 лет назад для колумбийцев. Результаты опубликованы в PLOS Genetics.

Историю смешения популяций можно раскрыть, анализируя связи между генетическими вариантами человека. Наш геном — это мозаика генетических фрагментов наших предков. Явление рекомбинации приводит к тому, что в каждом новом поколении участки разного происхождения всё больше перемешиваются, разрушая типичные генетические последовательности.

Таким образом, вычисляя корреляцию между генетическими вариантами на разных частях хромосом и анализируя силу их связей, можно определить, сколько поколений назад произошло смешение популяций.

Ранние методы анализа генетической примеси популяций могли оценить время последнего события смешения. Алгоритм был основан на анализе силы связи между парами генетических вариантов. Новый метод предлагает анализировать тройные варианты. Этот статистический метод позволяет моделировать более сложные сценарии смешения популяций, например, выявлять два эпизода примеси и определять, сколько поколений назад они произошли.

«Представьте, что корабли с европейскими поселенцами впервые высаживаются на берега Америки. Европейцы начинают осваивать новые территории и смешиваться с коренным населением Америки. Однако через несколько поколений в Америку прибывает больше кораблей с европейцами. Наш метод позволяет увидеть, что было две волны переселения, два эпизода примеси в разные временные периоды», — объясняет Михаил Шишкин, соавтор статьи.

В качестве примера авторы статьи проанализировали генетические образцы населения Колумбии и Мексики из генетической базы данных 1000 Genomes. Обе популяции появились в результате смешения коренных американцев, испанцев и африканцев. Результаты показали, что в истории обеих популяций было две волны смешения, которые произошли 13 и 8 поколений (350 и 200 лет) назад для мексиканцев и 15 и 4 поколения (400 и 100 лет) назад для колумбийцев.

«Наш метод требует больших объемов данных — если ранним алгоритмам требовались десятки образцов, то нам нужны сотни. И сегодня мы можем их получить. В нашем случае мы использовали генетическую базу данных проекта 1000 Genomes. За последние 10 лет возможности секвенирования генома и обработки данных значительно расширились, так что количество доступных образцов нас больше не ограничивает», — говорит Владимир Щур, заведующий Международной лабораторией статистической и вычислительной геномики НИУ ВШЭ.

2022-07-27