Учёные создали крупнейшее в истории генеалогическое древо человечества

Исследователи из Института больших данных Оксфордского университета сделали крупный шаг к полному картированию генетических связей между людьми, создав единую генеалогию, которая прослеживает происхождение всех нас. Исследование опубликовано в журнале Science.

За последние два десятилетия были достигнуты выдающиеся успехи в области генетики человека, в результате чего были получены геномные данные сотен тысяч людей, включая тысячи доисторических индивидов. Это открывает возможность проследить истоки человеческого генетического разнообразия и создать полную карту родственных связей между людьми по всему миру.

До сих пор основными проблемами были необходимость объединения последовательностей геномов из множества разных баз данных и разработка алгоритмов для обработки такого объёма информации. Новый метод, представленный исследователями, позволяет легко комбинировать данные из разных источников и масштабироваться для обработки миллионов геномных последовательностей.

Доктор Ян Вонг, эволюционный генетик и один из основных авторов, пояснил: «Мы, по сути, построили огромное семейное древо, генеалогию всего человечества, которая максимально точно моделирует историю, породившую всё генетическое разнообразие, которое мы находим у людей сегодня. Эта генеалогия позволяет нам увидеть, как генетическая последовательность каждого человека связана с последовательностью любого другого во всех точках генома».

Поскольку отдельные участки генома наследуются только от одного родителя, матери или отца, происхождение каждой точки генома можно представить в виде дерева. Набор таких деревьев, известный как «последовательность деревьев» или «граф рекомбинации предков», связывает генетические регионы через время с предками, у которых впервые появился генетический вариант.

Ведущий автор доктор Энтони Уайлдер Вонс, проводивший исследование в рамках своей докторской диссертации, сказал: «По сути, мы реконструируем геномы наших предков и используем их для формирования обширной сети взаимоотношений. Затем мы можем оценить, когда и где жили эти предки. Сила нашего подхода в том, что он делает очень мало предположений об исходных данных и может включать как современные, так и древние образцы ДНК».

В исследование были интегрированы данные о современных и древних геномах человека из восьми различных баз данных, включая в общей сложности 3609 индивидуальных геномных последовательностей из 215 популяций. Древние геномы включали образцы со всего мира возрастом от нескольких тысяч до более 100 000 лет. Алгоритмы предсказали, где в эволюционных деревьях должны присутствовать общие предки, чтобы объяснить наблюдаемые паттерны генетической вариации. Получившаяся сеть содержала почти 27 миллионов предков.

Добавив данные о местоположении этих образцов, авторы использовали сеть для оценки места проживания предсказанных общих предков. Результаты успешно воспроизвели ключевые события в истории эволюции человека, включая миграцию из Африки.

Хотя генеалогическая карта уже является чрезвычайно богатым ресурсом, исследовательская группа планирует сделать её ещё более полной, продолжая добавлять генетические данные по мере их появления. Поскольку последовательности деревьев хранят данные очень эффективно, набор данных может легко вместить миллионы дополнительных геномов.

Доктор Вонг отметил: «Это исследование закладывает основу для следующего поколения секвенирования ДНК. По мере улучшения качества геномных последовательностей из современных и древних образцов ДНК деревья станут ещё точнее, и в конечном итоге мы сможем создать единую унифицированную карту, объясняющую происхождение всего генетического разнообразия человека, которое мы наблюдаем сегодня».

Доктор Вонс добавил: «Хотя в центре этого исследования — человек, метод применим к большинству живых существ: от орангутанов до бактерий. Это может быть особенно полезно в медицинской генетике для отделения истинных ассоциаций между генетическими регионами и заболеваниями от ложных связей, возникающих из-за нашей общей истории предков».

2022-02-24