Первый черновик «древа жизни» для 2.3 миллионов видов

Выпущен первый черновик «древа жизни», охватывающего примерно 2.3 миллиона описанных видов животных, растений, грибов и микроорганизмов — от утконосов до дождевиков.

Этот проект, созданный совместными усилиями одиннадцати институтов, изображает родственные связи между живыми существами по мере их расхождения друг от друга во времени, прослеживая путь к началу жизни на Земле более 3.5 миллиардов лет назад.

Хотя за годы были опубликованы десятки тысяч небольших деревьев для отдельных ветвей древа жизни, это первый случай, когда эти результаты объединены в единое дерево, охватывающее всю жизнь. Результатом стал цифровой ресурс, доступный бесплатно в сети для использования и редактирования, подобно «Википедии» для эволюционных деревьев.

«Это первая реальная попытка соединить точки и собрать всё воедино», — заявила главный исследователь Карен Кранстон из Университета Дьюка. «Считайте это Версией 1.0».

Текущая версия дерева, вместе с исходными данными и кодом, доступна для просмотра и загрузки по адресу https://tree.opentreeoflife.org. Она также описана в статье, опубликованной 18 сентября в Proceedings of the National Academy of Sciences.

Понимание родственных связей миллионов видов помогает в открытии новых лекарств, увеличении урожайности и отслеживании происхождения инфекционных заболеваний, таких как ВИЧ, Эбола и грипп.

Исследователи собрали дерево, скомпилировав тысячи уже опубликованных в сети небольших фрагментов в гигантское «супердерево». Первый черновик основан на почти 500 небольших деревьях из предыдущих исследований.

Одной из самых больших проблем было сопоставление видов из разных источников из-за смены названий, альтернативных имён, опечаток и аббревиатур.

Пробелы и ограничения

  • Только одна из шести филогенетических работ, опубликованных в период с 2000 по 2012 год, предоставила данные в цифровом, пригодном для использования формате. Большинство деревьев опубликованы как PDF или изображения, которые невозможно добавить в базу данных.
  • В результате, некоторые части дерева (например, ветви, представляющие семейства бобовых и сложноцветных) не всегда согласуются с мнением экспертов.
  • Другие области, особенно насекомые и микробы, остаются малоизученными. Даже крупнейшие архивы генетических последовательностей содержат данные ДНК менее чем для 5% из десятков миллионов видов, предположительно существующих на Земле.

«Эта первая версия древа жизни важна не только тем, что показывает, что мы знаем о родственных связях, но и тем, что выявляет, чего мы не знаем», — отметил соавтор Дуглас Солтис из Университета Флориды.

Чтобы заполнить пробелы, команда разрабатывает программное обеспечение, позволяющее исследователям обновлять и пересматривать дерево по мере поступления новых данных.

«Оно ни в коем случае не завершено», — сказала Кранстон. «Крайне важно делиться данными, если мы хотим улучшить дерево».

«Открытое древо жизни — это важная отправная точка, которую другие исследователи смогут уточнять и улучшать в течение десятилетий», — заключил Солтис.

2015-09-19