Ученые стремятся собрать древо жизни для всех 2 миллионов описанных видов

Новая инициатива нацелена на создание грандиозного древа жизни, объединяющего все научные знания о родственных связях всех живых существ — от мельчайших бактерий до самых высоких деревьев.

Ученые строят эволюционные деревья уже более 150 лет, с тех пор как Чарльз Дарвин сделал первые наброски в своей записной книжке. Однако, несмотря на значительный прогресс в детализации основных ветвей древа жизни, до сих пор нет централизованного ресурса, где исследователи могли бы просматривать и загружать полное древо.

«Где можно увидеть их коллективные результаты в одном ресурсе? Удивительно, но вы не можете — по крайней мере, пока нет», — говорит доктор Карен Крэнстон из Национального центра синтеза эволюции.

Теперь, благодаря трехлетнему гранту в $5.76 млн от Национального научного фонда США (NSF), команда ученых и разработчиков из десяти университетов намерена сделать это реальностью.

Понимание родственных связей миллионов видов на Земле важно не только для определения ближайших родственников трубкозуба или выяснения, ближе ли миксины к морским ежам или асцидиям. Информация об эволюционных связях помогла ученым в поиске перспективных новых лекарств, выведении более устойчивых и урожайных сельскохозяйственных культур и борьбе с инфекционными заболеваниями, такими как ВИЧ, сибирская язва и грипп.

Почему же создание общего древа для всего живого до сих пор не осуществлено? Причина не в отсутствии исследований или данных. Во многом благодаря прогрессу в секвенировании ДНК, каждый год в научных журналах публикуются тысячи новых филогенетических деревьев — большинство из них сосредоточены на изолированных ветвях древа жизни, от птиц до оводов.

«Данные льются как из пожарного шланга, — говорит Крэнстон, главный исследователь проекта. — За годы ученые опубликовали десятки тысяч эволюционных деревьев, но почти не было работы по соединению точек и объединению их в единый ресурс».

Часть сложности заключается в колоссальности задачи. Крупнейшие из построенных на сегодня эволюционных деревьев содержат примерно 100 000 таксонов. Сборка ветвей для всех двух миллионов описанных видов животных, растений, грибов и микробов — не говоря уже о бесчисленном количестве еще не описанных или не открытых — потребует новых инструментов для анализа больших наборов данных и «сшивания» огромного числа опубликованных деревьев.

Другая трудность — в том, как ученые обычно распространяют свои результаты. Лишь крошечная доля всех опубликованных эволюционных деревьев — по оценкам исследователей, всего 4% — оказывается в базе данных в цифровой форме. Вместо этого большая часть этих знаний «заперта» в виде рисунков в статьях журналов, в форматах PDF или других файлов, которые невозможно загрузить, повторно проанализировать или объединить с новой информацией.

Новая инициатива — получившая название Open Tree of Life — призвана изменить это.

По словам исследователей, проект отличается от предыдущих попыток своим масштабом: «Это первая реальная попытка собрать воедино все древо жизни».

Команда надеется создать первый черновик полного эволюционного дерева — скомпилированный из деревьев, уже доступных в существующих базах данных — к августу 2013 года. Этот первый набросок будет далек от завершения. «Всегда будут появляться новые исследования, — отмечает Крэнстон. — Также будут места в дереве, где у нас недостаточно данных, или где данные приводят к конфликтующим гипотезам, или где группы исследователей просто не согласны друг с другом».

Но с первым черновиком в руках ученые смогут выходить в интернет, чтобы сравнивать свои деревья с уже опубликованными, или загружать его для дальнейшего изучения. Они также смогут расширять дерево, заполняя недостающие ветви и размещая вновь описанные или обнаруженные виды среди их родственников. В конечном итоге цель команды — научиться обнаруживать публикацию новых деревьев и автоматически включать их, чтобы полное древо могло постоянно обновляться.

Для успеха проекта одной из самых больших проблем станет стимулирование ученых к публикации своих результатов в цифровой форме. Все больше научных журналов теперь требуют от авторов размещать филогенетические данные в цифровой базе данных, но многие опубликованные деревья так туда и не попадают. «Мы надеемся предоставить инфраструктуру и инструменты, которые облегчат эту задачу, например, более удобный интерфейс для отправки данных», — говорит Крэнстон.

«В долгосрочной перспективе мы надеемся, что это станет центральным ресурсом для синтезированных филогенетических данных», — добавила она.

2012-05-21