Инструменты для сравнения геномов оказались подвержены ошибкам
Сравнение геномов разных видов — распространённая практика в эволюционных исследованиях. Оно позволяет понять, как виды эволюционировали, определить консервативные участки ДНК, важные для выживания, и воссоздать эволюционные связи там, где палеонтологическая летопись неполна.
Однако, согласно исследованию, опубликованному в журнале Nature Biotechnology, инструменты для выравнивания геномов разных видов имеют серьёзные проблемы с контролем качества.
«Мы обнаружили тревожно низкий уровень согласованности между выравниваниями геномов, полученными с помощью разных инструментов», — заявил автор-корреспондент Мартин Томпа, профессор компьютерных наук, инженерии и геномных наук UW. — «Это говорит биологам о том, что им следует с большой осторожностью доверять этим выравниваниям в целом».
Особенно это касается сравнения отдалённо родственных видов и участков генома, не кодирующих белки.
Проблема масштаба
Выравнивание геномов на практике — сложная задача. Выравнивание более двух последовательностей становится экспоненциально сложнее с каждым новым геномом. Для масштабов всего генома млекопитающего поиск оптимального выравнивания многих геномов выходит за пределы возможностей любых компьютеров. Поэтому различные программные инструменты используют стратегические упрощения.
«На высоком уровне инструменты очень похожи, — пояснил Томпа. — Они принимают разные решения на более детальном уровне, и эти решения, по-видимому, оказывают повсеместное влияние на результат».
Сравнение четырёх методов
В новом исследовании сравнивались результаты предыдущей работы, в которой четыре научные группы, используя четыре разных инструмента, выравнивали один и тот же 1% человеческого генома с геномами 27 других позвоночных — от мыши до слона.
Однако новое исследование показало, что полученные выравнивания существенно различались. Авторы также сравнили «покрытие» каждого инструмента (сколько человеческой ДНК удалось сопоставить с каждым видом) и долю выравниваний, подозрительно близких к случайному совпадению.
Лучший инструмент
Наилучшие результаты показал самый новый инструмент — Pecan, разработанный Европейским институтом биоинформатики.
«Наше исследование довольно чётко указывает на то, что Pecan обеспечивает самое качественное выравнивание из четырёх сравниваемых инструментов», — сказал Томпа. Он сопоставил столько же человеческого генома с другими видами, как и другие инструменты, но его совпадения были значительно надёжнее, особенно для отдалённо родственных видов.
Другими инструментами в исследовании были Threaded Blockset Aligner (TBA), Multiple Limited Area Global Alignment of Nucleotides (MLAGAN) и Mavid. Все четыре — бесплатные программы, разработанные академическими институтами.
«Я надеюсь, что разработчики этих инструментов внимательно изучат нашу статью и, возможно, смогут улучшить свои продукты», — заключил Томпа.
