Новый метод поиска генетических вариаций устраняет смещение в генотипировании человека
Исследователи из Института геномики UC Santa Cruz представили новый инструмент Giraffe, который эффективно сопоставляет новые последовательности генома с пангеномом, представляющим множество разнообразных последовательностей человеческого генома. Этот подход позволяет более полно охарактеризовать генетические вариации и улучшить геномные анализы.
Проблема одного референсного генома:
- Более 20 лет исследования генома человека почти исключительно полагались на сравнение с одним референсным геномом.
- Единый референсный геном не может отражать человеческое разнообразие, что вносит систематическое смещение в исследования.
Решение — пангеномная референсная карта:
- Giraffe — набор алгоритмов для сопоставления новых данных последовательности с пангеномной референсной картой, построенной из множества геномных последовательностей с использованием математической графовой структуры.
- Инструмент работает так же быстро, как существующие методы, использующие линейный референсный геном, но при этом снижает смещение при картировании последовательностей, отличающихся от референса.
Типы вариаций и важность структурных вариантов:
- SNV (однонуклеотидные варианты) и короткие indels (вставки/делеции) — традиционные объекты изучения.
- Структурные варианты (перестройки сегментов >50 букв) сложно обнаружить с помощью одного референсного генома, но они могут оказывать значительное влияние и играть роль в заболеваниях.
- Пангеномика делает структурные варианты видимыми для изучения.
Результаты и применение:
- Используя выравнивания Giraffe против пангенома, инструмент DeepVariant (Google Health) точнее идентифицировал SNV и indels.
- Giraffe использовали для картирования последовательностей 5 202 человек и определения их генотипов для 167 000 недавно открытых структурных вариаций.
- Это позволило оценить частоту разных версий этих структурных вариантов в популяции и показать, что частота некоторых вариантов значительно различается между субпопуляциями. Анализ только в популяциях европейского происхождения может привести к их неверной интерпретации.
Значение:
- Пангеномные референсы, ставшие практичными благодаря Giraffe, делают геномику более инклюзивной и репрезентативной.
- Исследователи участвуют в крупном проекте по созданию всеобъемлющего человеческого пангеномного референса, который планируется выпустить в следующем году.
