Новый метод поиска генетических вариаций устраняет смещение в генотипировании человека

Исследователи из Института геномики UC Santa Cruz представили новый инструмент Giraffe, который эффективно сопоставляет новые последовательности генома с пангеномом, представляющим множество разнообразных последовательностей человеческого генома. Этот подход позволяет более полно охарактеризовать генетические вариации и улучшить геномные анализы.

Проблема одного референсного генома:

  • Более 20 лет исследования генома человека почти исключительно полагались на сравнение с одним референсным геномом.
  • Единый референсный геном не может отражать человеческое разнообразие, что вносит систематическое смещение в исследования.

Решение — пангеномная референсная карта:

  • Giraffe — набор алгоритмов для сопоставления новых данных последовательности с пангеномной референсной картой, построенной из множества геномных последовательностей с использованием математической графовой структуры.
  • Инструмент работает так же быстро, как существующие методы, использующие линейный референсный геном, но при этом снижает смещение при картировании последовательностей, отличающихся от референса.

Типы вариаций и важность структурных вариантов:

  • SNV (однонуклеотидные варианты) и короткие indels (вставки/делеции) — традиционные объекты изучения.
  • Структурные варианты (перестройки сегментов >50 букв) сложно обнаружить с помощью одного референсного генома, но они могут оказывать значительное влияние и играть роль в заболеваниях.
  • Пангеномика делает структурные варианты видимыми для изучения.

Результаты и применение:

  • Используя выравнивания Giraffe против пангенома, инструмент DeepVariant (Google Health) точнее идентифицировал SNV и indels.
  • Giraffe использовали для картирования последовательностей 5 202 человек и определения их генотипов для 167 000 недавно открытых структурных вариаций.
  • Это позволило оценить частоту разных версий этих структурных вариантов в популяции и показать, что частота некоторых вариантов значительно различается между субпопуляциями. Анализ только в популяциях европейского происхождения может привести к их неверной интерпретации.

Значение:

  • Пангеномные референсы, ставшие практичными благодаря Giraffe, делают геномику более инклюзивной и репрезентативной.
  • Исследователи участвуют в крупном проекте по созданию всеобъемлющего человеческого пангеномного референса, который планируется выпустить в следующем году.
2021-12-16