Ученые разработали более точный метод обнаружения и интерпретации геномных вариантов
Ученые из Медицинской школы Икан на горе Синай разработали новый подход для построения почти полных геномов, комбинируя высокопроизводительное секвенирование ДНК с картированием генома. Методология позволила исследователям обнаруживать сложные формы геномной вариабельности, критически важные из-за их связи с заболеваниями человека, но ранее трудно определяемые. Исследование опубликовано в Nature Methods и является результатом сотрудничества с учеными из Европейской лаборатории молекулярной биологии, Медицинского колледжа Вейл Корнелл, Лаборатории в Колд-Спринг-Харбор, Университета Рокфеллера, Калифорнийского университета в Сан-Франциско, Pacific Biosciences и BioNano Genomics.
Преодоление ограничений стандартных методов
Обычные методы секвенирования нового поколения (NGS) могут точно обнаруживать определенные типы вариаций, такие как однонуклеотидные варианты и небольшие вставки или делеции, но пропускают многие крупные или сложные формы геномной вариабельности, связанные с заболеваниями человека. Кроме того, эти подходы плохо подходят для полностью de novo анализа геномов и для фазирования материнских и отцовских гаплотипов индивида.
Для преодоления этих ограничений авторы исследования объединили два подхода на основе одиночных молекул: длинное чтение от Pacific Biosciences и технологию наноканальных массивов от BioNano Genomics. Секвенирование Pacific Biosciences позволяет получать чтения длиной более 10 т.п.н., что может напрямую разрешать и фазировать сложные формы вариаций. Наноканальный массив BioNano удерживает и линеаризует молекулы ДНК длиной до мегабаз, предоставляя физические карты с высоким разрешением, называемые «геномными картами».
Результаты на геноме NA12878
Исследователи изучили диплоидный геном NA12878 — хорошо секвенированный образец из проекта «1000 геномов», часто используемый для тестирования новых методов. Ученые картировали вариации и построили сборки с помощью обеих технологий, а затем объединили их, создав «гибридную» сборку, которая значительно улучшила контигуозность каждой. Полученные гибридные сборки имеют N50 (длину, такую, что 50% всех пар оснований содержатся в скаффолдах данной длины или больше), приближающуюся к 30 Мб, что сравнимо с лучшими сборками на сегодняшний день, но при значительно меньших затратах и трудоемкости.
Ключевые выводы и перспективы
«Исследование выявило беспрецедентный взгляд на геномную сложность, во многих случаях идентифицируя регионы, упущенные при обычном секвенировании, или дополнительно уточняя ранее известные классы генетических вариантов», — сказал соавтор исследования Ян Корбел, доктор философии, руководитель группы в Европейской лаборатории молекулярной биологии.
«Мы достигли заметного успеха в сложных регионах, таких как инверсии и тандемные повторы», — добавил соавтор Роберт Себра, доктор философии. «Например, было отмечено систематическое занижение размеров тандемных повторов в референсных геномах человека. Такие экспансии, как мы наблюдали в гене LPA, связанном с уровнем липидов плазмы, все чаще определяются как важные маркеры заболеваний».
Новый подход позволяет строить высококонтигуозные de novo геномы без сложных библиотек или целевых методов. «В некоторых случаях эта стратегия автоматически разрешала целые плечи хромосом», — отметил старший автор исследования Али Башир, доктор философии.
«Используя мощную комбинацию новых технологий, мы можем наконец начать обходить искажения, вызванные чрезмерной зависимостью от одного референсного генома», — сказал соавтор Эрик Шадат, доктор философии. Полностью de novo подходы станут стандартной практикой для прямого и всестороннего изучения геномной вариабельности, что ускорит понимание ее связи с заболеваниями человека. Метод применим не только к геному человека, но и к любым новым геномам, включая геномы высокой сложности, например, растений.
