Структура ДНК влияет на скорость и точность её синтеза
Скорость и частота ошибок при синтезе ДНК зависят от её трёхмерной структуры. Используя данные полногеномного секвенирования «третьего поколения», исследователи из Университета штата Пенсильвания и Чешской академии наук показали, что последовательности, способные формировать необычные конформации ДНК (часто связанные с раком и неврологическими заболеваниями), могут замедлять или ускорять процесс синтеза ДНК и вызывать большее или меньшее количество ошибок секвенирования. Статья с описанием исследования опубликована в журнале Genome Research.
«Мы давно интересуемся факторами, влияющими на вариацию частоты мутаций в геноме, — сказала Катерина Макова, профессор биологии в Пенсильванском университете. — Последовательности, способные формировать не-B-ДНК (структуры, отличные от стандартной правозакрученной двойной спирали с десятью парами оснований на виток, B-ДНК), составляют около 13% человеческого генома и играют важную роль в клеточных функциях. Поскольку эти регионы также ассоциированы со многими заболеваниями, мы хотели проверить, влияют ли они на скорость реакции синтеза ДНК (полимеризации) и на частоту ошибок».
К не-B-ДНК относятся:
- Последовательности с повторами нуклеотида G (гуанина), способные формировать G-квадруплексы.
- Богатые "A" (аденином) регионы, вызывающие изгиб спирали.
- Короткие тандемные повторы (например, GATA GATA GATA...), способные формировать скользящие цепи и шпильки.
Используя метод Single-Molecule-Real-Time (SMRT) секвенирования, который отслеживает время между включением каждого последующего нуклеотида, учёные сравнили регионы не-B-ДНК с B-ДНК.
«В геноме существуют сотни тысяч мотивов, предсказанных как не-B-ДНК, — сказал Уилфрид Гибле, соавтор работы. — Мы использовали данные SMRT-секвенатора от Pacific Biosciences, чтобы сравнить время включения нуклеотидов в регионах не-B-ДНК и B-ДНК».
Сравнение показало, что одни формы не-B-ДНК (например, G-квадруплексы) замедляли работу фермента полимеразы на 70%, в то время как другие — ускоряли.
Для анализа данных был разработан новый статистический инструмент Functional Data Analysis (FDA), который сравнивает кривые времени включения нуклеотидов. Программный пакет, реализующий эту процедуру, теперь доступен публично.
Помимо изменения скорости, исследователи отметили повышение частоты ошибок секвенатора в некоторых типах регионов не-B-ДНК (например, в мотивах G-квадруплексов). В этих же регионах наблюдалось повышенное генетическое разнообразие среди людей (по данным «1000 Genomes Project») и повышенное расхождение между человеком и орангутаном.
«Похоже, один и тот же феномен, вызывающий повышенную частоту ошибок в секвенаторе, также приводит к увеличению вариаций у людей и расхождению с орангутаном, — сказала Катерина Макова. — Понимание того, как структура не-B-ДНК влияет на частоту мутаций, крайне интересно как с точки зрения эволюции генома, так и из-за вовлечённости этих регионов в человеческие болезни».
