Учёные использовали нейросети для изучения ДНК
Учёные НИУ ВШЭ предложили способ повысить точность поиска Z-ДНК — участков ДНК, закрученных влево, а не вправо. Для этого они использовали нейронные сети и набор данных из более чем 30 000 экспериментов, проведённых разными лабораториями по всему миру. Подробности исследования опубликованы в Scientific Reports.
Z-ДНК — это одна из структурных вариаций ДНК, представляющая собой двойную спираль, закрученную влево. Известно, что участки Z-ДНК встречаются в клетках различных организмов (от бактерий до человека), возникают при определённых условиях (например, в сверхспирализованной ДНК или при высокой концентрации соли) и могут сочетаться с другими структурами ДНК в одной молекуле. Учёные предполагают, что Z-ДНК может регулировать транскрипцию и повышать вероятность мутаций. Некоторые исследования связывают её образование с такими заболеваниями, как рак, диабет и болезнь Альцгеймера. Также появляется всё больше работ, показывающих роль Z-ДНК во врождённом иммунном ответе — реакции на вирусы и другие патогены внутри самой клетки.
Для изучения условий образования и биологической роли участков Z-ДНК необходимы методы поиска их расположения в геноме. В последние годы для предсказания местоположения регионов, отличных от B-ДНК, стали использовать компьютерные алгоритмы. Развитие машинного обучения позволило применить для этой задачи нейронные сети. Однако поиск Z-ДНК остаётся сложной задачей даже для нейросетей из-за недостатка экспериментальных данных.
Исследователи решили проверить, повысится ли точность работы нейронных сетей при добавлении информации из омиксных данных — сведений о том, как регулируется активность генов и синтез белков в клетках.
Учёные сравнили, как с задачей справляются три типа нейронных сетей: свёрточные, рекуррентные и комбинация первых двух. Всего авторы обучили и оценили 151 модель на наборе данных ДНК, расширенном омиксными данными. Одна из рекуррентных нейронных сетей, названная авторами DeepZ, показала наилучшие результаты. Её точность значительно превышает точность существующего алгоритма Z-Hunt.
С помощью DeepZ учёные провели картирование всей последовательности генома человека, определяя для каждого нуклеотида вероятность того, что он окажется внутри участка Z-ДНК. Последовательность из нескольких нуклеотидов, для которой вероятность превышала определённое пороговое значение, отмечалась как потенциальный сайт-мишень.
«Результаты этого исследования важны, потому что с помощью нейронных сетей мы смогли не только воспроизвести эксперименты, но и предсказать потенциальные места образования Z-ДНК в геноме», — сказала руководитель исследования Мария Попцова. — «Обилие сигналов Z-ДНК говорит о том, что они активно используются для включения и выключения генов. Это более быстрый сигнал, чем геномные мотивы... По-видимому, Z-ДНК эволюционно появилась в тех случаях, когда требовалась быстрая реакция на события».
Авторы продемонстрировали новый подход к предсказанию участков Z-ДНК с использованием омиксных данных и методов глубокого обучения. Разметка генома, сгенерированная нейронной сетью, поможет учёным проводить эксперименты по обнаружению Z-ДНК, полный спектр функций которой только начинает раскрываться.
