Алгоритм для повышения точности CRISPR-редактирования генов
Исследователи из Орхусского университета и Копенгагенского университета разработали новый метод, который делает CRISPR-редактирование генов более точным по сравнению с обычными методами. Метод позволяет отбирать молекулы, наиболее подходящие для помощи белку CRISPR-Cas9 в высокоточном редактировании в нужном месте ДНК.
Одной из ключевых задач является выбор так называемой молекулы gRNA (гидовая РНК), которая должна направлять белок Cas9 к нужному участку ДНК для разрезания. "Обычно существует несколько возможных gRNA, и они не все одинаково эффективны. Поэтому задача состоит в том, чтобы выбрать те немногие, которые работают с высокой эффективностью, и именно это делает наш новый метод", — объясняет Йонглун Луо, доцент кафедры биомедицины Орхусского университета.
Новый метод основан на данных исследователей и реализации алгоритма, который предсказывает, какие gRNA работают наиболее эффективно. "Объединив наши собственные данные с общедоступными и включив знания о молекулярных взаимодействиях между gRNA, ДНК и белком CRISPR-Cas9, мы добились успеха в разработке лучшего метода", — говорит Ян Городкин, профессор Копенгагенского университета.
Данные, глубокое обучение и молекулярные взаимодействия
Экспериментальная часть исследования была проведена группой Луо, а группа Городкина возглавила компьютерное моделирование. "В нашем исследовании мы количественно оценили эффективность молекул gRNA для более чем 10 000 различных сайтов. Эта работа была выполнена с использованием масштабного метода на основе высокопроизводительной библиотеки, что было бы невозможно традиционными методами", — отмечает Луо.
Исследователи использовали концепцию, при которой вирус экспрессирует gRNA и синтетический сайт-мишень в одной клетке. Эти синтетические сайты-мишени имеют точно такие же последовательности ДНК, как и соответствующие сайты в геноме, и используются в качестве суррогатных для оценки эффективности редактирования CRISPR-Cas9. Совместно с коллегами они получили данные о высокой активности CRISPR-Cas9 для более чем 10 000 gRNA.
Имея этот набор данных gRNA с известной эффективностью (от низкой до высокой), исследователи смогли построить модель, способную предсказывать эффективность ранее неизвестных gRNA. "Чтобы обучить алгоритм быть точным, нужен большой набор данных. Наша библиотека вирусов предоставила данные, которые являются идеальной отправной точкой для обучения нашего алгоритма глубокого обучения предсказанию эффективности gRNA. Наш новый метод более точен, чем другие доступные в настоящее время методы", — заключает Городкин.
