Как машинное обучение ускоряет структурную биологию
Исследовательская группа Лукаса Фарнунга изучает, как триллионы атомов в клетке синхронизируют свою работу, чтобы из одной оплодотворённой яйцеклетки развился целый организм. Ключевой процесс — транскрипция, во время которой молекулярные машины считывают инструкции с ДНК и создают РНК.
Основная проблема: доступ к информации в ДНК
Геном человека, если его растянуть, достигает ~2 метров в длину, но должен уместиться в ядре клетки размером в несколько микрон. Для этого ДНК упаковывается в хроматин, но это создаёт конфликт: информация становится недоступной для молекулярных машин. Фарнунг визуализирует, как машина РНК-полимераза II получает доступ к ДНК и запускает транскрипцию.
Методы визуализации
Учёные выделяют молекулярные машины из клеток (часто с помощью экспрессии в клетках насекомых или бактерий) и изучают их с помощью:
- Микроскопии
- Рентгеновских лучей
Сложность в том, что в регуляции транскрипции участвуют тысячи взаимодействующих белков, и каждый нужно изучать отдельно.
Революция от искусственного интеллекта
Раньше карьера аспиранта могла уйти на изучение одного белка. Теперь машинное обучение радикально ускоряет процесс.
AlphaFold от Google DeepMind — прорывная модель, предсказывающая укладку (фолдинг) белков, что определяет их функцию и взаимодействия. С помощью ИИ можно предсказать десятки тысяч белок-белковых взаимодействий, многие из которых раньше не были описаны экспериментально. Это позволяет быстро проверять гипотезы в лаборатории.
"Я называю это молекулярной биологией на стероидах — но легальной — потому что теперь мы можем гораздо быстрее добраться до сути вопроса", — говорит Фарнунг.
По его оценке, исследования теперь идут в 5–10 раз быстрее, чем 10 лет назад. За революцией в разрешении от крио-электронной микроскопии (cryo-EM) следует вторая революция — от машинного обучения.
Практическое применение
Понимание базовых механизмов биологии открывает путь к созданию лекарств:
- Онкология: Нарушение структуры ДНК-хроматин
молекулярными машинами — один из главных драйверов многих раков. Изучив
структуру этих машин, можно создавать препараты, нацеленные на
соответствующие белки.
- Пример: Совместно с HMS Therapeutics Initiative изучается хроматин-ремоделлер, часто мутирующий при раке простаты. Уже получена его структура, идут виртуальные скрининги соединений для создания ингибитора.
- Нейроразвитие: Изучаются белки, связанные с расстройствами, например, аутизмом. ИИ помогает предсказывать, как малые молекулы будут связываться с этими белками.
Важность коллаборации
Современная биология слишком сложна для одной лаборатории. Коллаборации с другими исследователями Harvard Medical School (HMS) на разных уровнях (от структурного анализа до изучения роли белка в клеточном контексте) — фундамент для прогресса.
