Как машинное обучение ускоряет структурную биологию

Исследовательская группа Лукаса Фарнунга изучает, как триллионы атомов в клетке синхронизируют свою работу, чтобы из одной оплодотворённой яйцеклетки развился целый организм. Ключевой процесс — транскрипция, во время которой молекулярные машины считывают инструкции с ДНК и создают РНК.

Основная проблема: доступ к информации в ДНК

Геном человека, если его растянуть, достигает ~2 метров в длину, но должен уместиться в ядре клетки размером в несколько микрон. Для этого ДНК упаковывается в хроматин, но это создаёт конфликт: информация становится недоступной для молекулярных машин. Фарнунг визуализирует, как машина РНК-полимераза II получает доступ к ДНК и запускает транскрипцию.

Методы визуализации

Учёные выделяют молекулярные машины из клеток (часто с помощью экспрессии в клетках насекомых или бактерий) и изучают их с помощью:

Сложность в том, что в регуляции транскрипции участвуют тысячи взаимодействующих белков, и каждый нужно изучать отдельно.

Революция от искусственного интеллекта

Раньше карьера аспиранта могла уйти на изучение одного белка. Теперь машинное обучение радикально ускоряет процесс.

AlphaFold от Google DeepMind — прорывная модель, предсказывающая укладку (фолдинг) белков, что определяет их функцию и взаимодействия. С помощью ИИ можно предсказать десятки тысяч белок-белковых взаимодействий, многие из которых раньше не были описаны экспериментально. Это позволяет быстро проверять гипотезы в лаборатории.

"Я называю это молекулярной биологией на стероидах — но легальной — потому что теперь мы можем гораздо быстрее добраться до сути вопроса", — говорит Фарнунг.

По его оценке, исследования теперь идут в 5–10 раз быстрее, чем 10 лет назад. За революцией в разрешении от крио-электронной микроскопии (cryo-EM) следует вторая революция — от машинного обучения.

Практическое применение

Понимание базовых механизмов биологии открывает путь к созданию лекарств:

  1. Онкология: Нарушение структуры ДНК-хроматин молекулярными машинами — один из главных драйверов многих раков. Изучив структуру этих машин, можно создавать препараты, нацеленные на соответствующие белки.
    • Пример: Совместно с HMS Therapeutics Initiative изучается хроматин-ремоделлер, часто мутирующий при раке простаты. Уже получена его структура, идут виртуальные скрининги соединений для создания ингибитора.
  2. Нейроразвитие: Изучаются белки, связанные с расстройствами, например, аутизмом. ИИ помогает предсказывать, как малые молекулы будут связываться с этими белками.

Важность коллаборации

Современная биология слишком сложна для одной лаборатории. Коллаборации с другими исследователями Harvard Medical School (HMS) на разных уровнях (от структурного анализа до изучения роли белка в клеточном контексте) — фундамент для прогресса.

2024-07-22