Исследователи используют ИИ для «галлюцинации» новых белковых структур

Все живые организмы используют белки — сложные молекулы, выполняющие множество функций: от фотосинтеза в растениях до работы иммунной системы и мышц. Многие лекарства также основаны на белках.

Однако для многих областей биомедицинских исследований и разработки лекарств не существует природных белков, которые могли бы служить подходящей отправной точкой. Исследователям, создающим новые препараты против COVID-19 или белки для управления генами, приходится конструировать белки с нуля (de novo protein design).

Этот процесс может быть сложным. Основная проблема — создание белковой структуры, которая будет выполнять нужную функцию. Традиционно исследователи создают шаблоны на основе природных белков со сходной функцией. Но этот подход трудоёмок и ограничен существующим в природе разнообразием.

Глубокое обучение для дизайна белков

Белки состоят из сотен или тысяч аминокислот, соединённых в цепочки, которые сворачиваются в уникальную трёхмерную структуру. Порядок аминокислот определяет структуру и функцию белка.

В последние годы исследовательские группы разработали специальные глубокие нейронные сети для предсказания структуры белка. Если на вход сети подать случайную последовательность аминокислот, она предскажет наиболее вероятную 3D-структуру для этой последовательности.

Предсказания для случайных последовательностей получаются «размытыми» (структура нечёткая), в то время как для природных или правильно спроектированных белков структура определяется чётко.

Метод «галлюцинации» новых белков

Новый метод генерации белков, разработанный авторами, концептуально схож с компьютерным зрением, например, с Google DeepDream, который находит и усиливает паттерны в изображениях.

Метод работает так:

  1. Случайная аминокислотная последовательность пропускается через глубокую нейронную сеть. Результат — «размытая» структура.
  2. В последовательность вносится мутация (замена одной аминокислоты), и новая последовательность снова пропускается через сеть.
  3. Если изменение делает структуру более чёткой, мутация сохраняется, и вносится следующая.
  4. Процесс повторяется тысячи раз, пока не будет получена последовательность, предсказанная к свёртыванию в чёткую, стабильную структуру, близкую к тем, что существуют в природе.

С помощью этого процесса исследователи сгенерировали 2000 новых белковых последовательностей. Из них более 100 наиболее отличающихся по форме были воссозданы в лаборатории. Три лучших кандидата были детально проанализированы, и их структура подтвердила предсказания «галлюцинированных» моделей.

Значение и перспективы

Подход «галлюцинации» значительно упрощает конвейер дизайна белков, устраняя необходимость в шаблонах. Исследователи могут сосредоточиться на желаемой функции, а сеть сама определит подходящую структуру.

Это открывает новые возможности:

  • Создание белков с более специфичными функциями.
  • Применение метода с другими современными нейронными сетями.

Потенциальные применения белков de novo обширны: разрушение пластиков для снижения загрязнения, идентификация и воздействие на нездоровые клетки, улучшение вакцин против существующих и новых патогенов.

2022-01-06