Исследователи используют ИИ для «галлюцинации» новых белковых структур
Все живые организмы используют белки — сложные молекулы, выполняющие множество функций: от фотосинтеза в растениях до работы иммунной системы и мышц. Многие лекарства также основаны на белках.
Однако для многих областей биомедицинских исследований и разработки лекарств не существует природных белков, которые могли бы служить подходящей отправной точкой. Исследователям, создающим новые препараты против COVID-19 или белки для управления генами, приходится конструировать белки с нуля (de novo protein design).
Этот процесс может быть сложным. Основная проблема — создание белковой структуры, которая будет выполнять нужную функцию. Традиционно исследователи создают шаблоны на основе природных белков со сходной функцией. Но этот подход трудоёмок и ограничен существующим в природе разнообразием.
Глубокое обучение для дизайна белков
Белки состоят из сотен или тысяч аминокислот, соединённых в цепочки, которые сворачиваются в уникальную трёхмерную структуру. Порядок аминокислот определяет структуру и функцию белка.
В последние годы исследовательские группы разработали специальные глубокие нейронные сети для предсказания структуры белка. Если на вход сети подать случайную последовательность аминокислот, она предскажет наиболее вероятную 3D-структуру для этой последовательности.
Предсказания для случайных последовательностей получаются «размытыми» (структура нечёткая), в то время как для природных или правильно спроектированных белков структура определяется чётко.
Метод «галлюцинации» новых белков
Новый метод генерации белков, разработанный авторами, концептуально схож с компьютерным зрением, например, с Google DeepDream, который находит и усиливает паттерны в изображениях.
Метод работает так:
- Случайная аминокислотная последовательность пропускается через глубокую нейронную сеть. Результат — «размытая» структура.
- В последовательность вносится мутация (замена одной аминокислоты), и новая последовательность снова пропускается через сеть.
- Если изменение делает структуру более чёткой, мутация сохраняется, и вносится следующая.
- Процесс повторяется тысячи раз, пока не будет получена последовательность, предсказанная к свёртыванию в чёткую, стабильную структуру, близкую к тем, что существуют в природе.
С помощью этого процесса исследователи сгенерировали 2000 новых белковых последовательностей. Из них более 100 наиболее отличающихся по форме были воссозданы в лаборатории. Три лучших кандидата были детально проанализированы, и их структура подтвердила предсказания «галлюцинированных» моделей.
Значение и перспективы
Подход «галлюцинации» значительно упрощает конвейер дизайна белков, устраняя необходимость в шаблонах. Исследователи могут сосредоточиться на желаемой функции, а сеть сама определит подходящую структуру.
Это открывает новые возможности:
- Создание белков с более специфичными функциями.
- Применение метода с другими современными нейронными сетями.
Потенциальные применения белков de novo обширны: разрушение пластиков для снижения загрязнения, идентификация и воздействие на нездоровые клетки, улучшение вакцин против существующих и новых патогенов.
