Белки и естественный язык: ИИ позволяет проектировать новые белки
Искусственный интеллект (ИИ) открыл новые возможности для создания белков «на заказ» для решения медицинских и экологических проблем. Исследовательская группа Университета Байройта под руководством проф. Бирте Хёкер успешно применила компьютерную модель обработки естественного языка (NLP) в исследованиях белков. Модель ProtGPT2 полностью самостоятельно проектирует новые белки, способные к стабильному сворачиванию и выполнению определённых функций в более крупных молекулярных контекстах. Модель и её потенциал подробно описаны в Nature Communications.
Естественные языки и белки схожи по структуре. Аминокислоты выстраиваются в множестве комбинаций, образуя структуры с конкретными функциями в живом организме — подобно тому, как слова образуют предложения, выражающие определённые факты. Поэтому в последние годы разработано множество подходов для использования принципов компьютерной обработки естественного языка в белковых исследованиях.
«Обработка естественного языка сделала необычайный прогресс благодаря новым технологиям ИИ. Сегодня модели языковой обработки позволяют машинам не только понимать осмысленные предложения, но и генерировать их самим. Такая модель стала отправной точкой нашего исследования. С подробной информацией о примерно 50 миллионах последовательностей природных белков моя коллега Ноэлия Феррус обучила модель, позволив ей самостоятельно генерировать белковые последовательности. Теперь она понимает язык белков и может использовать его творчески. Мы обнаружили, что эти творческие проекты следуют базовым принципам природных белков», — говорит проф. Бирте Хёкер.
Модель языковой обработки, перенесённая на эволюцию белков, называется ProtGPT2. Теперь её можно использовать для проектирования белков, которые принимают стабильные структуры путём сворачивания и остаются функциональными в этом состоянии. Кроме того, байройтские биохимики в ходе сложных исследований выяснили, что модель может создавать даже белки, не встречающиеся в природе и, возможно, никогда не существовавшие в истории эволюции. Эти находки проливают свет на неизмеримый мир возможных белков и открывают дверь для их проектирования новыми, неисследованными способами.
Есть и дополнительное преимущество: большинство белков, созданных de novo до сих пор, имели идеализированные структуры. Прежде чем такие структуры найдут потенциальное применение, они обычно должны пройти сложный процесс функционализации — например, путём вставки расширений и полостей, — чтобы взаимодействовать со средой и выполнять точно определённые функции в более крупных системах. ProtGPT2 же генерирует белки, которые изначально обладают такими дифференцированными структурами и потому уже являются работоспособными в своей среде.
«Наша новая модель — ещё одно впечатляющее доказательство системного сродства белкового дизайна и обработки естественного языка. Искусственный интеллект открывает крайне интересные и многообещающие возможности использовать методы языковой обработки для производства белков на заказ. В Университете Байройта мы надеемся таким образом внести вклад в разработку инновационных решений для биомедицинских, фармацевтических и экологических проблем», — говорит проф. Бирте Хёкер.
