ИИ создаёт искусственные ферменты с нуля
Учёные разработали систему искусственного интеллекта, способную генерировать искусственные ферменты с нуля. В лабораторных тестах некоторые из этих ферментов работали так же хорошо, как и природные, даже когда их искусственно сгенерированные аминокислотные последовательности значительно отличались от любой известной природной белковой последовательности.
Эксперимент показывает, что обработка естественного языка, хотя и была разработана для чтения и написания текста, может изучить по крайней мере некоторые фундаментальные принципы биологии. Исследователи из Salesforce Research создали ИИ-программу ProGen, которая использует предсказание следующего токена для сборки аминокислотных последовательностей в искусственные белки.
По мнению учёных, эта новая технология может оказаться мощнее направленной эволюции — удостоенной Нобелевской премии технологии дизайна белков. Она оживит 50-летнюю область белковой инженерии, ускорив разработку новых белков, которые можно использовать практически для чего угодно: от терапевтических средств до разложения пластика.
Ключевые результаты и процесс
- Производительность: «Искусственные конструкции работают намного лучше, чем конструкции, вдохновлённые эволюционным процессом», — заявил Джеймс Фрейзер, профессор биоинженерии и терапевтических наук в Школе фармации UCSF и соавтор работы, опубликованной 26 января в Nature Biotechnology.
- Обучение модели: Для создания модели учёные «скормили» модели машинного обучения аминокислотные последовательности 280 миллионов различных белков всех типов. Затем они дообучили модель, используя 56 000 последовательностей из пяти семейств лизоцимов вместе с контекстной информацией об этих белках.
- Генерация и тестирование: Модель быстро сгенерировала миллион последовательностей. Исследователи выбрали 100 для тестирования in vitro. Из них пять искусственных белков были протестированы в клетках, и их активность сравнили с ферментом из яичного белка куриных яиц (HEWL).
- Эффективность: Два искусственных фермента смогли расщеплять клеточные стенки бактерий с активностью, сравнимой с HEWL, хотя их последовательности были идентичны друг другу только на ~18%. Эти последовательности были идентичны любому известному белку примерно на 90% и 70% соответственно.
- Устойчивость к изменениям: В другом раунде скрининга команда обнаружила, что ферменты, созданные ИИ, проявляли активность, даже когда всего 31,4% их последовательности напоминали любой известный природный белок.
- Предсказание структуры: ИИ смог изучить, как должны быть устроены ферменты, просто анализируя данные о сырых последовательностях. Измерения с помощью рентгеновской кристаллографии показали, что атомные структуры искусственных белков выглядели именно так, как должны, хотя последовательности были совершенно новыми.
Перспективы технологии
«Языковая модель изучает аспекты эволюции, но это отличается от обычного эволюционного процесса», — сказал Фрейзер. «Теперь у нас есть возможность настраивать генерацию этих свойств для получения конкретных эффектов. Например, можно создать фермент, невероятно термостабильный, предпочитающий кислую среду или не взаимодействующий с другими белками».
«Способность генерировать функциональные белки с нуля "из коробки" демонстрирует, что мы вступаем в новую эру белкового дизайна», — сказал Али Мадани, основатель Profluent Bio, бывший научный сотрудник Salesforce Research и первый автор статьи. «Это универсальный новый инструмент, доступный белковым инженерам, и мы с нетерпением ждём терапевтических применений».
Полный код для методов, описанных в статье, находится в открытом доступе на github.com/salesforce/progen.
