За пределами AlphaFold: ИИ преуспевает в создании новых белков

За последние два года машинное обучение произвело революцию в предсказании структуры белков. Теперь три статьи в журнале Science описывают аналогичную революцию в дизайне белков.

В новых работах биологи из Медицинской школы Вашингтонского университета показывают, что машинное обучение можно использовать для создания белковых молекул гораздо точнее и быстрее, чем раньше. Учёные надеются, что этот прорыв приведёт к созданию новых вакцин, методов лечения, инструментов для улавливания углерода и устойчивых биоматериалов.

Белки часто называют «строительными блоками жизни», поскольку они необходимы для структуры и функционирования всех живых существ. Они состоят из длинных цепочек аминокислот. Последовательность аминокислот определяет трёхмерную форму белка, которая критически важна для его функции.

Чтобы выйти за пределы белков, существующих в природе, команда Дэвида Бейкера разбила задачу дизайна белка на три части и использовала новые программные решения для каждой.

  1. Генерация новой формы белка. В статье от 21 июля в Science команда показала, что искусственный интеллект может генерировать новые белковые формы двумя способами:

    • «Галлюцинация» — аналогично генеративным ИИ-инструментам, таким как DALL-E.
    • «Инпейнтинг» — аналогично функции автозаполнения в поисковых системах.
  2. Генерация аминокислотных последовательностей. Описанный в выпуске Science от 15 сентября программный инструмент ProteinMPNN работает примерно за одну секунду. Это более чем в 200 раз быстрее предыдущего лучшего программного обеспечения, а его результаты превосходят прежние инструменты.

  3. Проверка структуры. Команда использовала AlphaFold от DeepMind, чтобы независимо оценить, будут ли созданные аминокислотные последовательности сворачиваться в запланированные формы.

В другой статье в Science от 15 сентября команда из лаборатории Бейкера подтвердила, что комбинация новых инструментов машинного обучения может надёжно создавать новые белки, функционирующие в лаборатории.

Среди созданных белков — наноразмерные кольца, которые, по мнению исследователей, могут стать частями для пользовательских наномашин. Диаметр этих колец примерно в миллиард раз меньше, чем у макового семени.

Вычислительные ресурсы для этой работы были предоставлены Microsoft и Amazon Web Services.

2022-09-15