ИИ смоделировал 500 миллионов лет эволюции для создания нового флуоресцентного белка

Исследователи из компаний EvolutionaryScale и Arc Institute (США) разработали ИИ-модель ESM3, способную генерировать код для синтеза новых белков. В работе, опубликованной в журнале Science, они описали создание модели и её использование для получения ранее неизвестного яркого флуоресцентного белка.

  • Цель: Синтез искусственных белков открывает новые возможности для фундаментальных исследований и практических применений.
  • Подход: Вместо копирования природных белков учёные использовали ИИ для имитации эволюционного процесса создания белка, которого не существует в природе.
  • Модель ESM3: Это мультимодальная генеративная языковая модель, обученная на огромном массиве данных:
    • 771 миллиард токенов,
    • 3,15 миллиарда белковых последовательностей,
    • 236 миллионов структур белков,
    • 539 миллионов аннотаций белков.
  • Эволюционный масштаб: Такой объём данных эквивалентен предоставлению модели знаний о 500 миллионах лет эволюции. Модель начала с базового кода, который в виртуальном времени эволюционировал в современный виртуальный белок.
  • Результат: Виртуальный белок был преобразован в реальный искусственный белок с помощью стандартных методов синтеза. Его генетическая последовательность отличается от всех известных белков.
  • Конкретная задача: Исследователи запросили у модели создание нового зелёного флуоресцентного белка (часто используемого в качестве маркера). Новый белок назвали esmGFP.
  • Перспективы: Модели, подобные ESM3, могут быть использованы для создания новых белков в медицине, экологических исследованиях и многих других областях.
2025-01-21