ИИ смоделировал 500 миллионов лет эволюции для создания нового флуоресцентного белка
Исследователи из компаний EvolutionaryScale и Arc Institute (США) разработали ИИ-модель ESM3, способную генерировать код для синтеза новых белков. В работе, опубликованной в журнале Science, они описали создание модели и её использование для получения ранее неизвестного яркого флуоресцентного белка.
- Цель: Синтез искусственных белков открывает новые возможности для фундаментальных исследований и практических применений.
- Подход: Вместо копирования природных белков учёные использовали ИИ для имитации эволюционного процесса создания белка, которого не существует в природе.
- Модель ESM3: Это мультимодальная генеративная
языковая модель, обученная на огромном массиве данных:
- 771 миллиард токенов,
- 3,15 миллиарда белковых последовательностей,
- 236 миллионов структур белков,
- 539 миллионов аннотаций белков.
- Эволюционный масштаб: Такой объём данных эквивалентен предоставлению модели знаний о 500 миллионах лет эволюции. Модель начала с базового кода, который в виртуальном времени эволюционировал в современный виртуальный белок.
- Результат: Виртуальный белок был преобразован в реальный искусственный белок с помощью стандартных методов синтеза. Его генетическая последовательность отличается от всех известных белков.
- Конкретная задача: Исследователи запросили у модели создание нового зелёного флуоресцентного белка (часто используемого в качестве маркера). Новый белок назвали esmGFP.
- Перспективы: Модели, подобные ESM3, могут быть использованы для создания новых белков в медицине, экологических исследованиях и многих других областях.
