Новый алгоритм на основе ИИ определяет множественные структуры белка
Исследователи из MIT разработали алгоритм машинного обучения, который помогает выявлять несколько возможных структур, которые может принимать белок, на основе данных криоэлектронной микроскопии (cryo-EM).
В отличие от методов ИИ, предсказывающих структуру белка только на основе данных о последовательности, cryo-EM позволяет экспериментально определить структуру, создавая сотни тысяч или даже миллионов двумерных изображений замороженных образцов. Традиционно алгоритмы собирают эти изображения в единую трёхмерную реконструкцию.
В статье в Nature Methods учёные представили новое программное обеспечение на основе ИИ для реконструкции множественных структур и движений белка. Они использовали новую архитектуру нейронной сети, которая может эффективно генерировать полный ансамбль структур в одной модели.
"С широкими репрезентативными возможностями нейронных сетей мы можем извлекать структурную информацию из зашумленных изображений и визуализировать детальные движения макромолекулярных машин", — говорит Эллен Чжун, аспирант MIT и ведущий автор статьи.
С помощью этого ПО они обнаружили движения белка в наборах данных, где изначально была идентифицирована лишь одна статичная 3-D структура. Они также визуализировали крупномасштабные гибкие движения сплайсосомы — белкового комплекса, координирующего сплайсинг кодирующих последовательностей РНК.
Визуализация многоступенчатого процесса
Исследователи продемонстрировали подход, анализируя структуры, формирующиеся в процессе сборки рибосом. Изучая шаги сборки, они блокировали процесс на разных стадиях и делали снимки электронным микроскопом. На некоторых этапах накапливалась только одна структура, на других — множество различных.
Традиционные инструменты реконструкции cryo-EM плохо справлялись с определением этих множественных структур. Новый метод позволил идентифицировать новое, ранее не наблюдавшееся состояние рибосомы.
Оказалось, что в очень небольшом подмножестве рибосом (около 1%) структура, которая обычно добавляется в конце, появляется до сборки основного "фундамента". Это предполагает, что клеткам, возможно, слишком энергетически затратно обеспечивать правильный порядок сборки для каждой рибосомы.
Изучение вирусных белков
Сейчас исследователи применяют эту технику для изучения спайкового белка коронавируса, который связывается с рецепторами человеческих клеток. Рецептор-связывающий домен (RBD) этого белка имеет три субъединицы, каждая из которых может быть направлена вверх или вниз.
Понимание того, как выглядит состояние "вверх" и насколько велика конформационная гибкость, может быть полезным для разработки лекарств, которые будут переводить все RBD в состояние "вниз", предотвращая взаимодействие с клетками.
