Исследователи используют глубокое обучение для предсказания физических взаимодействий белковых комплексов

Функция белка сильно зависит от его трёхмерной структуры. Исследователи давно пытаются ответить на вопрос: можно ли, зная строительные блоки этих молекулярных машин, предсказать, как они собираются в функциональную форму?

В новой статье, опубликованной в Nature Communications, исследователи из Технологического института Джорджии и Национальной лаборатории Ок-Ридж усовершенствовали модель AlphaFold 2, чтобы предсказывать не только структуру отдельных белков, но и функциональных пар белков, известных как комплексы.

По словам Джеффри Сколика, одного из авторов исследования, эта работа может помочь учёным в масштабном изучении структуры и взаимодействий белковых комплексов, минуя длительные эксперименты. Успех таких вычислительных моделей может фундаментально изменить способ изучения биологических молекулярных систем.

Основа для предсказания белков

AlphaFold 2 — это модель глубокого обучения, созданная DeepMind для предсказания 3D-структуры белка по его аминокислотной последовательности. Она показала высокие результаты на конкурсе CASP14, успешно предсказывая структуры как отдельных белковых доменов, так и белков, состоящих из нескольких доменов.

Исследовательская группа решила проверить, может ли программа пойти дальше. «Физические взаимодействия между разными доменами одной последовательности по сути те же, что и взаимодействия, скрепляющие разные белки», — объяснил Му Гао, старший научный сотрудник. Это навело на мысль, что относительно простые модификации AlphaFold 2 позволят ей предсказывать структурные модели белкового комплекса.

Вместо того чтобы вводить в AlphaFold 2 признаки одной белковой последовательности, исследователи объединили входные признаки нескольких последовательностей. В сочетании с новыми метриками для оценки силы взаимодействий между исследуемыми белками была создана их новая программа AF2Complex.

Проверка на практике

Для тестирования AF2Complex исследователи использовали высокопроизводительные вычисления в Georgia Tech. Модифицированная программа смогла правильно предсказать структуру более чем в два раза большего количества белковых комплексов, чем традиционный метод докинга. В то время как AF2Complex нужны только белковые последовательности, докинг требует знания структур отдельных белков заранее.

Воодушевлённые результатами, исследователи расширили идею для решения более масштабной задачи — предсказания взаимодействий между множеством произвольно выбранных белков. Используя новые метрики, AF2Complex превзошёл как методы докинга, так и исходный AlphaFold 2 в идентификации пар белков, которые, как известно, взаимодействуют экспериментально.

Для тестирования в масштабе протеома (всего набора белков организма) команда использовала суперкомпьютер Summit. «Благодаря этому ресурсу мы смогли применить AF2Complex примерно к 7000 пар белков бактерии E. coli», — поделился Гао.

В этом тесте новая модель не только идентифицировала многие пары белков, известные как образующие комплексы, но и позволила получить представление о взаимодействиях, «подозреваемых, но никогда не наблюдавшихся экспериментально».

Глубокий анализ этих взаимодействий выявил потенциальный молекулярный механизм для белковых комплексов, особенно важных для транспорта энергии. Эти комплексы переносят гемы — важные метаболиты, придающие крови тёмно-красный цвет. Используя предсказанные AF2Complex структурные модели, Джерри М. Паркс смог разместить гемы в предполагаемых реакционных центрах внутри структуры. «Эти вычислительные модели теперь дают представление о молекулярных механизмах работы этой биомолекулярной системы», — сказал Гао.

«Глубокое обучение меняет способ изучения биологической системы, — добавил Сколик. — Мы предполагаем, что такие методы, как AF2Complex, станут мощным инструментом для любого биолога, который хочет понять молекулярные механизмы биосистемы, включающей белковые взаимодействия».

2022-04-18