Использование трёх ИИ-инструментов для предсказания структуры белков раскрыло новые детали в истории сворачивания «сиротских» белков
Во время онлайн-менторства студентов из Китая в период пандемии COVID-19 профессора Джоэл Зюссман и Исраэль Зильман не ожидали, что это приведёт к инновационному исследованию эволюции белков, способному изменить понимание того, как возникают новые белки.
Студенты — Цзин Лю, Жунцин Юань, Вэй Шао и Цзитун Ван — вместо ожидаемого конспекта старой статьи наставников представили её углублённую критику с современных позиций. Это положило начало совместным дискуссиям, в центре которых оказалось исследование чешских учёных 2017 года, бросившее вызов устоявшимся догмам.
Трещины в догме о сворачивании
Долгое время считалось, что все функциональные белки произошли путём постепенного усовершенствования существующих последовательностей, и что появление совершенно новых белков прекратилось. Однако около десяти лет назад сравнение геномов показало наличие генов, кодирующих «новорождённые» белки, у всех видов — от бактерий до человека. Эти белки, как полагают, возникают из некодирующих участков ДНК.
Чешское исследование нанесло ещё один удар по этой догме. Учёные создали около 100 последовательностей гипотетических белков, случайным образом «перетасовав» существующие гены. В лабораторных испытаниях примерно треть этих «никогда не рождавшихся» белков показала признаки сворачивания в компактные структуры, подобные природным белкам. Это удивительное открытие предполагало, что новые белки могут не только появляться, но и выполнять важные функции.
Рождённые сиротами
Чтобы изучить этот феномен, команда Зюссмана, Зильмана, Лю и Юаня провела одно из первых структурных исследований новорождённых белков с помощью инструментов искусственного интеллекта (ИИ), таких как AlphaFold2, RoseTTAFold и ESMFold. Эти алгоритмы предсказывают трёхмерную структуру белка по его аминокислотной последовательности.
Основная сложность заключалась в том, что алгоритмы ИИ наиболее эффективны для белков с множеством гомологов (эквивалентов в других видах). «Новорождённые» же белки по определению существуют лишь в одном или нескольких родственных видах и называются сиротскими (или почти сиротскими). Команда успешно применила ИИ-инструменты к таким белкам, не имеющим гомологов. Для надёжности использовались три разных алгоритма, и их результаты сравнивались.
- Сначала алгоритмы предсказали структуру «никогда не рождавшихся» белков из чешского исследования. Предсказания (свёрнутая или неструктурированная форма) совпали с экспериментальными результатами.
- Затем команда применила алгоритмы к семи известным из литературы сиротским белкам, чья функция, но не структура, была установлена. ИИ-инструменты показали, что пять из семи белков имеют компактную свёрнутую структуру, а два — нет. Для одного из пяти белка предсказания трёх алгоритмов были настолько схожи (что указывает на высокую точность), что журнал Proteins: Structure, Function, and Bioinformatics поместил эти три 3D-структуры на свою обложку.
Кроме того, учёные обнаружили в Банке данных белков (Protein Data Bank) три сиротских белка, чья структура была определена экспериментально. Удивительно, но два из них обладали типами укладки (фолдами), которые больше нигде не встречаются. Поскольку структура определяет функцию, эти новые фолды предполагают, что некоторые сиротские белки могут выполнять ранее неизвестные биологические функции, которые в будущем можно будет использовать — от разложения пластика до генерации чистой энергии или лечения болезней.
Это исследование меняет представление об эволюции. Как отметил Зюссман, эволюция обычно идёт по Дарвину, но иногда белки могут появляться, «словно из воздуха». Таким образом, новые признаки могут возникать ниоткуда, а не эволюционировать от предков миллионы лет. Зильман добавил, что эти находки меняют мышление о происхождении жизни в целом и человека в частности: «Похоже, мы не просто правнуки E. coli».
Исследование стимулирует учёных использовать ИИ-инструменты для изучения структуры и функции сиротских белков. Когда появляется совершенно новая структура, открываются захватывающие новые горизонты для исследований.
