Ученые разработали новые рекомендации по обмену данными об исследованиях неупорядоченных белков

Структурные биологи десятилетиями работают над определением 3D-структур белков, чтобы понять их функцию. Но что, если у белка нет фиксированной структуры? Для молекул, постоянно меняющих форму, как исследования, так и обмен результатами внутри научного сообщества могут быть сложными. Ученые EMBL внесли вклад в создание новых рекомендаций, которые сделают обмен данными более эффективным. Исследование опубликовано в журнале Nature Methods.

По сути, белки — это цепочки аминокислот, многие из которых сворачиваются в 3D-структуру, как оригами. Однако некоторые белки «предпочитают» оставаться гибкой цепочкой, похожей на вареные спагетти. Фактически, около трети всех известных белков полностью или частично похожи на спагетти.

Это не означает, что они не выполняют функцию. Напротив. Эта дополнительная гибкость дает белкам различные способности, например, адаптировать свою форму к форме других молекул. Таким образом, они могут взаимодействовать с более разнообразными молекулами и участвовать в большем количестве клеточных процессов, чем белок с жесткой структурой.

Понимание неструктурированных белков — также известных как «внутренне неупорядоченные белки» — важно, потому что они вовлечены во многие болезненные процессы, такие как рак, нейродегенерация и вирусные инфекции.

Делаем данные о белках значимыми

Научные данные, включая данные о неупорядоченных белках, наиболее полезны для сообщества, когда их можно повторно анализировать и интегрировать с другими наборами данных для изучения новых исследовательских вопросов. Для этого данные должны быть точно описаны и открыто доступны. Обычно это достигается путем отправки данных в общедоступные ресурсы, такие как те, которыми управляет EMBL-EBI. Некоторые из наиболее используемых ресурсов данных о белках включают UniProt для белковых последовательностей и Protein Data Bank in Europe (PDBe) для белковых структур.

Научное сообщество уже разработало широкий спектр рекомендаций, чтобы гарантировать, что ученые включают полезную информацию вместе со своими исследовательскими данными. Теперь, впервые, EMBL и сотрудники разработали такие рекомендации для данных о неупорядоченных белках.

Набор рекомендаций под названием «Минимальная информация об эксперименте с неупорядоченностью» (Minimum Information About a Disorder Experiment, MIADE) предназначен для всех, кто работает с неупорядоченными белками, чтобы помочь им делиться данными полезным образом. Эта открытая и общая структура призвана помочь ученым-белковщикам увеличить возможности анализа данных и их совместимости.

«Помимо определения минимального объема информации об эксперименте, необходимого для того, чтобы результаты были значимы для других ученых, мы также определяем, как сообщать эту информацию», — сказал Балинт Месарош, бывший постдокторант группы Гибсона в EMBL Гейдельберг и первый автор статьи. «По сути, мы разрабатываем общий язык, который может использоваться сообществом для однозначного общения».

Борьба с потерей данных

«Очень неприятно, когда вы читаете статью, описывающую отличную науку, но не можете полностью понять данные, потому что чего-то действительно важного не хватает», — пояснила Сандра Орчард, руководитель группы EMBL-EBI по контенту белковых функций. «Большую часть времени дополнительная информация существует, но авторы упускают из виду необходимость поделиться ею. Звучит глупо, но одна из самых больших потерь данных происходит из-за того, что авторы не указывают, от какого вида происходит белок, с которым они работают».

По мере того как сообщество будет принимать MIADE, больше данных должно начать поступать в общедоступные базы данных. Это позволит исследователям по всему миру получать доступ к информации о родственных белках и семействах белков, которые их интересуют, и сравнивать свои данные с данными других лабораторий. MIADE должна «упорядочить» исследования неупорядоченных белков и сделать их более понятными для новых людей, входящих в эту область.

Структурные характеристики систем внутренне неупорядоченных белков можно изучать с помощью различных экспериментальных методов, включая малоугловое рентгеновское рассеяние (SAXS) и малоугловое рассеяние нейтронов (SANS). База данных SASBDB для SAXS и SANS поддерживается и курируется группой SAXS EMBL Гамбург, которая внесла вклад в разработку рекомендаций MIADE.

«Важно, чтобы научные результаты были общими; в противном случае они могут стать «неоткрытыми открытиями», — сказал Сай Джеффрис, штатный ученый группы SAXS в EMBL Гамбург и соавтор рекомендаций. «Было фантастически работать вместе с разнообразным сообществом ученых, инженеров-программистов, программистов и менеджеров ресурсов данных. MIADE — это шаг к тому, чтобы ученые и ресурсы данных могли общаться гораздо легче, используя базовый набор терминов и идей, которые мы (и компьютеры) все можем распознать».

MIADE также поможет использовать искусственный интеллект для новых открытий в области неупорядоченных белков. Наличие обширных стандартизированных данных имеет решающее значение для обучения инструментов машинного обучения и искусственного интеллекта. При достаточном количестве обучающих данных исследователи смогут разрабатывать инструменты машинного обучения для помощи в прогнозировании новых неупорядоченных белков, интерпретации эффектов модификаций белка, идентификации взаимодействующих регионов и многого другого.

Усилия сообщества

Рекомендации MIADE предоставляют систематическую основу для обмена экспериментальными определениями, которая, помимо SASBDB, также принесет пользу многим другим базам данных, таким как BMRB (для ядерного магнитного резонанса, NMR), PCDDB (для данных спектров кругового дихроизма) и Protein Ensemble Database (PED). Это также важно для передачи и контекстуализации экспериментальных данных в «вышестоящие» биоинформационные ресурсы, такие как DisProt, и другие базы знаний о белковых структурах, подобные тем, что разработаны в PDBe.

Рекомендации MIADE были разработаны учеными из более чем 20 учреждений в 11 странах. Работа велась под руководством Института исследования рака в Лондоне, Великобритания.

2023-07-14