Алгоритм раскрывает сложную динамику белков, лежащую в основе экспрессии генов

Исследователи из Стэнфордского университета разработали компьютерный алгоритм для понимания сложной и быстрой хореографии сотен белков, которые взаимодействуют в головокружительных комбинациях, управляя включением и выключением генов в клетке.

Для этого они объединили данные 238 экспериментов по связыванию ДНК с белками, проведенных проектом ENCODE, с лабораторной методикой для выявления паттернов взаимодействия между самими белками.

Анализ достаточно чувствителен, чтобы выявить множество ранее не подозреваемых взаимодействий с несколькими партнерами. Его можно быстро и многократно выполнять для отслеживания реакции клетки на изменения окружающей среды или ключевые сигналы развития.

"На самом базовом уровне мы изучаем, кто любит работать с кем, чтобы регулировать около 20 000 человеческих генов", — сказал Майкл Снайдер, профессор и заведующий кафедрой генетики в Стэнфорде.

Проект ENCODE (Энциклопедия элементов ДНК) — это пятилетнее сотрудничество более 440 ученых в 32 лабораториях по всему миру, направленное на изучение сложного взаимодействия регуляторных областей, белков и молекул РНК, управляющего экспрессией генов.

В этом исследовании ученые объединили данные геномики и протеомики. Они изучили 128 белков, называемых trans-действующими факторами, которые регулируют экспрессию генов, связываясь с регуляторными областями генома.

Исследователи использовали 238 наборов данных ENCODE для изучения специфических последовательностей ДНК, связываемых каждым из 128 факторов. Затем они разработали алгоритм машинного обучения для анализа всех данных и определения, какие факторы обычно встречаются вместе и какие последовательности ДНК они предпочитают.

Эксперименты по иммунопреципитации позволили определить, какие белки взаимодействуют друг с другом напрямую, а какие встречаются вместе из-за близости их предпочтительных сайтов связывания с ДНК.

"До нашей работы изучались только комбинации из двух или трех регуляторных белков, что чрезмерно упрощало то, как регуляторы генов сотрудничают для поиска своих мишеней", — сказал Дэн Се. — "Нашим методом мы можем изучать комбинации более 100 регуляторов и видеть гораздо более сложную структуру сотрудничества".

Исследователи обнаружили, что паттерны совместного расположения белков на ДНК варьируются в зависимости от типа клеток и условий их роста. Многие из этих кластеров объясняются взаимодействиями между белками, причем не каждый белок связывается с ДНК напрямую.

"Мы хотели бы понять, как эти взаимодействия работают вместе, чтобы создавать разные типы клеток, и как они обретают свою уникальную идентичность в процессе развития", — сказал Снайдер. — "Кроме того, больные клетки будут иметь совершенно другую схему взаимодействий. Мы надеемся понять, как эти клетки сбиваются с пути".

2013-10-25