Алгоритм раскрывает сложную динамику белков, лежащую в основе экспрессии генов
Исследователи из Стэнфордского университета разработали компьютерный алгоритм для понимания сложной и быстрой хореографии сотен белков, которые взаимодействуют в головокружительных комбинациях, управляя включением и выключением генов в клетке.
Для этого они объединили данные 238 экспериментов по связыванию ДНК с белками, проведенных проектом ENCODE, с лабораторной методикой для выявления паттернов взаимодействия между самими белками.
Анализ достаточно чувствителен, чтобы выявить множество ранее не подозреваемых взаимодействий с несколькими партнерами. Его можно быстро и многократно выполнять для отслеживания реакции клетки на изменения окружающей среды или ключевые сигналы развития.
"На самом базовом уровне мы изучаем, кто любит работать с кем, чтобы регулировать около 20 000 человеческих генов", — сказал Майкл Снайдер, профессор и заведующий кафедрой генетики в Стэнфорде.
Проект ENCODE (Энциклопедия элементов ДНК) — это пятилетнее сотрудничество более 440 ученых в 32 лабораториях по всему миру, направленное на изучение сложного взаимодействия регуляторных областей, белков и молекул РНК, управляющего экспрессией генов.
В этом исследовании ученые объединили данные геномики и протеомики. Они изучили 128 белков, называемых trans-действующими факторами, которые регулируют экспрессию генов, связываясь с регуляторными областями генома.
Исследователи использовали 238 наборов данных ENCODE для изучения специфических последовательностей ДНК, связываемых каждым из 128 факторов. Затем они разработали алгоритм машинного обучения для анализа всех данных и определения, какие факторы обычно встречаются вместе и какие последовательности ДНК они предпочитают.
Эксперименты по иммунопреципитации позволили определить, какие белки взаимодействуют друг с другом напрямую, а какие встречаются вместе из-за близости их предпочтительных сайтов связывания с ДНК.
"До нашей работы изучались только комбинации из двух или трех регуляторных белков, что чрезмерно упрощало то, как регуляторы генов сотрудничают для поиска своих мишеней", — сказал Дэн Се. — "Нашим методом мы можем изучать комбинации более 100 регуляторов и видеть гораздо более сложную структуру сотрудничества".
Исследователи обнаружили, что паттерны совместного расположения белков на ДНК варьируются в зависимости от типа клеток и условий их роста. Многие из этих кластеров объясняются взаимодействиями между белками, причем не каждый белок связывается с ДНК напрямую.
"Мы хотели бы понять, как эти взаимодействия работают вместе, чтобы создавать разные типы клеток, и как они обретают свою уникальную идентичность в процессе развития", — сказал Снайдер. — "Кроме того, больные клетки будут иметь совершенно другую схему взаимодействий. Мы надеемся понять, как эти клетки сбиваются с пути".
