Исследование разнообразных бактерий — большой шаг вперёд для предсказания функций генов
Микробы — крошечные, но мощные силы, регулирующие биогеохимические циклы планеты. Чтобы понять их роль, учёные стремятся идентифицировать их и определить вклад каждого. Хотя технологии секвенирования позволили получить тысячи микробных геномов, задача определения функций обнаруженных генов остаётся узким местом.
Чтобы преодолеть это, учёные из Национальной лаборатории Лоуренса в Беркли (Berkeley Lab), включая исследователей из Объединённого института генома (JGI) Министерства энергетики США (DOE), разработали рабочий процесс для крупномасштабного, полногеномного анализа важности генов во многих условиях. Исследование "Mutant Phenotypes for Thousands of Bacterial Genes of Unknown Function" опубликовано в журнале Nature и является крупнейшим в истории функционально-геномным исследованием бактерий.
"Это первая действительно крупная систематическая экспериментальная попытка присвоить функции бактериальным генам с неизвестной функцией", — сказал старший автор исследования, биолог Адам Дойчбауэр. "Мы решаем проблему, которую признаёт биология: секвенировать очень легко, но мы не можем с уверенностью определить функции для большинства генов, идентифицированных секвенированием. Наши экспериментальные данные — это якорь, который другие исследователи могут использовать для более обоснованного вывода о функции белка".
Протестированный на почти трёх десятках бактерий различных родов, рабочий процесс объединил высокопроизводительную генетику и сравнительную геномику для идентификации мутантных фенотипов тысяч генов с ранее неизвестными функциями.
Технология для понимания генетического потенциала Земли
Команда работала с 32 бактериями, включая бактерии, способствующие росту растений, цианобактерии, важные для производства биотоплива, и бактерии, участвующие в биоремедиации. "Здесь у вас есть данные сразу по 32 разным бактериям, что охватывает больше микробного разнообразия", — отметил соавтор исследования, учёный JGI Мэтт Блоу.
Для более эффективного создания мутантных библиотек для каждой бактерии команда усовершенствовала подход секвенирования с ДНК-штрихкодами, известный как RB-TnSeq (randomly bar-coded transposon sequencing). "Эта работа может быть масштабирована для существенной пользы в понимании генетического потенциала Земли", — сказал старший научный сотрудник и соавтор Адам Аркин.
Консервативные фенотипы указывают на функциональные связи
Полученный большой набор данных позволил команде получить представление о консервативных фенотипах у разных организмов, а также искать паттерны ко-фитнеса среди генов — случаи, когда два гена имели сходные паттерны фенотипов во всех условиях, что предполагает их возможную принадлежность к одному пути. Например, они обнаружили, что гены с неохарактеризованным белковым доменом UPF0126 были важны для роста на глицине у 11 разных бактерий, что предполагает участие этого домена в транспорте глицина через клеточную мембрану.
"Сравнительное функционально-геномное исследование бактерий раньше было практически невозможно, потому что большие генетические наборы данных были доступны лишь для нескольких бактерий", — пояснил Дойчбауэр. "Хотя мы экспериментально изучили относительно небольшое число бактерий по сравнению с разнообразием в природе, наши данные имеют отношение ко всем бактериям. Например, около 12% всех неохарактеризованных белков у бактерий имеют гомологичный белок с функциональной фенотипической ассоциацией в нашем наборе данных".
Набор данных общедоступен для сравнительного анализа на платформе fit.genomics.lbl.gov. Аркин также видит будущие преимущества от интеграции этого набора данных в такие системы, как IMG/M от JGI и DOE Systems Biology Knowledgebase (KBase).
"Эти наборы данных предоставляют фантастическую возможность для инноваций в области data science для предсказания биологической функции", — сказал Аркин, который является CEO и ведущим исследователем KBase.
