Первый в своём роде интегрированный набор данных открывает путь к исследованиям «от генов до экосистем»

Учёные Министерства энергетики США под руководством Национальной лаборатории Ок-Ридж представили первый в истории набор данных, связывающий молекулярную информацию о микробиоме тополя с процессами на уровне экосистемы. Цель проекта — помочь исследованиям того, как функционируют природные системы, как они уязвимы к изменению климата и, в конечном итоге, как можно модифицировать растения для повышения их эффективности в качестве источников биоэнергии и естественного хранения углерода.

Данные, описанные в Scientific Data, содержат подробную информацию о 27 генетически различных вариантах (генотипах) Populus trichocarpa — тополя, представляющего интерес как биоэнергетическая культура.

Эти генотипы были ранее включены в полногеномное исследование ассоциаций, проведённое Центром инноваций в биоэнергетике под руководством ORNL, которое связало генетические вариации с физическими признаками деревьев. Исследователи собрали образцы листьев, почвы и корней с полей тополей в двух регионах Орегона: одном — более влажном, подверженном наводнениям, и другом — более сухом, подверженном засухе.

Новый интегрированный набор данных охватывает широкий спектр информации: от генетического состава деревьев и экспрессии генов до химии почвенной среды, анализа микробов, живущих на деревьях и вокруг них, и соединений, производимых растениями и микробами.

Набор данных «беспрецедентен по своему размеру и охвату», — заявил сотрудник ORNL Митчел Доктич, руководитель проекта. — «Он ценен для ответа на множество различных научных вопросов». Используя машинное обучение и статистические подходы для анализа данных, учёные смогут лучше понять, как генетический состав, физические признаки и химическое разнообразие Populus связаны с такими процессами, как круговорот азота и углерода в почве.

«Знания, полученные на этом растении, будут использованы в проектах по производству биотоплива из тополя», — сказала Мелани Мэйес, участница проекта. — «Процедура, которую мы здесь создали, понадобится для биоинженерии других растений и поможет повысить устойчивость к изменению климата — для улучшения хранения углерода в почве и сокращения выбросов парниковых газов».

Полный набор данных составляет более 25 терабайт. Ссылки на данные доступны в рамках Национального совместного проекта данных о микробиомах (NMDC) — инициативы Министерства энергетики по обмену данными о связи микробиомов с экологическими процессами.

«Набор данных представляет собой крупнейшее общедоступное хранилище метагеномных данных об эндофере дерева» — внутренней среде растительной ткани, где обитают сложные микробные сообщества, — сказал Кристофер Шаадт, со-руководитель проекта.

Детальный анализ образцов привёл к созданию 318 метагеномов, раскрывающих разнообразие микробов, живущих в деревьях и вокруг них, с помощью генетического секвенирования. 98 растительных транскриптомов предоставляют информацию о полном спектре молекул матричной РНК (mRNA), экспрессируемых в корнях растений. Набор данных включает 314 метаболомных профилей, дающих информацию о малых молекулах, производимых растениями и микробами в процессе роста или в ответ на стресс.

Также включены данные о связанных физических и биогеохимических характеристиках почвы, исследующие присутствующие химические вещества и их круговорот в окружающей среде.

Интеграция этих «мульти-омиксных» данных предоставит учёным, изучающим связь молекулярных и клеточных событий в растениях с процессами и поведением экосистем, важнейшую информацию.

Понимание триггеров круговорота азота в растениях и почве

Совместный институт геномики (JGI), пользовательский объект Управления науки Министерства энергетики в Национальной лаборатории Лоуренса Беркли, был ключевым партнёром проекта. JGI провёл метаболомное профилирование листьев, корней и ризосферы (почвенной среды вокруг корней), секвенирование транскриптомов корней растений, а также метагеномные исследования ризосферы и эндоферы почвы.

«Сочетание метагеномики и метаболомики листьев, корней и почв вместе с транскриптомами растения-хозяина делает этот набор данных по-настоящему уникальным для научного сообщества и может служить центральным ресурсом для изучения взаимодействий растений и микробов», — сказала Эмили Эло-Фэдрош, руководитель программы метагеномики в JGI.

Проект начался как пилотный проект ORNL под названием Bio-Scales, поддержанный Отделом биологических системных наук в рамках программы BER Управления науки Министерства энергетики. Bio-Scales направлен на лучшее понимание взаимоотношений растений и микробов с акцентом на круговорот азота. Азот — важнейшее питательное вещество для жизни, но при чрезмерном использовании в сельском хозяйстве он может ухудшать качество воды или выделяться в виде мощного парникового газа — закиси азота (N2O).

«Проект потребовал интеграции множества разнообразных экспертиз», — сказал Доктич. — «Всё началось с команды, которая в разгар COVID-19 выехала на место, чтобы собрать все эти разнообразные материалы, доставить их в лабораторию, а затем подготовить, проанализировать и извлечь из них данные. У нас также была невероятная техническая команда поддержки, которая обработала сотни этих образцов отслеживаемым и скоординированным образом, взаимодействуя с JGI для анализа последовательностей».

Помимо масштаба, набор данных выделяется обширными метаданными — с точными деталями, например, о месте и способе отбора проб, а также стандартным форматом для последующей отчётности по данным. Добавление этих элементов облегчает поиск, понимание и повторное использование информации.

Стэнтон Мартин из ORNL, руководивший управлением данными проекта в тесной координации с NMDC, отметил, что подход, ориентированный на данные, поддерживает использование искусственного интеллекта и других аналитических методов для решения научных вопросов.

«Управление данными, которое мы выполнили в этом проекте, чрезвычайно ценно для практик работы с данными в других проектах... Оно играет на сильных сторонах ORNL в том, что я называю тремя V управления данными — объём, разнообразие и скорость данных — и позволило нам сделать первый шаг в интеграции очень больших «омиксных» данных так, как это не делалось раньше».

Проект начался с поездки Шаадта и Мэйес в Орегон для отбора проб. «В обычных условиях нас было бы шесть учёных, но из-за пандемии действовали ограничения на совместные поездки групп», — сказал Шаадт. Им также пришлось работать в условиях приближающихся лесных пожаров, так как в том году в Орегоне был активный пожарный сезон. Шаадт и Мэйес с помощью волонтёров из Университета штата Орегон собрали обширные геотегированные образцы на двух участках.

Полезная биоинженерия

Мэйес заявила, что проект «касается роли генов в влиянии не только на судьбу самого растения, но и на окружающую его среду, такую как почва. Например, мы хотели понять потенциал почвенных микробов либо производить больше нитратов, либо удалять избыток нитратов из системы. Мы хотели больше узнать о том, как геномика растений влияет на деятельность почвенных микробов».

Знания о круговороте азота в растениях и почве могут повлиять на выбросы N2O — газа, на который приходится 6% всех выбросов парниковых газов в США.

«Если знать, на какие гены нужно воздействовать, чтобы минимизировать производство N2O или нитратов, то появляется потенциал повлиять как на потепление, связанное с парниковыми газами, так и на качество воды», — сказала Мэйес. — «Можно, например, отбирать и далее биоинженерно улучшать растения с наилучшим генетическим профилем для контроля этих выбросов».

«Этот проект уникален, потому что он затрагивает связь между геномами растений и экологическими результатами, такими как выбросы закиси азота или производство нитратов», — сказала Мэйес. — «Создание одного из первых комплексных наборов данных о взаимоотношениях растений и микробов также показывает, как много нам ещё предстоит узнать».

2024-04-08