Крупнейший набор данных SNP для тополей открывает перспективы для биотоплива, материалов и метаболитов
Исследователи из Национальной лаборатории Ок-Ридж (ORNL) Министерства энергетики США представили крупнейший в истории набор данных однонуклеотидных полиморфизмов (SNP), отражающий генетические вариации у тополей. Эта информация полезна как для ботаников, так и для учёных в областях биотоплива, материаловедения и вторичного метаболизма растений.
В течение почти 10 лет исследователи из Центра биоэнергетических наук (BESC) Министерства энергетики изучали геном Populus — быстрорастущего многолетнего дерева, признанного за свой экономический потенциал в производстве биотоплива. Теперь они опубликовали данные полногеномного поиска ассоциаций (GWAS), включающие более 28 миллионов SNP, полученных при повторном секвенировании примерно 900 генотипов тополя. Каждый SNP представляет собой вариацию в одном нуклеотиде ДНК и может служить биологическим маркером, помогая учёным находить гены, связанные с определёнными признаками.
Данные «дают нам беспрецедентную статистическую силу для связи изменений в ДНК с фенотипами [физическими признаками]», — заявил Джеральд Таскан, руководитель группы системной биологии растений в ORNL. Результаты этого анализа уже используются для поиска генетического контроля над рекальцитрантностью клеточной стенки — естественным свойством, которое препятствует высвобождению сахаров при микробной конверсии и тормозит производство биотоплива.
Учёные BESC также используют набор данных для выявления молекулярных механизмов, контролирующих отложение лигнина в структурах растений. Лигнин, укрепляющий клеточные стенки, является барьером для доступа к целлюлозе и её расщепления на простые сахара для ферментации.
С новым набором GWAS «мы можем идентифицировать гены и генетические варианты [аллели], которые направляют углерод по пути синтеза лигнина, а затем, с помощью геномной селекции, создать растительные материалы, адаптированные для работы с микробами для получения целевого продукта», — пояснил Таскан. Такими продуктами могут быть модифицированные лигнины, предназначенные для химикатов, полимеров и материалов.
Хотя наиболее очевидное применение данных — в науке о растениях, в ORNL планируют использовать их для исследований в области чистого и устойчивого транспортного топлива, углеродного волокна для облегчённых автомобилей, а также альтернатив обычным пластикам и строительным изоляционным материалам.
Польза может быть и для медицины: например, исследователи ORNL использовали данные по тополю для идентификации генов, контролирующих образование каллуса (клеток, покрывающих рану растения). Эта работа имеет значение для онкологических исследований.
«Гены, связанные с образованием каллуса, аналогичны многим генам, участвующим в образовании опухолей у человека», — отметил Таскан. Это открытие и связанная с ним сеть экспрессии генов могут проинформировать работу в рамках федеральной инициативы «Cancer Moonshot», направленной на ускорение прогресса в исследованиях рака.
Таскан подчеркнул важность технологического прогресса для этой работы. Возможности секвенирования и вычислительные мощности «сделали её возможной». Исследователи работают в сфере больших данных, и в национальной лаборатории есть необходимая платформа и инфраструктура для такого анализа.
В своей работе учёные использовали вычислительные ресурсы ORNL через программу Compute and Data Environment for Science (CADES), а также суперкомпьютер Titan в Oak Ridge Leadership Computing Facility.
Исследование также включает мониторинг и каталогизацию фенотипов тополей в регионах от южной Британской Колумбии до центральной Калифорнии. «Вся эта сложная геномика и вычислительная наука ничего бы не значили без полевых работ. Генетика, вычислительная наука, измерение и каталогизация фенотипов — это три опоры платформы, на которой мы стоим в BESC», — заявил Таскан.
Исследователи планируют расширять существующий набор данных и сотрудничать с другими научными группами для сбора и анализа дополнительных фенотипов.
Набор данных доступен по адресу: http://bioenergycenter.org/besc/gwas
