Раскрытие времени ветвления в данных одноклеточной омики

Новая технология одноклеточной омики позволяет учёным анализировать развитие клеток способами, ранее недоступными. Исследователи теперь могут выявлять никогда ранее не виданные паттерны и феномены в больших количествах клеток, получая информацию о геномах, экспрессии генов и клеточной гетерогенности для тысяч клеток одного организма одновременно. Эта новая технология была названа журналом Science «Прорывом 2018 года».

Гора данных одноклеточной омики огромна и прекрасна, но с этими данными возникает новая проблема больших данных: необходимо извлечь из них интересные и полезные знания. Как объединить клетки (представленные точками в многомерном пространстве) в траектории их развития? Как найти точки ветвления, бифуркации, где клетки выбирают и меняют свою «специализацию»?

Траектории развития со всеми их особенностями и сингулярностями формируют так называемое ветвящееся псевдовремя развития. Технологию для решения этих проблем разработала международная команда, включающая профессора Александра Горбана, директора Центра математического моделирования и профессора прикладной математики Университета Лестера. Работа опубликована на этой неделе в журнале Nature Communications.

Новая технология, названная STREAM (Single-cell Trajectories Reconstruction, Exploration and Mapping), — это интерактивный конвейер, способный распутывать и визуализировать сложные ветвящиеся траектории как из транскриптомных, так и из эпигеномных данных одноклеточного уровня. Она позволяет учёным анализировать развитие клеток способами, ранее невозможными.

STREAM обнаруживает потенциальные маркерные гены разных типов:

  • Дивергирующие гены — важные для определения точек ветвления, дифференциально экспрессирующиеся между расходящимися ветвями.
  • Гены перехода — экспрессия которых коррелирует с псевдовременем клетки на данной ветви.

STREAM включает продвинутые инструменты для визуализации ветвящегося псевдовремени в виде карты метро или графика потока, а также для нанесения новой клетки или плотности клеток на график псевдовремени.

Математическое ядро STREAM основано на методах главных упругих графов и топологических грамматик, разработанных в Университете Лестера в сотрудничестве с Институтом Кюри в Париже. Базовые алгоритмы были переработаны в открытое программное обеспечение ElPiGraph большой международной командой. Конечный продукт, STREAM, был спроектирован, реализован и протестирован большой командой из 17 институтов шести стран и теперь свободно доступен на github.

Профессор Горбан возглавлял группу исследователей в Лестере. По поводу публикации статьи и запуска программного обеспечения он сказал: «Я очень счастлив — это огромное удовольствие видеть, как наши конструкции главных графов и топологических грамматик, разработанные совместно с Андреем Зиновьевым из Института Кюри и Евгением Миркесом из Лестера, превращаются в эффективный универсальный инструмент для извлечения топологических и геометрических особенностей из сложных данных, а затем — в новую технологию для анализа данных одноклеточного уровня».

Профессор Рейко Хеккель, профессор программной инженерии Университета Лестера и президент Европейской ассоциации науки и технологий программного обеспечения (EASST), отметил: «Графовые грамматики, лежащие в основе топологических грамматик, позволяющих нам обнаруживать упругую графовую структуру за данными, разрабатывались более 40 лет как математический инструмент для описания и аналогии генерации и манипуляции графами. Их приложения варьируются от математики и информатики до биологии и инженерии. Подход STREAM представляет собой оригинальное и значительное расширение сферы их применения в область анализа больших данных».

Доктор Андрей Зиновьев, научный координатор команды «Вычислительные системы биологии рака» Института Кюри в Париже, сказал: «В настоящее время многие группы разрабатывают вычислительные методы для выявления ветвящегося псевдовремени в данных одноклеточного уровня, но STREAM с его алгоритмическим ядром ElPiGraph выделяется в нескольких аспектах:

  • Это очень удобный инструмент, который можно использовать как простое онлайн-приложение, обеспечивающее глубокую визуализацию данных.
  • Он применим к очень большим наборам данных и может выдерживать высокий уровень шума в данных, что важно для молекулярных измерений на одноклеточном уровне.
  • STREAM был протестирован на впечатляющем количестве существующих данных и в среднем показал более надёжные результаты, чем другие инструменты.

Он уже используется нашими группами-партнёрами для понимания свойств клеток, находящихся в опухолевом микроокружении, или для изучения внутриопухолевой гетерогенности детских раков. Мы видим потенциальные применения STREAM в проектах «Атлас клеток человека» (Human Cell Atlas) и европейском флагманском проекте LifeTime, оба направлены на понимание человеческого организма на одноклеточном уровне и уже генерируют беспрецедентное количество молекулярных данных».

2019-05-09