Новый алгоритм позволяет интегрировать данные с разрешением на уровне одной клетки
Команда вычислительных биологов разработала алгоритм, способный «выравнивать» несколько наборов данных секвенирования с разрешением на уровне одной клетки. Новый метод, опубликованный сегодня в журнале Nature Biotechnology, открывает возможности для лучшего понимания того, как различные группы клеток меняются в ходе прогрессирования болезни, в ответ на лекарственное лечение или в процессе эволюции.
«Этот подход к интеграции данных позволит сравнивать наборы данных по отдельным клеткам и анализировать различия между ними», — объясняет Рахул Сатджа, старший автор исследования, доцент Центра геномики и системной биологии Нью-Йоркского университета. «Более того, эти методы будут ценны для интеграции разнообразных наборов данных, полученных разными людьми и лабораториями — и даже для исследователей, изучающих одну и ту же ткань у разных видов».
Сфера секвенирования отдельных клеток быстро развивается, открывая потенциал для точного изучения функционирования и эволюции основных строительных блоков жизни. Однако остаются значительные вычислительные проблемы, особенно при анализе нескольких наборов данных. Например, когда команда независимо проанализировала наборы данных об одних и тех же стволовых клетках костного мозга, полученные двумя разными лабораториями, результаты оказались поразительно разными.
«Нам нужен был новый метод, который мог бы идентифицировать и выравнивать общие группы клеток, присутствующие в нескольких экспериментах, чтобы мы могли интегрировать наборы данных вместе», — говорит Эндрю Батлер, аспирант Нью-Йоркского университета и ведущий автор исследования.
Для этого исследователи модифицировали аналитические методы, специализирующиеся на поиске общих закономерностей в изображениях (например, для выравнивания визуализаций лиц при разном освещении), и применили их к данным секвенирования отдельных клеток. Когда они повторили анализ костного мозга, одни и те же популяции клеток стали появляться последовательно.
«Мы поняли, что можем использовать эти методы, чтобы изучать, как клетки меняют своё поведение — например, в ответ на лекарственное лечение», — отмечает Батлер.
Проанализировав набор данных об иммунных клетках человека, стимулированных интерфероном (сигнальным белком, вырабатываемым в ответ на патогены или опухолевые клетки), команда смогла точно определить, какие гены были включены в каждом из 13 типов клеток, давших ответ. Кроме того, они интегрировали наборы данных по отдельным клеткам поджелудочной железы человека и мыши, выявив 10 типов клеток, общих для обоих видов, и определив эволюционные изменения, происходящие в каждой группе.
В перспективе исследователи применяют свой подход для изучения клеточных реакций на лекарства в клинических образцах, а также стремятся сделать свои методы широкодоступными.
«Всё наше программное обеспечение имеет открытый исходный код и свободно доступно в сети», — добавляет Сатджа. «Мы надеемся, что эти методы помогут другим участникам научного сообщества открывать новые захватывающие биологические явления».
