PAGA: алгоритм для анализа сложных данных о клетках
Исследователи из Helmholtz Zentrum München и Технического университета Мюнхена представили компьютерный алгоритм PAGA. Он создаёт основанные на данных, легко интерпретируемые карты, которые раскрывают клеточные процессы и судьбы клеток в сложных контекстах. Работа опубликована в Genome Biology.
Проблема больших данных
Экспериментальные молекулярные анализы с разрешением на уровне одной клетки генерируют большие и сложные данные. Исследователи получают информацию не только о самих клетках, но и об их взаимодействиях с другими клетками и типами тканей. Ранее не было возможности чётко и понятно моделировать сложные процессы на клеточном уровне.
Как работает PAGA
До сих пор для анализа данных использовали два подхода:
- Кластеризация — поиск клеток со схожими свойствами и их группировка.
- Траекторный анализ — описание временной последовательности клеток вдоль их путей развития.
PAGA объединяет возможности обоих подходов в рамках единого анализа и метода. В зависимости от желаемого разрешения, инструмент группирует клетки по типу (например, клетки кожи) и биологическому состоянию (например, клетки в процессе митоза), а также выявляет переходы между типами и состояниями клеток.
Применение в исследованиях
- Реконструкция клеточного древа: Mireya Plass (Центр молекулярной медицины Макса Дельбрюка) с коллегами восстановила первое клеточное древо взрослого животного. Science назвал это одним из главных научных прорывов 2018 года.
- Изучение эмбрионального развития: Команда под руководством Blanca Pijuan-Sala (Кембриджский университет) использовала PAGA для реконструкции процессов развития эмбриона мыши.
- Клинический контекст: Исследователи из Broad Institute of MIT и Harvard применили PAGA для определения линий кишечных клеток, что помогло понять вклад разных клеток в развитие хронического воспалительного заболевания кишечника.
По словам профессора Фабиана Тайса, с помощью PAGA можно анализировать практически любое биологическое явление, которое можно связать с клеточным процессом, при наличии соответствующих данных.
