Новый метод spVelo отслеживает изменения экспрессии генов для изучения клеточных судеб

Почти все клетки организма имеют одинаковый генетический план (геном), но их тип и функция определяются набором активно экспрессируемых генов в данный момент. Скорость изменения экспрессии генов в отдельной клетке может раскрыть механизмы специализации клеток, но существующие методы измерения ограничены. Новый метод, разработанный учёными из Университета Пенсильвании и Йельского университета, учитывает пространственную информацию о клетке и данные из клеток, обработанных в разное время, что улучшает понимание нюансов изменений экспрессии генов.

Метод, названный spVelo, описан в журнале Genome Biology. Он вычисляет RNA velocity (скорость РНК), которая описывает направление и скорость изменения во время транскрипции — этапа экспрессии генов, на котором генетический код копируется.

Во время экспрессии генов ДНК сначала транскрибируется в матричную РНК (mRNA), которая несёт код для синтеза белков. Однако не вся последовательность mRNA используется; сначала происходит сплайсинг, удаляющий некодирующие сегменты — интроны — и соединяющий кодирующие экзоны. Сплайсированные mRNA затем могут быть транслированы в белковую последовательность.

С помощью метода single-cell RNA sequencing (scRNA-seq) исследователи могут подсчитать количество сплайсированных и ещё не сплайсированных цепей РНК. Моделируя взаимосвязь между количеством сплайсированной и несплайсированной РНК, можно определить, активируется или подавляется экспрессия гена. Эта скорость изменения сплайсированной экспрессии — RNA velocity — это снимок генов, которые активно включаются или выключаются в клетке, и её можно использовать для предсказания будущей экспрессии.

Ключевые улучшения метода spVelo:

  • Учёт множества партий данных: Метод может учитывать различия между несколькими партиями (батчами) данных, полученных в разное время или разными группами, что позволяет интегрировать гораздо больший объём информации в один анализ.
  • Интеграция пространственной информации: Метод включает данные о местоположении клетки в ткани, что стало возможным благодаря новым типам данных секвенирования.
  • Использование нейронных сетей: Для преодоления прежних ограничений метод использует два типа нейронных сетей:
    • Variational Autoencoder для моделирования экспрессии генов.
    • Graph Attention Network для включения пространственной и батч-информации.
  • Оценка достоверности: В отличие от предыдущих методов, spVelo предоставляет меру уверенности в предсказаниях, показывая, насколько вероятен переход клетки в тот или иной тип или подтип.

Метод был протестирован на наборе данных по экспрессии генов при плоскоклеточном раке полости рта и на смоделированном пространственном наборе данных клеток поджелудочной железы. spVelo показал сопоставимые или лучшие результаты по различным параметрам и смог выявить более сложные траектории развития клеток, указывая на возможные будущие типы или подтипы клеток.

Потенциальные применения метода включают исследование генных регуляторных сетей (например, путём сравнения RNA velocity в нормальной клетке и клетке с удалённым геном), а также изучение того, как клетки взаимодействуют друг с другом и с какой скоростью, отслеживая изменения RNA velocity во времени.

2025-09-06