Новый метод повышает эффективность и точность секвенирования РНК одиночных клеток

В эпоху персонализированной медицины для определения оптимального лечения используют генетические и геномные данные. При раке первый шаг — исследование поведения опухолевых клеток, чтобы подобрать лучшие препараты для их уничтожения.

Для этого применяют секвенирование ДНК и РНК, изучая экспрессию генов в образце раковой ткани. Однако традиционные методы могут скрывать неоднородность опухоли: не все клетки ведут себя одинаково. Из-за этого при терапии некоторые клетки могут выжить.

Ключевой прорыв в геномике — метод секвенирования РНК одиночных клеток (scRNA-seq). Он анализирует количество матричных РНК (mRNA) в отдельной клетке и сравнивает их с другими клетками для выявления различий в экспрессии генов.

Но интерпретация данных scRNA-seq зависит от условий эксперимента и анализа. Команда Лан Гармайр, доктора философии, из Мичиганской медицины, изучает способы устранения систематических ошибок, затрудняющих анализ.

«Много шума в этом типе секвенирования возникает из-за необходимости измерять образцы в крайне малых количествах и в разных партиях (batch effects)», — объясняет Гармайр. Например, образец ткани может не поместиться на одной планшете для анализа, и его делят на две части. Различия, возникающие из-за такого разделения, называют batch effects. Исследователям приходится корректировать эти эффекты, но возникает дилемма: как отличить артефакт от реальной разницы между клетками?

Новое применение данных

Биоинформатика — это сбор и анализ сложных биологических данных с помощью компьютерных программ. Это относительно новая область, возникшая благодаря возможности собирать огромные массивы данных, таких как последовательности ДНК и белков.

Исследователи полагаются на биоинформатические методы для определения экспрессии генов в одиночных клетках, но им приходится бороться с шумом, вносимым разными протоколами и batch effects. Гармайр обнаружила более эффективный способ выявления различий между клетками, используя те же данные секвенирования. Вместо анализа экспрессии генов она предложила смотреть на однонуклеотидные варианты (SNV), что снижает неопределенность. «С SNV вы работаете с бинарными числами, 0 и 1. Мутация либо есть, либо нет».

Гены состоят из нуклеотидов, обозначаемых буквами A, T, G и C, которые формируют код для синтеза белка. Метод Гармайр ищет различия в отдельных нуклеотидах, учитывая, что A может заменяться только на T, а G — на C. Эта новая работа, описанная в Nature Communications, разработала набор процедур для обработки данных scRNA-seq и извлечения информации о вариантах. Кроме того, с помощью компьютерной программы SSrGE можно связать эту информацию с традиционными данными об экспрессии генов.

«Это дает информацию о разных субпопуляциях опухолевых клеток и становится своего рода отпечатком, который можно использовать для идентификации межклеточных различий», — говорит Гармайр.

Практическое значение

В конечном итоге, производители лекарств и клиницисты используют эти мишени для разработки терапии. «Когда вы хотите атаковать проблему, вы делаете это, воздействуя на её фундаментальные особенности: мутации. Клиницисты смогут использовать эту информацию для выбора терапии». Гармайр надеется вывести биоинформатику из лаборатории, помогая исследователям анализировать большие массивы данных и разрабатывать клинические приложения. «Мы делим тело на части и специализируемся, но в конечном счете нужно смотреть целостно и спрашивать: что я делаю и кому это помогает? Мы разрабатываем вычислительные инструменты, чтобы объединить биоинформатиков, учёных-экспериментаторов и клиницистов, соединить точки и в итоге изменить ситуацию».

2018-11-21