Оценка генотипирования микросателлитов по низкокачественной ДНК с помощью математической модели

Неинвазивный отбор проб используется в исследованиях исчезающих видов животных. Его преимущество — получение образцов без воздействия на целевых животных. Однако качество ДНК, полученной такими методами, часто низкое, что может влиять на надёжность результатов. Профессора Ли Баого и Го Сунтао из Северо-Западного университета исследовали эту проблему. Их работа «Оценка надёжности генотипирования микросателлитов по низкокачественным матрицам ДНК с помощью полиномиальной модели распределения» опубликована в Chinese Science Bulletin (2011, Vol 56 (24)).

ДНК-матрицы из неинвазивных образцов, музейных экспонатов, древней ДНК и криминалистических проб часто деградированы или загрязнены. Количество целевой ДНК для генетического типирования может быть очень низким, часто в пикограммовом диапазоне. При использовании такой ДНК для микросателлитного профилирования могут возникать ложные гомозиготы и ложные аллели, ведущие к ошибочным результатам. Для снижения вероятности ошибок был разработан метод множественных пробирок, при котором ДНК распределяется по нескольким пробиркам. По сравнению с однопробирочным подходом, этот метод даёт более надёжное генотипирование из разбавленных образцов. Однако использование множественных ПЦР-реплик может привести к полному расходу образца, особенно при анализе многих локусов. В целом, чем меньше количество матрицы в ПЦР, тем выше вероятность ошибок генотипирования и тем больше требуется ПЦР-реплик.

Оценка надёжности генотипирования микросателлитов с использованием низкокачественной ДНК помогает оптимизировать экспериментальный протокол. В данном исследовании авторы задались вопросами: (i) сколько амплификаций требуется для достижения заданного уровня достоверности? и (ii) как рассчитать уровень достоверности протокола? Для ответа была разработана математическая модель, раздельно рассматривающая гомо- и гетерозиготы, для измерения качества образца. В модели два параметра измеряют качество образцов: частота корректного определения гетерозигот (R1) и гомозигот (R2) в положительных ПЦР. Результаты используются для расчёта уровня достоверности метода множественных пробирок.

Для проверки модели использовали образцы вырванных волос, собранные у 26 особей золотистой курносой обезьяны (Rhinopithecus roxellana). Было обнаружено, что уровня достоверности в 99% можно достичь при 3 положительных ПЦР.

Был рассчитан набор минимальных порогов качества образца для метода генотипирования с множественными пробирками при уровне достоверности 99%. Результаты показывают, что минимальный порог R1 снижался, а минимальный порог R2 увеличивался с ростом числа повторов амплификации. После 8 положительных ПЦР с m = 1 минимальный порог R1 был равен нулю, что указывает: если концентрация матрицы крайне низка, каждая положительная ПЦР может детектировать только один аллель гетерозиготы. Восемь положительных ПЦР гарантируют появление каждого аллеля хотя бы один раз с вероятностью 99%. Аналогично, 12 и 15 положительных ПЦР гарантируют появление каждого аллеля хотя бы два и три раза соответственно.

Для микросателлитного генотипирования с использованием низкокачественной ДНК при большом размере выборки авторы рекомендуют перед основными экспериментами оценить качество образца, проведя по 5 положительных ПЦР для каждого локуса у нескольких случайно выбранных особей и генотипировав их с m = 3 для получения параметров (наблюдаемых значений R1 и R2). Для образцов ДНК хорошего качества предлагается 3 положительные ПЦР и генотипирование с m = 2. Если первые две ПЦР дают одинаковые генотипы, третья не требуется, так как не повлияет на консенсусный генотип. Для плохих образцов (обычно с низкой частотой ложных аллелей, но высокой частотой потери аллеля) описанный выше подход требует слишком многих реплик. В этом случае можно использовать альтернативный многоступенчатый метод, позволяющий минимизировать число повторов. Моделирование показывает, что этот метод может устранить около трети требуемых реплик.

Представленная математическая модель позволяет исследователям оптимизировать экспериментальные протоколы через пилотные исследования и получать надёжную генетическую информацию с использованием неинвазивных методов отбора проб. По сравнению с другими методами для той же цели, эта модель оценивает качество образца, учитывает эффекты ложных аллелей и проще в использовании.

2011-09-02