NIST закладывает статистическую основу для ДНК-профилирования нового поколения в криминалистике

Надежность ДНК как судебного доказательства основана на статистике, которую эксперты используют при сравнении образцов с места преступления и подозреваемого. Эти статистические данные о совпадении помогают присяжным оценивать вину.

Данные о совпадении надежны благодаря строгим научным исследованиям, но они применимы только к профилям ДНК, созданным с помощью текущих технологий. Ученые из Национального института стандартов и технологий (NIST) заложили статистическую основу для расчета таких данных при использовании секвенирования нового поколения (NGS), которое создает более информативные ДНК-профили. Исследование, совместно финансируемое NIST и ФБР, опубликовано в Forensic Science International: Genetics.

"Для работы по уголовным делам необходимо уметь генерировать статистику совпадений. Наши опубликованные данные позволят лабораториям, использующим NGS, получать эту статистику", — заявила биолог NIST Кэтрин Геттингс, руководившая исследованием.

Как создается профиль ДНК

Для создания профиля ДНК криминалистические лаборатории анализируют участки ДНК — генетические маркеры, называемые короткими тандемными повторами (STR). В этих участках генетический код повторяется, и количество повторов у каждого человека различно. Аналитик подсчитывает количество повторов в каждом маркере, получая числовую последовательность для идентификации.

Профилирование на основе STR было разработано в 1990-х. Сегодня NGS делает секвенирование экономически эффективным. В отличие от традиционных профилей STR, профили на основе NGS включают фактическую генетическую последовательность внутри маркеров, что дает гораздо больше данных.

В большинстве случаев профилей STR достаточно для надежной идентификации. Однако, если доказательства содержат минимальное количество ДНК или она деградировала, можно получить лишь частичный профиль, которого может быть недостаточно. В таких случаях дополнительные данные профиля NGS могут помочь раскрыть дело. Они также полезны при анализе смешанных образцов ДНК от нескольких человек.

Расчет статистики совпадений

Расчет статистики совпадений для профилей STR возможен, потому что ученые измерили частоту встречаемости разных версий маркеров в популяции. Зная частоты, можно рассчитать вероятность случайного совпадения профиля.

NIST измерил эти частоты для STR годы назад, используя библиотеку из 1036 анонимных образцов ДНК. Для расчета частот для профилей NGS Геттингс и ее соавторы использовали эти же образцы. Они создали профили NGS, секвенировав 27 маркеров — базовый набор из 20 маркеров, используемых в США, плюс 7 дополнительных, — и рассчитали частоты различных генетических последовательностей для каждого маркера.

Хотя библиотека образцов небольшая, ученые измеряли частоты не для полных профилей, а для отдельных маркеров. Поскольку было секвенировано 27 маркеров, и каждый маркер встречается дважды в образце, общее число протестированных маркеров составило более 55 000.

Несмотря на публикацию необходимых данных, перед широким внедрением NGS в криминалистике предстоит преодолеть другие препятствия: управление большими объемами данных, разработка процедур и контроль качества. "Мы закладываем основу для будущего", — сказал Питер Валлоне, руководитель исследований в области судебной генетики NIST.

2018-07-23