Криптографический метод защищает генетическую приватность при криминалистическом ДНК-профилировании
Анализ ДНК с места преступления помогает идентифицировать преступников, но текущие методы могут раскрывать генетическую информацию невинных людей. Исследователи из Стэнфорда утверждают, что криптография может защитить генетическую приватность, не мешая работе правоохранительных органов.
Однако некоторые криминальные базы данных сохраняют ДНК-профили, найденные на месте преступления или взятые у подозреваемых, даже если они в итоге не связаны с преступлением. В некоторых штатах генетические образцы также собирают и хранят у людей, которые были арестованы, но не обязательно осуждены, за определённые преступления.
Этот процесс приводит к де-факто генетическому профилированию многих тысяч невинных американцев и может быть серьёзным нарушением гражданских прав.
Анонимное взаимодействие
Гилл Беджарано и его коллеги разработали передовые криптографические методы для поиска совпадений при сохранении генетической приватности подозреваемого. После завершения сравнения проверенные ДНК-профили, не совпавшие ни с одним в базе данных, могут быть немедленно удалены.
Исследование было опубликовано в Nature Computational Science 26 апреля.
«С помощью этой техники мы можем запрашивать базу данных с генетическим профилем человека, не внося эту информацию в саму базу», — сказал Беджарано. «Это анонимное взаимодействие, и этот профиль существует только на устройстве, на котором он был собран. Когда агент нажимает "удалить", этот профиль исчезает».
Использование ДНК для расследования преступлений началось в 1980-х годах. В 1994 году ФБР было уполномочено создать Национальную систему индексов ДНК (NDIS), которая содержит ДНК-профили, собранные почти 200 государственными криминалистическими лабораториями. CODIS (Combined DNA Index System) относится как к поддержке ФБР баз данных ДНК для уголовного правосудия, так и к программному обеспечению для их работы. Однако всё чаще города и штаты также ведут собственные базы данных ДНК, которые не связаны с системой ФБР и менее регулируемы.
Полиция может получить информацию о ДНК из образцов с места преступления или с помощью мазка изо рта, используя прибор размером с чемодан. За около двух часов прибор анализирует ДНК в 13–20 высоковариабельных участках генома, генерируя последовательность из примерно 40 чисел, которая уникально идентифицирует каждого человека, как своего рода генетический штрих-код.
В настоящее время есть два способа поиска совпадения между ДНК-профилем человека и содержимым большой базы данных ДНК: напрямую передать образец в базу данных или загрузить всю базу данных на прибор. Если профиль передаётся в базу, его могут сохранить, даже если человек невиновен. Но многократная загрузка большой базы чувствительных генетических данных также не идеальна из-за проблем безопасности.
«Как игра в 20 вопросов»
Чтобы решить эти проблемы, Беджарано и его коллеги написали короткий фрагмент программного кода, который можно установить как на компьютеры базы данных, так и на прибор. Код позволяет двум сторонам «общаться» друг с другом и проводить сравнение косвенно, в виде серии инструкций «если это, то то».
«Это как игра в версию "20 вопросов"», — сказал Беджарано. «Центральная база данных говорит: "Если у вас есть это число в этом месте, идите сюда, но если у вас есть то число, идите туда". Полевое устройство следует серии инструкций, соответствующих имеющемуся у него профилю, и в конце сотрудник правоохранительных органов узнает, совпадает ли его профиль с каким-либо в базе данных, и ничего больше. А база данных ничего не узнаёт о профиле в руках агента».
Это быстро и эффективно. «Это занимает 40 секунд и всего 180 МБ для запроса к миллиону профилей», — сказал Беджарано. «И это легко внедрить. Мы широко выпускаем код, и правоохранительные органы могли бы начать использовать его завтра, если бы захотели».
Изначально Беджарано и его коллеги не фокусировались на системе уголовного правосудия. Его прошлые исследования были посвящены помощи клиницистам в диагностике тяжёлых детских заболеваний, таких как муковисцидоз, при защите генетической приватности пациентов. Но недавние события изменили траекторию исследований.
«Убийство Джорджа Флойда заставило нас задуматься и исследовать», — сказал Беджарано. «Базы данных CODIS существуют на национальном, государственном и даже местном уровнях. Правоохранительные органы склонны профилировать неблагополучные районы, и иногда они сохраняют все профили, независимо от того, были ли эти люди осуждены за преступление. Мы поняли, что технология, над которой мы работали, идеально подходит для борьбы с этим типом дискриминации».
Поскольку другие, похожие базы данных ДНК для уголовного правосудия используются во многих других странах, внедрение алгоритма команды может иметь широкие последствия.
«Нам нужно решить», — сказал Беджарано. «Если геномная приватность — это ценность, которую мы как общество лелеем, нам нужно начать думать о таких инструментах и внедрять их. Этот подход позволяет нам и съесть пирог, и сохранить его — оставить мощный инструмент для уголовного правосудия, одновременно сохраняя за законопослушными гражданами свободу сохранять свою генетическую информацию в тайне».
