Как добровольцы классифицировали миллионы фотографий из Серенгети

В национальном парке Серенгети (Танзания) более 200 скрытых камер делают снимки днем и ночью, фиксируя скрытую жизнь самых неуловимых животных парка. Эти камеры — часть проекта Snapshot Serengeti.

Серенгети — невероятно разнообразная и динамичная экосистема, известная высокой плотностью крупных хищников и ежегодной миграцией 1,6 миллиона антилоп гну и зебр.

Исследователи столкнулись с проблемой: камеры, срабатывающие на движение и тепло, собрали более двух миллионов изображений за пять лет, что слишком много для обработки силами только ученых. Несмотря на прогресс в компьютерном зрении, распознавание сложных паттернов в таких условиях остается задачей, с которой лучше всего справляется человеческий мозг.

Экологи совместно с крупнейшей платформой гражданской науки The Zooniverse создали сайт Snapshot Serengeti. Он позволил добровольцам без специального образования определять и считать виды животных на каждом фото, используя фильтры по форме тела, окрасу, рисунку и даже форме хвоста.

Около 30 000 волонтеров откликнулись на призыв о помощи. Они ликвидировали 18-месячный бэклог из более чем миллиона классификаций всего за три дня. С момента запуска в 2012 году добровольцы продолжают классифицировать снимки быстрее, чем исследователи привозят новые из поля.

Надежность данных: Каждое изображение отправлялось нескольким добровольцам. Их ответы агрегировались в итоговый «консенсусный ответ» с помощью алгоритма, похожего на простое большинство голосов. Сравнение с экспертной классификацией более 4000 изображений показало, что добровольцы были правы в 97% случаев. Анализ расхождений в ответах позволяет предсказать, насколько сложно изображение, и направить экспертов именно на те 3% снимков, которые в этом нуждаются.

Результаты: Данные Snapshot Serengeti уже привели к новым открытиям. Например, они показали, как львы и гепарды делят одни и те же ценные участки территории, что может объяснять их сосуществование. Интеграция данных с камер и спутниковых снимков помогает изучать скрытые причины миграции гну и то, как жертвы балансируют между поиском пищи и риском быть съеденными.

Обработанные данные за первые три года проекта опубликованы в журнале Scientific Data и находятся в свободном доступе в репозитории Dryad Digital Repository. Это крупнейший в своем роде набор данных, который могут использовать исследователи из разных областей — от изучения редких видов до обучения компьютеров автоматическому распознаванию животных.

Успех Snapshot Serengeti демонстрирует огромный потенциал гражданской науки. Камеры позволяют собирать экологические данные, а добровольцы помогают превращать эти данные в новое научное знание, делая возможными исследования небывалого масштаба.

2015-06-10