Выведение «темных данных» на свет: лучшие практики оцифровки гербарных коллекций
Национальный научный фонд США (NSF) через проект Integrated Digitized Biocollections (iDigBio) представил новый набор модулей рабочих процессов для оцифровки коллекций образцов растений, водорослей и грибов, хранящихся в гербариях.
Проблема: В гербариях Северной Америки хранится около 74 миллионов образцов, и лишь их небольшая часть доступна онлайн. Значительная часть этих «темных данных» остается неиспользованной.
Решение: iDigBio разработал 14 модулей рабочих процессов, каждый из которых состоит из 7–36 настраиваемых задач. Модули охватывают все этапы — от настройки станции для съемки до геопривязки, а также включают методы организации мероприятий для привлечения публики к обработке изображений и транскрипции данных.
Доступность: Модули доступны для скачивания в форматах PDF и редактируемых файлов на GitHub и сайте iDigBio. Полное описание опубликовано в сентябрьском выпуске журнала Applications in Plant Sciences.
Разработка: Модули стали результатом многолетней работы (с 2012 года), сотрудничества, виртуальных встреч, посещений гербариев, семинаров с участием более 50 исследователей и вклада 15 проектов по оцифровке, финансируемых NSF.
Цель: Создание единого онлайн-ресурса с миллионами оцифрованных записей образцов, который откроет новые возможности для биологических и экологических исследований, включая изучение еще не распознанных экологических, биологических и культурных взаимосвязей.
iDigBio финансируется программой NSF Advancing Digitization of Biodiversity Collections (ADBC) и предоставляет образовательные ресурсы по оцифровке учреждениям по всей территории США.
