ИИ превосходит людей в обнаружении голосов синих китов

Ученые, изучающие китов, вскоре могут лишиться работы — или, по крайней мере, утомительной и рутинной её части — благодаря применению искусственного интеллекта (ИИ) в исследованиях.

Используя машинное обучение, команда из Австралийского антарктического дивизиона, Центра биоакустики сохранения K. Lisa Yang при Корнеллском университете и Университета Кертина обучила алгоритм обнаруживать "D-позывы" синих китов в аудиозаписях с большей точностью и скоростью, чем эксперты-люди.

Акустик по китам доктор Брайан Миллер заявил, что эта технология позволит ученым легче анализировать сотни тысяч часов записей этих неуловимых и сложных для изучения китов, чтобы лучше понимать тенденции в их популяциях по мере восстановления от китобойного промысла.

Социальные позывы

D-позывы считаются "социальными" сигналами, издаваемыми самцами и самками китов на кормовых территориях. В отличие от "песен" самцов синих китов, которые имеют регулярный и предсказуемый паттерн, D-позывы сильно различаются у отдельных особей, а также в зависимости от сезона и года.

Эта изменчивость затрудняет автоматизацию анализа записей по сравнению с постоянным звуком.

Чтобы преодолеть это, команда обучила алгоритм на обширной библиотеке из примерно 5000 D-позывов, записанных за 2000 часов звука с участков вокруг Антарктиды в период с 2005 по 2017 год.

Перед началом обучения шесть разных экспертов-аналитиков прослушали записи и идентифицировали или "аннотировали" D-позывы. Позывы были преобразованы в "спектрограммы" — визуальные представления каждого сигнала и его продолжительности.

Используя методы машинного обучения, алгоритм обучился идентифицировать D-позывы на 85% данных из библиотеки, используя оставшиеся 15% для самопроверки и улучшения.

Человек против машины

Обученный ИИ затем получил тестовый набор данных из 187 часов аннотированных записей за 2019 год с базы Кейси.

Исследовательская команда сравнила количество обнаруженных ИИ D-позывов с теми, что идентифицировали эксперты-люди, чтобы увидеть расхождения. Независимый судья-человек (доктор Миллер) определил, какие из спорных сигналов являются D-позывами, чтобы вынести окончательное решение о том, кто точнее.

Результаты:

ИИ обнаружил около 90% D-позывов, а человек — чуть более 70%.
ИИ лучше справлялся с обнаружением очень тихих звуков.
На аннотацию тестового набора данных у человека ушло около 10 часов, а ИИ проанализировал эти данные за 30 секунд — в 1200 раз быстрее.

Команда сделала свой ИИ доступным для других исследователей китов по всему миру, чтобы обучить его на других звуках китов и акустических ландшафтах.

Исследование опубликовано в журнале Remote Sensing in Ecology and Conservation.

2022-09-28