Исследователи разработали DolphinGemma, первую большую языковую модель (LLM) для понимания языка дельфинов. Это могло бы помочь нам переводить то, что «говорят» эти невероятные существа, потенциально намного быстрее, чем мы когда-либо могли бы расшифровать это вручную.
Безумно? Или невероятно?
«Цель состоит в том, чтобы в один прекрасный день научиться говорить по-дельфиньи», — говорит доктор Дениз Герцинг. Ее исследовательская организация The Wild Dolphin Project (WDP) занимается исключительно изучением особой группы атлантических пятнистых дельфинов, обитающих на свободном выгуле у берегов Багамских островов.
Последние 40 лет она собирала и систематизировала звуки, издаваемые дельфинами, и работала с доктором Тэдом Старнером, ученым-исследователем из Google DeepMind, дочерней компании технологического гиганта в области искусственного интеллекта.

Объединив свои усилия, они обучили модель искусственного интеллекта на основе обширной библиотеки звуков дельфинов; она также может расширяться, чтобы вместить больше данных. Включение звуков дельфинов в модель искусственного интеллекта позволит ученым действительно хорошо понять, есть ли какие-то тонкости, которые люди не могут распознать и уловить в этих звуках животных.
Слова дельфина
Дельфины обычно общаются друг с другом с помощью различных свистков (некоторые из которых являются именами), эхолокационных щелчков, помогающих им охотиться, и звуковых импульсов в социальных контекстах.
С 1980-х годов исследователи записывали эти звуки с помощью гидрофонов, анализировали их, чтобы найти сходные закономерности со спектрограммами (визуальными изображениями звука, которые показывают, как меняется частотный состав сигнала с течением времени), а затем экспериментировали с дельфинами, воспроизводя эти звуки, чтобы понаблюдать за их поведением. Чтобы составить каталог звуков, издаваемых дельфинами, требуется много ручной работы.

Команда LLM, основанная на базовой технологии, которая используется в моделях Google Gemini и ее популярном чат-боте, использует сложные аудиотехнологии для представления звуков дельфинов в виде токенов. ИИ тщательно обучен акустической базе данных WDP о диких атлантических пятнистых дельфинах и обрабатывает последовательности издаваемых ими звуков, чтобы идентифицировать паттерны и структуру.
Google отмечает, что модель может практически предсказать вероятные последующие звуки в последовательности, подобно тому, как вы получаете предложения, когда ищете что-то в Интернете или составляете электронное письмо и вам нужна помощь в завершении предложения.
Читать далее →
Свежие комментарии