Сможем ли мы когда-нибудь понять богатый язык животных?
На первый взгляд, это был обычный день полевых наблюдений. Но для профессора Кона Слободчикова и его команды каждый тихий писк, каждое движение хвоста были захватывающим открытием.
В 2011 году крики луговых собачек, которые для человеческого уха звучат как монотонное «чи-чи», превратились в своего рода ребус. Сначала Слободчиков заметил, что при приближении хищника — ястреба, койота или даже человека — грызуны издают вроде бы похожий сигнал тревоги.
Однако углублённый анализ звуков выявил поразительный факт: за разными криками скрывается подобие «языка», состоящего из существительных (кто вторгся — «койот!», «человек!») и описаний (как он выглядит — «жёлтый», «худой»).
Затем наступил самый удивительный момент: когда исследователи попытались показать луговым собачкам формы, которых те никогда не встречали, — например, чёрный эллипс или треугольник, — они отреагировали новым криком, который никогда ранее не регистрировался. Как будто они создали новое «слово» из ничего, прямо на глазах у изумлённых учёных.
Профессор Слободчиков и его команда поняли, что, вооружившись статистикой и толикой удачи, можно прорвать барьер языка животных. И луговые собачки, похоже, были только началом.
Симфония кашалота
В последние годы, по мере стремительного развития искусственного интеллекта, исследователи по всему миру пытаются расшифровать языки и других животных,
Например, участники проекта CETI (Cetacean Translation Initiative, «Инициатива по расшифровке коммуникации китообразных») сидят на исследовательских судах у побережья Доминики и вслушиваются в глухие щелчки, доносящиеся из морских глубин. Они собирают тысячи записей и с помощью ИИ постепенно раскрывают богатый акустический язык, сложность которого напоминает музыкальный синтаксис — с ритмом, мелизмами (украшениями) и «фрагментами фраз», которые можно соединять и разъединять, почти как в алфавите.
После тысяч часов записей и анализа данных исследователи CETI в сотрудничестве с учёными из MIT опубликовали в этом году прорывное исследование: впервые был представлен «фонетический алфавит» кашалотов. Выяснилось нечто поразительное: язык китов не сводится к простой последовательности щелчков. Он построен на богатой комбинаторной структуре, в которой сочетаются ритм, темп, изменения тона и музыкальные украшения.
Как и в симфоническом произведении, малейшее изменение в способе выражения может изменить смысл сообщения. Исследователи полагают, что это система коммуникации с внутренним синтаксисом и сложным разнообразием выражений, не имеющая известных аналогов в животном мире.
Долгие годы наука была склонна рассматривать общение животных как ограниченную систему: сигналы бедствия, призывы к спариванию, предупреждения об опасности. Новые данные намекают на нечто совершенно иное. Возможно, кашалоты ведут между собой насыщенные беседы, сложные диалоги, быть может, даже передающие эмоции, намерения или социальную информацию.
Исследователи CETI поставили перед собой амбициозную цель: расшифровать язык, определить его структуру, а в будущем — вести диалоги с этими китами на их собственном языке.
Мечта доктора Дулиттла
Стремление понять язык животных — и, возможно, даже поговорить с ними — сопровождает человечество тысячи лет. Царю Соломону приписывали способность говорить с животными: согласно легенде, после того как его ужалила пчела, и он поговорил с ней, она пообещала отплатить ему добром — и действительно, годы спустя помогла ему разгадать загадку царицы Савской. Раши (комментатор Торы и Талмуда) писал, что Соломон слышал чириканье птицы и понимал её язык, слышал лай собаки и понимал её сообщение.
В том же духе литературный персонаж доктор Дулиттл — врач, научившийся языку животных у своего попугая, — покорил коллективное воображение. Он отправлялся в кругосветные приключения в сопровождении животных и беседовал с ними как с равными.
В науке первый прорыв в понимании коммуникации животных произошёл в 1920-х годах, когда Карл фон Фриш расшифровал «танец пчёл» — метод, с помощью которого пчела передаёт точную информацию о местонахождении пищи. За это он получил Нобелевскую премию в 1973 году.
В 1960-х годах Джон Лилли изучал общение дельфинов-афалин и выявил разнообразие звуков — свист, визги, «блеяние», — издаваемых в различных форматах: диалоги, монологи или групповой гул. В эксперименте 1961 года он с помощью «телефонной линии» соединил двух дельфинов, находившихся в удалённых друг от друга бассейнах. В тот момент, когда они поняли, что могут слышать друг друга, — дельфины начали с энтузиазмом общаться.
С тех пор исследователи по всему миру продолжают собирать тысячи часов записей. Проект Wild Dolphin уже более 40 лет документирует жизнь двух стай дельфинов на Багамах, включая общение между поколениями. Аналогичным образом, в рамках проекта «Этограмма слонов» (The Elephant Ethogram) собрано более 3 тыс. медиа-фрагментов, документирующих более 400 различных форм поведения африканских слонов, — но полная расшифровка их языка всё ещё далека.
«Мяу-переводчик» и вызов на $10 млн
Чтобы ускорить изучение языка животных, британский миллиардер Джереми Коллер, известный в Израиле в основном щедрыми пожертвованиями Тель-Авивскому университету, в мае 2024 года предложил стимул для исследователей. В рамках так называемого «Вызова Коллера-Дулиттла» он вручит приз в размере $10 млн первой группе, которой удастся расшифровать язык животных и наладить двустороннюю связь с особью того же вида. До достижения этой амбициозной цели ежегодно будет вручаться приз в $100 тыс. команде, добившейся значительного прогресса в понимании системы коммуникации любого вида в животном царстве.
Тем временем на потребительском рынке уже начали появляться коммерческие приложения. Приложение MeowTalk, разработанное компанией Akvelon, анализирует кошачье мяуканье и переводит его в простые сообщения, такие как «Я голоден» или «Мне больно». Сегодня оно классифицирует звуки примерно по 12 категориям, а для дальнейшего улучшения полагается на отзывы пользователей. Точность классификации, по данным компании, составляет около 90%.
Профессор Кон Слободчиков, который расшифровал язык луговых собачек, основал стартап Zoolingua. Компания разрабатывает технологию ИИ для перевода лая и движений тела собак. По его замыслу, разрабатываемые им инструменты ИИ смогут распознавать не только простые сообщения вроде «Я хочу на улицу», но и конкретные, например: «У меня болит плечо».
Многообещающие приложения появляются также в сферах животноводства и сельского хозяйства. Исследователи в Европе, например, разработали систему для анализа криков свиней, чтобы определять их эмоциональное состояние и улучшать условия их содержания.
Google учит язык дельфинов
В этой игре соревнуются и крупные технологические компании. Google начала использовать базу данных проекта Wild Dolphin (который, как упоминалось, десятилетиями документировал общение дельфинов), чтобы обучить свою модель ИИ DolphinGemma.
Модель «разбирает» каждый звук, изданный дельфинами, на повторяющиеся фрагменты, точно так же, как предложения разбирают на слова. Затем пытается угадать, какие последовательности «слов» идут за какими, и генерировать правдоподобно звучащие дельфиньи свисты.
В Google уже разработали небольшой подводный компьютер с микрофонами и динамиком, который издаёт свист, обозначающий любимый предмет (например, водоросль). Если дельфин имитирует этот свист, компьютер распознаёт его в реальном времени и передаёт дайверу сообщение: «Он попросил водоросль!». Дайвер немедленно подаёт предмет — и создаёт положительное подкрепление, которое учит дельфина использовать это «слово» по собственной инициативе.
Постепенно в игру должны добавляться новые свисты, то есть новые «слова» — игрушка, флажок, еда. Идея состоит в том, что в краткосрочной перспективе добавятся десятки понятных «слов», которые дельфины смогут запрашивать, а в долгосрочной, возможно, удастся вести с ними полноценный «разговор». Исследователи подчёркивают, что это не «идеальный перевод», а первый в своём роде двусторонний мост.
Дельфины известны как существа, с которыми относительно легко общаться. Увлекательный случай произошёл в 2013 году в лагуне дельфинов в Мексике: дельфин по имени Зевс инициировал «голосовую игру» с исследователем — не в рамках дрессировки, а по собственной инициативе. Зевс повторял последовательности звуков (У, О, Э, А) в меняющемся порядке, а исследователь в ответ пытался его имитировать. Когда Зевсу предлагали новые последовательности, он в точности повторял их в 71% случаев. Но в 13% случаев он менялся ролями — сам задавал последовательность, как бы прося исследователя повторить за ним. Пытался ли он передать сообщение? Или просто играл?
В 2023 году СМИ сообщили о необычайном взаимодействии с самкой горбатого кита по имени Твейн у берегов Аляски: исследователи проигрывали записи китовых криков предыдущего дня, и Твейн отвечала на них собственными криками в течение примерно 20 минут, прежде чем уплыть. Была ли это беседа? Или начало взаимодействия?
GPT для всего живого
Ещё один заметный проект — Earth Species Project (ESP). Он объединяет биологов, исследователей поведения (этологов) и разработчиков ИИ, которые собирают массивные объёмы звуковых и поведенческих данных и строят модели искусственного интеллекта, функционирующие как «ChatGPT для животных». Цель — попытаться создать автоматический переводчик для разных видов и протестировать его в полевых условиях.
Последняя разработка называется NatureLM-audio — первая GPT-модель, адаптированная специально для звуков животных, а не для человеческой речи. Уже сейчас в неё можно загрузить аудиофайл с вопросом, например: «Сколько дельфинов здесь слышно?» или «Какая птица поёт?» — и она возвращает ответ текстом. Это считается прорывом. Модель также позволяет отличать брачные песни от сигналов тревоги и распознавать птенцов и взрослых особей.
Бритт Селвитале, один из основателей проекта и бывший разработчик Twitter, верит, что им удастся расшифровать первый нечеловеческий язык к началу следующего десятилетия. Аза Раскин, его партнёр по проекту, настроен гораздо оптимистичнее. По его словам, уже через три года мы сможем вести беседу с такими животными, как киты или вороны. ИИ будет генерировать крики на их языке с такой точностью, что они не смогут отличить, что общаются не с представителем своего вида.
«Эти инструменты изменят то, как мы воспринимаем себя по отношению к миру», — прогнозирует он, сравнивая это с революцией, которую произвёл телескоп.
«Если бы лев мог говорить…»
Но возможен ли настоящий разговор с животными, или это будет лишь базовое взаимодействие? Философ Людвиг Витгенштейн утверждал в 1953 году:
«Если бы лев мог говорить, мы бы его не поняли».
Это не из-за языкового барьера, а потому что наши фундаментальные понятия попросту различны. Философ Томас Нагель развил эту мысль в своей знаменитой статье 1974 года «Каково быть летучей мышью?», утверждая, что субъективный опыт животных настолько нам чужд, что, даже если мы узнаем, что они говорят, мы не поймём, что они имеют в виду.
Летучая мышь, например, воспринимает мир через сонар, висит вверх ногами большую часть дня и охотится на насекомых ночью — реальность, которую человеческий мозг просто не приспособлен постичь. Так что, даже если нам удастся заговорить на языке животных, главный вопрос остаётся открытым: сможем ли мы по-настоящему их понять?
Профессор Марсело Магнаско из Рокфеллеровского университета предупреждает, что, не поняв досконально поведение китов, мы не сможем составить «словарь» их языка. По его словам, попытка искать языковые параллели между нашим миром и морским «континентом» китов может быть в корне неверной. Такие понятия, как «ноги», «дым» или «сухой», для них просто нерелевантны, и точно так же многие их понятия совершенно чужды нам.
Технических проблем тоже хватает. Профессор Кристиан Рутц, опубликовавший в 2023 году совместную статью с Раскином, отмечает, что нынешние базы данных частичны: в них не хватает контекста, идентификации говорящего, его поведения и его отношений с «адресатом». Без такой информации, по его словам, трудно глубоко интерпретировать сигналы.
Научный журналист Лоис Паршли (Scientific American) указывает на ещё одно существенное ограничение: хотя ИИ превосходно распознаёт закономерности (паттерны), он часто не имеет реального понимания их значения. Даже Бенджамин Хоффман из Earth Species Project признаёт:
«Самая большая проблема — понять, что вообще можно извлечь из этих паттернов».
Некоторые призывают к реалистичным ожиданиям. Профессор Диана Рейсс из Городского университета Нью-Йорка предлагает сосредоточиться на более скромных целях:
«Даже если мы никогда точно не поймём, что означают эти крики, возможно, мы сможем лучше прогнозировать поведение китов на основе этих сигналов — и это тоже будет значительным скачком вперёд».
