Как и зачем айтишник из Якутии пытается сохранить исчезающие языки малочисленных народов России с помощью современных технологий
Четыре года назад Николай Апросимов из Якутии разработал голосовой переводчик Ayanaс с русского на эвенкийский язык. В феврале 2024 он представил еще четыре аналогичных приложения для четырех языков коренных народов Таймыра. Как эколог стал IT-специалистом, сложно ли было заставить ИИ говорить на редких языках и зачем это нужно — в интервью «Сноба».
Почему вы занялись изучением эвенкийского языка?
В селе Кюпцы Усть-Майского улуса Якутии, откуда я родом, проживает много этнических эвенков. В их числе и мои предки. Но сам язык практически утрачен в 1930-х годах, то есть на нем не говорил даже мой дедушка. Я сам тоже практически не знал этот язык, несмотря на то, что изучал его в школе. Ребенком я не понимал, зачем он мне вообще нужен, в отличие от русского и английского.
Эвенкийский — исчезающий язык. Сейчас в России проживают 36 тысяч эвенков. Из них, по самым оптимистичным подсчетам, на эвенкийском говорят всего 9 %. А по самим худшим — 4%.
Вы по образованию — эколог. Как вы попали в IT-сферу?
В 2015 году, после окончания университета, я работал лесником в Усть-Майском районе Республики Саха. Зарплата была низкой, я искал подработки и параллельно начал интересоваться сферой IT. Интернет в наших краях был безлимитным только ночью, поэтому я изучал видео на YouTube по созданию роликов, монтажу и web-дизайну, когда все люди спали.
Денег все еще не хватало, и это вынудило меня уехать из родного края и начать новую жизнь в другом районе Якутии. Там я устроился художником-оформителем в местном клубе, где зарплата была повыше. Но работать в бюджетной организации сложно, там нет никакого творчества. Я продолжил изучать графику и IT, начал создавать собственные видеоролики. Однажды их заметили в одной компании и предложили создать им сайт. Я этого не умел и отказался. Но мне стало интересно, я начал изучать программирование и спустя несколько месяцев создал первый сайт для той же компании — он работает до сих пор.
Как появилось приложение Ayana?
В 2019 году я был на региональном молодежном форуме. Там я узнал, что в Якутии есть школы, где бесплатно обучают родным языкам. Но проблема в том, что люди, которые ими интересуются, не знают, как найти эти курсы. И я предложил создать приложение, работающее по принципу агрегатора, которое объединяло бы желающих учить язык и их педагогов.
Но позже я решил создать не агрегатор, а просто приложение, с помощью которого любой желающий мог бы выучить язык. Начал искать гранты и НКО, которые могли бы помочь мне в реализации этой идеи. В итоге министерство по развитию Арктики выделило мне грант в размере 500 тысяч рублей на разработку мобильного приложения. Я должен был создать мощный переводчик, который бы работал на основе искусственного интеллекта.
Как вы разрабатывали Ayana?
Сначала я понятия не имел, как создаются такие приложения. Экспериментировал на разных платформах, нанимал консультантов, много копался в интернете, сидел на форумах. Но первые попытки оказались тщетными и безрезультатными. И вы не поверите, но когда мы в декабре 2020 года первый раз заставили машину говорить на редком языке (это был, конечно, ужасный электронный голос), то поняли, что именно нам нужно делать. В разработке приложения мне помогали программисты из Москвы. Но в какой-то момент они перестали отвечать на мои сообщения. Я уже отчаялся, но вдруг на меня вышел мужчина из Великобритании. Он отправил скрипт-код на английском языке, который позволил мне упорядочить мой. Это помогло запустить Ayana.
Почему приложение так называется?
Сначала наш проект назывался Аяврик. Это литературный персонаж из наших сказок. Но постепенно Аяврик превратился в Ayana. Название переводится как «хорошенькая». Оно простое, хорошо запоминается. Как «Алиса», WhatsApp, TikTok.
Сколько слов знает Ayana?
Первая партия у нас состояла из 3600 пар слов — на русском и эвенкийском языках. Приложение работает на ИИ — слова в нейросеть мне помогали загружать учителя эвенкийского языка. Но это было сложно. Во-первых, эвенкийский язык — не самый легкий, в нем есть много диалектов. Допустим, в Красноярском крае говорят так, а в южной Якутии уже по-другому.
Ayana, кстати, говорит на восточном диалекте, на языке эвенков Якутии, он более распространенный. Но сейчас мы заполняем приложение и словами на западном диалекте, который используется в литературе.
Кроме того, мы хотели, чтобы наша платформа работала в местах, где живут сами эвенки. Я уже говорил, что там очень плохая связь. Так появилась Ayana Offline, которая работает без интернета. Обновленное приложение помогает носителям языка внести правки в случае ошибок и добавлять свои диалекты. Переводчик мы внедрили в различные цифровые платформы, его знают «Алиса» и «Маруся».
После создания Ayana стали ли вы чаще общаться на эвенкийском языке?
Да, я стал чаще общаться на эвенкийском. Но не скажу, что знаю язык прям «супер», особенно по сравнению с теми, кто живет в этой среде. Мои дети тоже потихоньку знакомятся с языком, балуются с «Алисой».
Если говорить про эффект от приложения — он появился в Красноярском крае. Знакомые, которые там живут, говорили мне, что люди стали чаще говорить на эвенкийском. Но, конечно, отследить это по каким-то индикаторам мы не можем.
Вы создали еще несколько приложений для других коренных народов Севера. Расскажите о них.
Когда появилась Ayana, я начал ездить по России и рассказывать о нем другим народам. Их представители подходили ко мне и тоже просили создать такие приложения, чтобы спасти язык. В какой-то момент проект начал приобретать коммерческий характер. Но он не является коммерческим, потому что на нем много денег не заработаешь. Мы просто создаем платформу для сохранения языка.
20 февраля 2024 года мы презентовали другие приложения-переводчики с долганского (Elden), нганасанского (Буо), энецкого (Dirichu) и ненецкого (Yaliakoko) языков. В них есть офлайн-переводчик, текстовая информация о проекте и народах, медиапроигрыватель, онлайн-радиостанция с местными песнями.
Чем эти приложения отличаются от Ayana?
Ayana создана на основе искусственного интеллекта, с ней можно общаться. Эти приложения больше похожи на оффлайн словари, в которые можно ввести любое слово и его переведут. Приложения, кстати, можно скачать в Google Play.
Планируете ли вы дальше заниматься сохранением редких языков?
Да, мы продолжаем работать с виртуальными переводчиками. Сейчас готовим переводчики с русского на якутский и корякский языки. Мы уже создали приложения, но пока они еще не готовы. Мы добавляем слова, превращаем их в коды. Планируем закончить работу в октябре этого года.
Вы столько времени тратите на разработку этих приложений. Для чего вам это нужно?
Это интересно. Работая над проектами, мы много общаемся с людьми, расшифровываем код их народа. И понимаем, насколько пестра, красочна наша страна, богата культурой, традициями. Это важнее, чем коммерческая составляющая. Современные технологии могут много чего предложить жителям России, но до малых, коренных народов они еще не дошли. То, что мы делаем, очень сложно, даже невозможно, но очень важно.
Беседовала Ирина Филиппова