IEEE: субъективные оценки людей помогли нейросети убрать шум с аудиодорожек
Американские инженеры из университетов штатов Огайо и Индиана разработали новую модель обучения искусственного интеллекта (ИИ) для улучшения качества звука. Для достижения желаемого эффекта специалисты воспользовались не техническими параметрами аудиофайлов, а субъективным человеческим восприятием чистоты услышанного. Исследование опубликовано в научном журнале Института инженеров электротехники и электроники (IEEE).
Модель обучали на двух наборах данных из предыдущего исследования, содержавших записи разговоров людей. В некоторых случаях фоновые шумы, такие как телевизор или музыка, могли заглушить беседу. Слушатели оценивали качество речи каждой записи по шкале от 1 до 100.
Для своего проекта ученые использовали специализированный языковой модуль улучшения речи с возможностью прогнозирования, которая может предвидеть среднюю оценку зашумленного сигнала с точки зрения живых слушателей.
В результате новая модель превзошла стандартные походы очистки аудиодорожек от шума, основанные на разделении нужного сигнала и побочных звуков.
По словам авторов разработки, повышение качества звука имеет решающее значения для создания более эффективных слуховых аппаратов, систем громкой связи, программ распознавания речи и других систем.