ru24.pro
Все новости
Ноябрь
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
30

Разработать Custom Speech-to-text Operator на Apache Flink

0
Описание задачи:

Для системы по обработке потоковых голосовых данных требуется разработать оператор на Apache Flink, выполняющий распознавание голоса с использованием OpenAI Whisper.

Предлагается следующая архитектура:
- Apache Flink v1.20 - исполнительная среда для потоковых данных
- Whisper.cpp - высокопроизводительный С++ форк открытого Speech-to-text движка OpenAI Whisper

Задача - создать Custom Operator на Apache Flink (Java или Scala), вызывающий Whisper.cpp.
Предлагается реализация, позволяющая достичь максимальной производительности - например, с использованием JNI (Java Native Interface).

Наконец, используя созданный оператор, разработчику необходимо написать тестовое приложение на Flink, демонстрирующее его работу: эмуляция голосового потока из WAV файла, перевод голоса в текст с использованием нового оператора и выдача текста в консоль. Необходимо, чтобы выполнялся замер производительности для бенчмарка оператора - загрузка CPU и latency распознавания речи.

Результат работы опубликовать в open source репозитории с использованием permissive лицензии (MIT, Apache 2.0)