ru24.pro
Работа
Январь
2025
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Внедрить оффлайн языковую модель в голосового помощника

0
В проекте на Python имеются: ASR (2 модели оффлайн, 1 онлайн), выбор языковых моделей через g4f при помощи провайдера (онлайн), TTS модели для озвучки ответа GPT (2 модели оффлайн, 1 онлайн). Голосовой помощник умеет выполнять запросы пользователя в браузере с помощью Selenium, управлять файлами компьютера при помощи GPT , открывать программы, искать по файлам, выполнять элементы навигации: вперед, назад, приближать, отдалять, напоминать, записывать в заметки. На данный момент запросы гпт выполняются в отдельных потоках при помощи библиотеки threading.
Необходимо внедрить русскую языковую модель gpt (аналог), которая будет работать без интернета. Дообучить её на тематику параллельного программирования С++, С#, Python, если это возможно. Разбить все по потокам: 1 - основной поток с окошком
2 - голос захватывает и распознает
3,4,5.... - работа с gpt (использовать popen, multiprocessing).
Возможно засунуть в отдельные потоки управление компьютером и управление браузером

Если придумаете, что можно и нужно распараллелить в проекте - можно не дообучать языковую модель
Собрать проект в exe и сделать простенький интерфейс заместо консольного.
Ищу ответственного разработчика на Python, которому близка данная тематика.
Срок 2-3 недели - не затягивать с проектом.