Создать базу данных для чат бота на gpt
Задачу можно разбить на два блока: 1 - только подготовка базы знаний со скриптами обращения к ней. 2 - готовый проект под ключ. Всю зависит от предложенной стоимости Вами.
Готовый проект - чат бот, выполняющий роль психотерапевта. Он на базе ТГ и в дальнейшем еще и простой сайт. Доступ по оплате через «продамус» + оплата криптой. Подписочная или разовая структура оплаты. В нем 4 основных блока, блоки выбирает пользователь. 1 - сеанс психотерапии. 2 - общение с другом помощником. 3 - база знаний. 4 - полезные материалы. Самое нужно блок: #1 - я пропишу правила скрипты и структуру данных. Пропишу этику, тон, юридические аспекты. Далее я выгрузил и конвертировал в файлы txt около 100 книг по психиатрии. На сколько я понимаю, нужно теперь эти данные распределить по структуре, индексировать загнать в rag и возможно прибегнуть finetuning. Планируется предвариьельный запуск. Желательна что бы сам мог обучаться плюс по сложным вопросам будем сами указывать на что смотреть. Конечно желательно оптимизировать расход токенов. Сделаем кеш с популярными вопросами - ответами. Остальные блоки проще. Например #2 просто пропишу правила и будет обычный gpt. Вроде все. (Файлов около 100 мб в виде txt, так думаю нужен питон с модулем nlp но и процесс достаточно трудоемкий как я понял, обычный gpt даже при дроблении не понятно на сколько погружается в текст и насколько галлюцинирует, вот ссылка пример со структурой и частью базы знаний - https://disk.yandex.ru/d/Ba9xZCTBWNCBSQструктуру выжимал сам gpt с каждого файла отдельно).
Готовый проект - чат бот, выполняющий роль психотерапевта. Он на базе ТГ и в дальнейшем еще и простой сайт. Доступ по оплате через «продамус» + оплата криптой. Подписочная или разовая структура оплаты. В нем 4 основных блока, блоки выбирает пользователь. 1 - сеанс психотерапии. 2 - общение с другом помощником. 3 - база знаний. 4 - полезные материалы. Самое нужно блок: #1 - я пропишу правила скрипты и структуру данных. Пропишу этику, тон, юридические аспекты. Далее я выгрузил и конвертировал в файлы txt около 100 книг по психиатрии. На сколько я понимаю, нужно теперь эти данные распределить по структуре, индексировать загнать в rag и возможно прибегнуть finetuning. Планируется предвариьельный запуск. Желательна что бы сам мог обучаться плюс по сложным вопросам будем сами указывать на что смотреть. Конечно желательно оптимизировать расход токенов. Сделаем кеш с популярными вопросами - ответами. Остальные блоки проще. Например #2 просто пропишу правила и будет обычный gpt. Вроде все. (Файлов около 100 мб в виде txt, так думаю нужен питон с модулем nlp но и процесс достаточно трудоемкий как я понял, обычный gpt даже при дроблении не понятно на сколько погружается в текст и насколько галлюцинирует, вот ссылка пример со структурой и частью базы знаний - https://disk.yandex.ru/d/Ba9xZCTBWNCBSQструктуру выжимал сам gpt с каждого файла отдельно).