Обучить LLM писать статьи в стиле автора
Необходимо разработать цифровой двойник (digital twin LLM), который после обучения (fine tuning) на материалах автора и других источниках данных, будет писать статьи на заданную тему на русском языке.
Задачи:
Другие источники данных (большинство будут на английском языке): книги в формате PDF, видео на YouTube, текстовые статьи.
Задачи:
- Выбрать LLM и обосновать выбор
- Выбрать облако и развернуть LLM
- Определить формат, в котором необходимо подготовить материалы автора для обучения LLM
- Определить формат, в котором необходимо подготовить другие источники данных
- Обучить LLM на материалах автора и других источниках
- Провести тестирование LLM написав статьи на существующие темы автора
- Провести тестирование LLM написав статьи на новые темы
- После корректировки автором статей из п. 6 и 7 провести дообучение LLM
- Подготовить интерфейс взаимодействия с LLM с помощью которого мы самостоятельно можем дообучать модель и готовить статьи
Другие источники данных (большинство будут на английском языке): книги в формате PDF, видео на YouTube, текстовые статьи.