Разработать ПО для переименования сканов по распознанному тексту

14.11.2024 18:16

Необходимо при добавлении PDF файла в папку в среде windows (папка имеет синхронизацию с гугл-диском) распознавать тип, дату и номер документа, а также контрагента. Из полученной информации необходимо переименовать файл по формату: ГГГГ.ММ.ДД Тип и номер документа, контрагент. Далее в зависимости от типа документа необходимо переместить данный документ в конкретную папку.

Возможные типы документов: Счет-протокол, договор, акт услуг, счет-фактура, заявление, приказ, уведомление, накладная и т.д. Пример итогового наименования документа: 2024.01.12 Договор 1211214 ООО Вентквартетстрой. После переименования такой файл, если наша компания в нем заказчик или покупатель, должен переместиться в папку с входящими договорами.

Из собственных попыток решить данную задачу: пока остановились на тестировании скрипта в Google Drive, с использованием Google Cloud Vision API для распознавания текста, т.к. все фалы загружаются в Google Drive. В целом пока не удалось добиться распознавания текста, стандартный функционал почему-то не хочет распознавать кириллицу и вместо текста получается набор символов, с Google Cloud Vision API также пока неудача, в ответ на запрос выдает ошибку: Ответ от API: {"responses":[{"error":{"code":3,"message":"Bad image data."}}]}. Пример текущего кода и примеры файлов для распознавания прикладываем.