ru24.pro
«Фрилансим»
Ноябрь
2024
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Разработать ПО для переименования сканов по распознанному тексту

0
Необходимо при добавлении PDF файла в папку в среде windows (папка имеет синхронизацию с гугл-диском) распознавать тип, дату и номер документа, а также контрагента. Из полученной информации необходимо переименовать файл по формату: ГГГГ.ММ.ДД Тип и номер документа, контрагент. Далее в зависимости от типа документа необходимо переместить данный документ в конкретную папку.

Возможные типы документов: Счет-протокол, договор, акт услуг, счет-фактура, заявление, приказ, уведомление, накладная и т.д. Пример итогового наименования документа: 2024.01.12 Договор 1211214 ООО Вентквартетстрой. После переименования такой файл, если наша компания в нем заказчик или покупатель, должен переместиться в папку с входящими договорами.

Из собственных попыток решить данную задачу: пока остановились на тестировании скрипта в Google Drive, с использованием Google Cloud Vision API для распознавания текста, т.к. все фалы загружаются в Google Drive. В целом пока не удалось добиться распознавания текста, стандартный функционал почему-то не хочет распознавать кириллицу и вместо текста получается набор символов, с Google Cloud Vision API также пока неудача, в ответ на запрос выдает ошибку: Ответ от API: {"responses":[{"error":{"code":3,"message":"Bad image data."}}]}. Пример текущего кода и примеры файлов для распознавания прикладываем.