База знаний

Номер статьи: 1294 | Категория: Настройка проекта | Тип: Задача – Решение | Последнее обновление: 22.08.2013

Как ускорить процесс выбора гибкого описания?

Файлы для скачивания

Описание

Во многих проектах, где необходимо обрабатывать счета-фактуры, возникает ситуация, когда есть несколько частых поставщиков и множество других, счета от которых приходят редко. В этом случае наилучшим решением будет создать отдельные описания для частых поставщиков и использовать общий шаблон (Generic layout) для всех остальных. Однако частых поставщиков обычно тоже довольно много - около сотни - и выбор правильного описания для них происходит медленно. Как же ускорить процесс выбора подходящего гибкого описания?

Решение

При обработке изображения FlexiCapture сначала накладывает на него подходящий шаблон, а затем уже приступает к распознаванию. Если к проекту не подключен классификатор, то программа пробует наложить все имеющиеся шаблоны и выбирает тот, который был наложен с максимальной степенью уверенности. В том случае, когда в проекте много определений документа, этот процесс может быть очень длительным.
Для ускорения выбора подходящего шаблона к проекту можно добавить классификатор, обученный для классов, которые соответствуют определениям документа из проекта. В этом случае при обработке сначала будет происходить классификация документа, а затем уже наложение шаблона. При этом программа будет пытаться наложить только те шаблоны, которые соответствуют результатам классификации. Отсюда получается ускорение в процессе выбора подходящего шаблона.

Ниже представлена пошаговая инструкция, как настроить классификатор FLS и проект FC для этого сценария.

1)     Настройка классификатора в FlexiLayout Studio

 

2)     Настройка проекта FlexiCapture

В архиве SampleProject.rar вы можете найти пример проекта для этого сценария. Также в архиве находится проект используемого классификатора и изображения счетов.

Хочется еще раз отметить, что в этом примере мы добавили отдельную стадию, на которой происходит классификация документов, а результаты этого процесса записываются в специальный регистрационный параметр документа. Затем значение этого параметра используется в скрипте Перед наложением. Безусловно, обработка на стадии классификации требует дополнительного времени, но поскольку в проекте используется imagebased классификатор, это время невелико. Зато такая настройка процесса маршрутизации позволяет значительно повысить качество наложения шаблона. Даже при обработке тестового пакета изображений, который находится в архиве SampleProject.rar, можно заметить, что при использовании настроек, описанных в данной статье, ошибок наложения шаблона не будет. Если же отключить станцию классификации и скрипт для обработки события Перед наложением, то на 7 страниц будет наложен неправильный шаблон.

538 считают это полезным.
Была ли эта информация вам полезна?