База знаний

Номер статьи: 1682 | Категория: Распознавание | Тип: Полезные советы | Последнее обновление: 06.10.2014

Распознавание документа занимает значительное время

Описание

На этапе распознавания документ проходит несколько стадий: предраспознавание, выбор шаблона, наложение шаблона и извлечение данных из полей.

Особенности конкретного изображения, не предусмотренные на этапе разработки определения документа (другое расположение искомых элементов, дополнительный текст, артефакты от сканирования), могут приводить к увеличению времени, требующемуся на предраспознавание, выбор,  наложение шаблона или извлечение данных из полей.

Решение

Если вы заметили, что распознавание документа занимает продолжительное время, в первую очередь необходимо выяснить, какая из стадий вызывает увеличение времени обработки.

На Станции настройки проекта вызовите контекстное меню для документа. Обратите внимание на пункты меню Проанализировать и Распознать.

При вызове команды Проанализировать будут запущенны процессы предраспознавания, выбора шаблона и его наложения. Засеките время, затраченное на анализ документа.

Если время анализа оказалось неудовлетворительным, откройте проект гибкого описания соответствующего определения документа во FlexiLayout Studio. Загрузите изображения документа в проект, выделите их и вызовите из контекстного меню команду Pre-Recognize. Команда запустит процесс предраспознавания. Засеките время, требующееся на его выполнение.

Увеличенное время предраспознавания может быть вызвано наличием на изображении большого количества рисунков, артефактов сканирования, двухмерных штрих кодов и т.п. В статье Предраспознавание документа занимает значительное время вы найдёте советы по уменьшению времени предраспознавания.

Если процесс предраспознавания не занимает продолжительного времени, выделите изображения и вызовите из контекстного меню команду Match. Команда запустит процесс наложения шаблона. Длительное наложение может быть вызвано особенностями изображения, не предусмотренными при разработке гибкого описания. В этом случае для оптимизации гибкого описания воспользуйтесь статьёй Наложение определения документа занимает длительное время.

В случае если предраспознавание и наложение шаблона выполняются за приемлемое время, продолжительное время анализа может быть вызвано большим количеством определений документов, доступных для наложения в типе пакета.

Если возможно, ограничьте количество определений документов, используемых в типе пакета. Для этого на Станции настройки проекта откройте свойства типа пакета и перейдите на вкладку Распознавание. Выберите настройку Использовать выбранные определения документов. Добавьте в список определения документов, которые будут обрабатываться в данном типе пакета.

В случае, когда ограничить количество определений документов затруднительно, может быть полезно воспользоваться классификатором. В статье Как ускорить процесс выбора гибкого описания на примере проекта для обработки счетов-фактур показано, как ускорить процесс выбора гибкого описания с помощью классификатора.

Если время анализа является удовлетворительным, вернитесь на Станцию настройки проекта и вызовите команду Распознать из контекстного меню документа. Засеките время распознавания. 

Длительное время распознавания может быть вызвано одним из следующих факторов: 

Если ни одна из рекомендаций не помогает локализовать и устранить причину продолжительного времени обработки документа, обратитесь в службу технической поддержки по адресу support@abbyy.com. К письму приложите номер лицензии, проект FlexiCapture и примеры изображений, обрабатываемых дольше обычного.

119 считают это полезным.
Была ли эта информация вам полезна?