База знаний

Номер статьи: 1897 | Категория: Настройка проекта | Тип: Вопрос/Ответ | Последнее обновление: 06.04.2016

Что такое задание?

Описание

Задание – это набор документов из одного пакета, обрабатывающихся совместно на определённом этапе. В зависимости от настроек этапа все документы могут попасть в одно задание или быть разделены между несколькими заданиями. При этом в одно задание не могут попасть документы из разных пакетов.

Решение

Жизненный цикл задания. Автоматическое и ручное формирование заданий

Задание является временным хранилищем документов пакета на этапе. У задания и пакета разный жизненный цикл. Пакет существует от момента его создания при импорте изображений и до тех пор, пока он не будет удалён пользователем или во время автоматической очистки. Задание существует только в рамках одного этапа. Обычно при передаче документов на другой этап старое задание автоматически удаляется и формируется новое.

Так, первое задание формируется на этапе импорта, это задание предобработки изображений. В него попадают все документы пакета. Затем документы отправляются на распознавание. В соответствии с настройками этапа распознавания создаются задания распознавания, в которые перемещаются документы пакета. Задание импорта после этого удаляется. Затем документы отправляются на следующий этап сценария обработки, формируются новые задания, задания распознавания удаляются и т.д.

Также существует возможность формирования и пересылки заданий вручную оператором. У большинства операторов есть права на пересылку заданий и документов на этапы пересканирования и исключений. Старшие операторы верификации обычно могут пересылать задания и документы на все доступные в проекте этапы.

Stage Properties

Существует несколько возможностей:

Настройка максимального количества документов в задании. Подокументная обработка

В распределённой версии FlexiCapture для большинства этапов можно настроить, какое максимальное количество документов может содержаться в задании на данном этапе.

Откройте свойства типа пакета и перейдите на вкладку «Процесс обработки». Переключитесь на расширенную схему, выберите этап, например «Верификация данных», и нажмите кнопку «Правка…». На вкладке «Общие» обратите внимание на настройки «Максимальное количество документов в задании» и «Ожидать все документы пакета».

Для этапа верификации данных максимальное количество документов в задании по умолчанию – 10. Это значит, что оператор верификации данных будет получать документы порциями по 10 или меньше документов, что облегчит групповую верификацию. Изменять данную настройку не рекомендуется, но в случае, если в документе на групповую верификацию отправляется не более 5 полей, значение можно немного увеличить.

Stage Properties

В задание может быть включено число документов равное заданному в настройке или меньшее, если число документов в пакете не кратно максимальному числу документов в задании. Например, если в пакете 11 документов и максимальное число документов в задании 10, то будет сформировано два задания. Первое будет содержать 10 документов, второе – один.

При включенной опции «Ожидать все документы пакета» на данном этапе в задания будет включено не более указанного числа документов, но на следующий этап пакет перейдёт только когда все его документы будут обработаны. Если опцию выключить, то документы будут отправляться на следующий этап по мере обработки. В любом случае на следующем этапе документы будут распределяться по заданиям в соответствии с настройкой «Максимальное количество документов в задании» для него. Если для следующего этапа максимальное количество документов в задании не задано, то количество документов в заданиях предыдущего и следующего этапа будет совпадать.

Рекомендуется тщательно тестировать проект при одновременном отключении опции «Ожидать все документы пакета» и различных ограничениях на количество документов в задании для этапов. Общая рекомендация ­– либо устанавливать одинаковые ограничения, либо не выключать опцию «Ожидать все документы пакета».

Задать максимальное число документов в задании нельзя для этапа проверки целостности пакета, т.к. такая возможность противоречит предназначению этапа. На этом этапе оператор должен проверить, что комплект документов пакета полон.

Также задать максимальное число документов в задании нельзя для конечного этапа «Обработано» на который поступают обработанные пакеты. Пакет может считаться обработанным, только если обработаны все его документы.

Не следует вносить изменения в логику формирования заданий распознавания. В FlexiCapture реализована встроенная логика распределения заданий распознавания между ядрами.

В каких случаях стоит разделять документы пакета между несколькими заданиями? В случае, когда количество документов в пакете велико и оператору некомфортно обрабатывать их единовременно. Если есть возможность распределить обработку документов между несколькими операторами, что позволит ускорить обработку пакета. Для этапа импорта настройка «Максимальное количество документов в задании»позволит распределить задания импорта по нескольким ядрам.

В каких случаях стоит также выключить опцию «Ожидать все документы пакета»? Если документы в пакете не связаны между собой и не требуют совместной обработки, отключение этой опции для этапа распознавания позволит быстрее получать документы на верификацию. А при отключении опции на этапе перед экспортом – быстрее отправлять документы на экспорт. При небольшом количестве пакетов в системе и достаточном количестве ядер, занятых обработкой, такая настройка позволит ускорить процесс.

С помощью разделения документов пакета по заданиям можно настроить подокументную обработку. Не рекомендуется создавать пакеты с одним документом, так как это приводит к замедлению обработки в связи с необходимостью тратить машинное время на сопутствующие задачи – передачу данных о пакете с сервера и на сервер, запись в базу данных, создание заданий и т.п. Тем не менее в случае, когда необходимо обрабатывать документы по одному, можно использовать настройки «Максимальное количество документов в задании» и «Ожидать все документы пакета».

В локальной версии FlexiCapture настроить максимальное количество документов в задании нельзя. Это связано с тем, что все пакеты обрабатывает один и тот же оператор, поэтому разделение документов пакета на несколько заданий не ускорит обработку.

105 считают это полезным.
Была ли эта информация вам полезна?