База знаний

Номер статьи: 1248 | Категория: Общие вопросы | Тип: Вопрос/Ответ | Последнее обновление: 30.04.2015

Как индексировать документы с помощью ABBYY Recognition Server

Описание

Что такое индексирование документов? Как настроить сценарий обработки документов с индексированием в ABBYY Recognition Server? Как работает станция индексирования, входящая в состав ABBYY Recognition Server?

Решение

Индексирование документов при распознавании ABBYY Recognition Server

Ответы на эти вопросы можно найти в демо-ролике. Данный ролик предназначен для знакомства с возможностью индексирования документов при распознавании их ABBYY Recognition Server.

В начале ролика демонстрируются общая схема и этапы обработки документов с помощью ABBYY Recognition Server и объясняется смысл индексирования документов - указания атрибутов документа, используемых для его классификации и быстрого поиска в архивах и системах электронного документооборота.

ABBYY Recognition Server позволяет указать тип документа и присвоить ему атрибуты двумя способами – автоматически с помощью специальных скриптов индексирования и/или вручную на станции индексирования. Станция индексирования позволяет оператору выбрать тип документа и указать значения его атрибутов. Данные значения можно выбрать непосредственно в распознанном тексте документа, указав мышью нужные число, дату, слово или фразу.

Далее в ролике показаны работа оператора станции индексирования с атрибутами документа типа Статья и процесс настройки индексирования в сценарии обработки (подключение этапа индексирования, создание и указание параметров типа документа, полей - атрибутов документа и их типов). Результатом обработки документа в рамках данного сценария являются PDF файл с возможностью поиска, а также текстовый и XML-файлы, содержащие атрибуты документа.

ABBYY Recognition Server также позволяет автоматически определять тип документа и искать поля-атрибуты с помощью специального скрипта индексирования.

424 считают это полезным.
Была ли эта информация вам полезна?