База знаний

Номер статьи: 1383 | Категория: Настройка проекта | Тип: Задача – Решение | Последнее обновление: 22.01.2015

Создание проекта-классификатора в FlexiLayout Studio

Описание

Как создать проект-классификатор в FlexiLayout Studio?

Решение

Общую информацию об использовании классификаторов в FlexiLayout Studio можно найти здесь.

Чтобы создать новый проект-классификатор в FlexiLayout Studio, выполните следующие действия:

1. Создайте новый проект: меню File > New Project… (убедитесь, что в поле Type выбран тип проекта ABBYY Classifier Project).

2. Загрузите тестовый пакет. Он должен включать в себя несколько изображений каждого класса/типа документа. Как правило, достаточно 5-8 изображений каждого класса: 3-4 изображения для обучающего набора и 2-4 изображения для тестирования результатов классификации. Однако при использовании режима обучения классификатора Raster with Text, вам потребуется как минимум 20-30 изображений каждого класса.

3. Создайте классы и установите эталонные классы для всех тестовых изображений. Вы можете сделать это вручную или автоматически, если тестовые изображения были предварительно рассортированы по папкам. Для этого выберите опцию Create Class by Source Folder в контекстном меню пакета. Дополнительную информацию можно найти в справке ABBYY FlexiLayout в разделе Классификаторы >> Автоматическое создание классов. Для того чтобы сопоставить классы с гибкими описаниями (или их варианты), они должны обладать одинаковыми названиями. Либо назовите их в соответствии с шаблоном Layout.Alternative.

4. В окне Batch отметьте несколько изображений каждого класса для включения их в обучающий набор.

5. На основе визуального анализа изображений выберите режим классификации. Для этого щелкните правой кнопкой мыши по узлу классификатора в окне дерева классов и выберите пункт Properties. На вкладке Classifier в группе Classification mode выберите режим Auto; на вкладке Auto-classifier выберите режим классификации. Если вы не знаете, что выбрать, попробуйте применить все режимы по очереди, и оценить, какой профиль дает лучшие результаты.

6. Выберите опцию Train Auto-Classifier On Training Pages в контекстном меню пакета.

7. Выберите все страницы в пакете и запустите классификацию, выбрав опцию Classify в контекстном меню пакета.

8. Изучите окно Log и результаты классификации для каждого класса. Если некоторые изображения классифицированы неверно или не были классифицированы вовсе, попробуйте включить их в обучающий набор. Это поможет программе распознать различные варианты документов в пределах класса.

Иногда некоторые изображения выглядят слишком нестандартно для своего класса и “путают” программу. В таких случаях имеет смысл исключить эти изображения из обучающего набора автоклассификатора и создать для них вместо этого специальные правила в дереве решений Decision Tree. Для этого в свойствах классификатора на вкладке Classifier поменяйте режим классификации Classification mode на Auto & Decision Tree. Для классов, к которым неверно были отнесены нестандартные изображения, выберите опцию Double-check classification result by decision tree в свойствах класса. Теперь программа будет дополнительно проверять дерево решений для всех изображений, которые были отнесены к этому классу автоклассификатором.

В дереве решений задайте структуру (этапы классификации) и элементы Id (идентификаторы), которые будут использованы для идентификации классов в сложных случаях (дополнительную информацию см. в справке  сведения см. в файле справки ABBYY FlexiLayout в разделе Классификаторы >> Создание классификатора). Скомпилируйте и протестируйте классификатор.

Другой вариант. Если изображения класса «А» часто ошибочно относятся классификатором к классу «Б», вы можете добавить класс «А» в результаты классификации для класса «Б». Для этого включите опцию Add extra classes to this classification result в свойствах класса «Б» и выберите в списке класс «А». Так, все страницы, идентифицированные как класс «Б», будут дополнительно отнесены к классу «А». Окончательное определение типа документа может быть выполнено позднее, когда будет подобрано соответствующее гибкое описание.

9. По достижении удовлетворительных результатов классификации экспортируйте классификатор с помощью меню File > Export...

10. Подключите классификатор к проекту ABBYY FlexiCapture. Для этого в диалоговом окне свойств проекта или типа пакета на вкладке Распознавание в группе Дерево классификатора нажмите кнопку Загрузить…

289 считают это полезным.
Была ли эта информация вам полезна?