База знаний

Номер статьи: 534 | Категория: Распознавание | Тип: Полезные советы | Последнее обновление: 07.07.2016

Как распознать текст, содержащий символы, не включенные в алфавит языка?

Описание

Можно ли с помощью программы ABBYY FineReader распознать текст, содержащий дополнительные символы  (пиктограммы, знаки ©, ® и др.)?

Решение

Программу ABBYY FineReader можно обучить распознаванию символов, входящий в стандарт Юникод.
Для того чтобы распознать текст, содержащий дополнительные символы, выполните следующие действия:

  1. Создайте новый язык, алфавит которого будет содержать все необходимые символы.
    • Запустите программу ABBYY FineReader.
    • Выберите пункт меню Сервис > Редактор языков.
    • Нажмите кнопку Новый.
    • В качестве основы выберите язык, на котором написан текст. Нажмите ОК.
    • Нажмите кнопку напротив алфавита языка.
    • Добавьте все необходимые символы к алфавиту языка. Нажмите ОК.
    • Введите название языка. При необходимости измените дополнительные параметры нового языка.
    • По завершении редактирования языка нажмите ОК.
  2. Обучите программу FineReader распознаванию дополнительных символов.
    • Выберите созданный язык в качестве языка распознавания для текущего документа.
    • Выберите пункт меню Сервис > Настройки (Опции).
    • Перейдите на вкладку Распознать.
    • Если вы используете ABBYY FineReader 11/12, выберите опцию Использовать встроенные и пользовательские эталоны.
    • Выберите опцию Распознавание с обучением.
    • Нажмите ОК.
    • Нажмите кнопку Распознать, чтобы запустить распознавание с обучением.
809 считают это полезным.
Была ли эта информация вам полезна?