Методические указания для выполнения лабораторных работ по дисциплине "Экономическая информатика", страница 34

-  выделите все страницы, используя команду меню   Правка ® Выделить все или сочетание клавиш Ctrl-A)

-  В строке меню выберите команду:

Изображение ® Обработать изображение ® Очистить изображение от мусора

При выборе этой команды нужно помнить: если исходный текст был очень светлым или в нем использовался очень тонкий шрифт, то применение этой команды может привести к исчезновению точек, запятых или тонких элементов букв, что ухудшает качество распознавания.

§  Если в результате сканирования по краям изображения появляются зачерненные поля, то перед распознаванием изображения для удаления  ненужных фрагментов выполните обрезку изображения. Для этого:

-  В окне Папка выделите нужную страницу.

-  На панели инструментов Изображение  нажмите на кнопку инструмента Обрезать изображение . Появится окно Обрезать изображение. Контур изображения будет выделен черной линией.

-  Потяните мышью черную линию, обрамляющую изображение, или маркеры, находящиеся в углах контура изображения. Часть изображения, которая будет отрезана, выделится серым цветом. Щелкните по кнопке Обрезать.

-  Закройте окно Обрезать изображение.

-  Последовательно выделяя необходимые страницы, осуществите обрезку  их изображения.

§  Осуществите  распознавание изображения. Для этого:

-  Проделайте следующие предварительные действия:

·  Установите язык распознавания текста. Для этого на стандартной панели инструментов из списка языков кнопки Языки выберите язык. Если текст содержит информацию на русском и английском языках, выберите из списка Русский и английский. Если текст содержит информацию на нескольких языках – из списка  выберите Выбор нескольких  языков и в диалоговом окне Язык распознаваемого текста   установите флажки перед необходимыми языками. Если текст содержит формулы -  из списка  выберите Выбор из полного списка языков и установите в диалоговом окне соответствующие флажки.

·  В окне Пакет выделите одну страницу изображения текста, в которой вы хотите провести выборочное распознавание блоков информации (желательно страницу с разными типами информации: с текстом, таблицей, картинкой). На панели инструментов   Изображение нажмите на кнопку Выделить зону распознавания  и обведите указателем инструмента необходимый блок. На выделенном блоке вызовите контекстное меню и в нем выберите команду Изменить тип блока и из списка блоков задайте необходимый тип. Проделайте такие же  действия для последующих блоков этой страницы.

·  При распознавании изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически. Если ориентация изображения была определена ошибочно, то в списке кнопки Сканировать выберите пункт Опции. На вкладке  Сканировать/Открыть снимите отметку с пункта Определять ориентацию страницы (при распознавании) и поверните изображение вручную. Чтобы повернуть изображение нужно в строке меню выбрать команду: Изображение® Повернуть/Отразить изображение и  указать направление поворота.

-  В окне Пакет выделите все страницы изображения текста.

-  Нажмите на кнопку Распознать все При анализе  обработанные участки изображения будут закрашиваться голубым цветом. Результат распознавания отобразится  в окне Текст.