- выделите все страницы, используя команду меню Правка ® Выделить все или сочетание клавиш Ctrl-A)
- В строке меню выберите команду:
Изображение ® Обработать изображение ® Очистить изображение от мусора
При выборе этой команды нужно помнить: если исходный текст был очень светлым или в нем использовался очень тонкий шрифт, то применение этой команды может привести к исчезновению точек, запятых или тонких элементов букв, что ухудшает качество распознавания.
§ Если в результате сканирования по краям изображения появляются зачерненные поля, то перед распознаванием изображения для удаления ненужных фрагментов выполните обрезку изображения. Для этого:
- В окне Папка выделите нужную страницу.
- На панели инструментов Изображение нажмите на кнопку инструмента Обрезать изображение . Появится окно Обрезать изображение. Контур изображения будет выделен черной линией.
- Потяните мышью черную линию, обрамляющую изображение, или маркеры, находящиеся в углах контура изображения. Часть изображения, которая будет отрезана, выделится серым цветом. Щелкните по кнопке Обрезать.
- Закройте окно Обрезать изображение.
- Последовательно выделяя необходимые страницы, осуществите обрезку их изображения.
§ Осуществите распознавание изображения. Для этого:
- Проделайте следующие предварительные действия:
· Установите язык распознавания текста. Для этого на стандартной панели инструментов из списка языков кнопки Языки выберите язык. Если текст содержит информацию на русском и английском языках, выберите из списка Русский и английский. Если текст содержит информацию на нескольких языках – из списка выберите Выбор нескольких языков и в диалоговом окне Язык распознаваемого текста установите флажки перед необходимыми языками. Если текст содержит формулы - из списка выберите Выбор из полного списка языков и установите в диалоговом окне соответствующие флажки.
· В окне Пакет выделите одну страницу изображения текста, в которой вы хотите провести выборочное распознавание блоков информации (желательно страницу с разными типами информации: с текстом, таблицей, картинкой). На панели инструментов Изображение нажмите на кнопку Выделить зону распознавания и обведите указателем инструмента необходимый блок. На выделенном блоке вызовите контекстное меню и в нем выберите команду Изменить тип блока и из списка блоков задайте необходимый тип. Проделайте такие же действия для последующих блоков этой страницы.
· При распознавании изображение должно иметь стандартную ориентацию: текст должен читаться сверху вниз, и строки должны быть горизонтальными. По умолчанию программа при распознавании определяет и корректирует ориентацию изображения автоматически. Если ориентация изображения была определена ошибочно, то в списке кнопки Сканировать выберите пункт Опции. На вкладке Сканировать/Открыть снимите отметку с пункта Определять ориентацию страницы (при распознавании) и поверните изображение вручную. Чтобы повернуть изображение нужно в строке меню выбрать команду: Изображение® Повернуть/Отразить изображение и указать направление поворота.
- В окне Пакет выделите все страницы изображения текста.
- Нажмите на кнопку Распознать все При анализе обработанные участки изображения будут закрашиваться голубым цветом. Результат распознавания отобразится в окне Текст.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.