ЗВФ
Кафедра «Вычислительных систем и технологий»
КУРСОВАЯ РАБОТА
по дисциплине: «Методы и средства обработки сигналов»
на тему: «Распознавание текстовых символов на растровом изображении»
Выполнил:
Проверил:
Введение
В последние годы распознавание образов находит все большее применение в повседневной жизни. Распознавание речи и рукописного текста значительно упрощает взаимодействие человека с компьютером, распознавание печатного текста используется для перевода документов в электронную форму.
Возможность распознавания опирается на схожесть однотипных объектов. Несмотря на то, что все предметы и ситуации уникальны в строгом смысле, между некоторыми из них всегда можно найти сходства по тому или иному признаку. Отсюда возникает понятие классификации — разбиения всего множества объектов на непересекающиеся подмножества – классы, элементы которых имеют некоторые схожие свойства, отличающие их от элементов других классов. И, таким образом, задачей распознавания является отнесение рассматриваемых объектов или явлений по их описанию к нужным классам. Т.е. понятие распознавания можно расширить, если говорить об обнаружении объектов в потоке не только чувственной, но и любой другой информации. Например, можно говорить о распознавании болезни по её симптомам у больного или о распознавании социальных явлении по статистической информации.
С ростом автоматизации производства, возникла необходимость обеспечить работу многих технологических процессов без участия человека. Главным образом это процессы, связанные с рутинной, однообразной работой или опасные для человека. В таких процессах человека целесообразно заменить на автоматы, реагирующие на различные отклонения параметров технологического процесса от номинальных. Создание таких автоматов являлось первым шагом на пути к построению распознающих систем. Со временем, такие автоматы становились все сложнее, а с появлением компьютеров, открылись широчайшие возможности для применения распознающих автоматов работа которых основывается на цифровой обработке данных.
Развитие и распространение компьютерной обработки информации привели к возникновению в середине ХХ века потребностей в технологиях, позволяющих машинам осуществлять распознавание в обрабатываемой ими информации. Примерами могут служить распознавание текста, машинное зрение, распознавание речи, отпечатков пальцев. Несмотря на то, что некоторые из этих задач решаются человеком на подсознательном уровне с большой скоростью, до настоящего времени ещё не создано компьютерных программ, решающих их в столь же общем виде. Существующие системы предназначены для работы лишь в специальных случаях со строго ограниченной областью применения.
Задачей распознавания изображений является применение методов, позволяющих либо получить некоторое описание изображения, поданного на вход системы, либо отнести это изображение к некоторому определенному классу. Процедура распознавания применяется к некоторому изображению и обеспечивает преобразование его в некоторое абстрактное описание: набор чисел, цепочку символов или граф. Последующая обработка такого описания позволяет отнести исходное изображение к одному из нескольких классов.
Но возникает ряд трудностей и проблем. Чаще всего это связано с тем, что изображения предъявляются на сложном фоне или изображения эталона и входные изображения отличаются положением в поле зрения, или входные изображения не совпадают с эталонами за счет случайных помех.
В данной курсовой работе разработаны приложения, позволяющее находить на изображении буквенные и цифровые символы.
Постановка задачи
Задачу распознавания текстовой информации можно определить следующим образом. На вход подаётся изображение текста. Требуется определить его кодированное электронное представление, т.е. произвести его перевод из растрового графического представления в текстовое. Последнее означает, что для каждого изображения буквы текста нужно определить соответствующее кодирующее число. А это означает, что каждый фрагмент исходного изображения, соответствующий букве, должен быть отнесён к одному из классов букв, набор которых задаётся известным алфавитом. Изображения букв разных классов отличаются по начертанию. Выходное текстовое представление рукописи должно содержать весь
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.