Исследование методов обработки изображений с помощью пакета IMAGE PROCESSING TOOLBOX: Методические указания к лабораторным работам, страница 11

2.1. Метод глобальной пороговой обработки

Данный метод является самым простым из существующих. При его использовании предполагается наличие информации о соотношении яркостей объекта и фона (объект ярче фона или наоборот). Для случая разбиения входного изображения на “объект” и “фон” элементы бинарного изображения S(i, j) получают из условия:

                                          (17)

где T – глобальный порог.

            В литературе предложено множество методик по выбору величины порога T [2,5]. Для изображений, где объект расположен на относительно однородном фоне, можно предложить следующий способ.  На изображении выделяется некоторая область и в ней подсчитывается общее число точек (пикселов). Имея априорную  информацию о том, какую долю в этой области занимает объект, можно приблизительно указать количество точек, приходящихся на него. Далее строится ненормированная гистограмма яркости изображения и рассматриваются два варианта: объект светлее фона и объект темнее фона. В первом случае порог T итеративно передвигается от больших значений яркости к меньшим и останавливается тогда, когда площадь ST под гистограммой справа от порога не будет равна количеству точек объекта. Во втором случае порог выставляется на малых значениях яркости и передвигается вправо. На рис. 4 приведен пример, демонстрирующий этот алгоритм.

Исходное изображение

разрядность – 5 бит,

всего точек – 1 890,
точек объекта – 529

Бинарное изображение

Гистограмма изображения P(f), порог T = 27, найденное количество точек объекта S » 550

Рис. 4. Пример выбора глобального порога по количеству точек объекта

Другой подход к пороговому ограничению по яркости состоит в выборе порога, соответствующего минимуму бимодальной гистограммы, находящемуся  между  двумя  ее пиками.  На гистограмме  (рис. 4) четко просматриваются два пика (моды), один из которых относится к яркости точек фона, а другой – к яркости точек объекта. Однако для многих реальных изображений определение такого минимального значения, лежащего между пиками, часто затруднено вследствие плохо выраженной модальности гистограммы.

Разработаны дискриминантный, энтропийный, моментный критерии к выбору глобального порога.

К достоинствам этого метода можно отнести простоту его реализации, а к недостаткам – невозможность его использования для изображений с неоднородной яркостью как фона, так и объекта.

2.2. Байесовский метод

Пусть на изображении выделен некоторый прямоугольный участок (область интереса), который разбит на две области: область окна и область рамки (рис. 5).

Предполагается, что сегментируемый объект полностью попадает внутрь окна, т. е. в рамке находится только фон (Ф), а в окне – как фон, так и объект (Об). Каждой точке (i, j) области интереса поставлен в соответствие вектор признаков Z T =(z1, z2 , …, zn).

Рис. 5.   Рамка и окно на изображении

Пусть нам известны априорные вероятности принадлежности точки в окне фону Р(Ф) или объекту Р(Об) = 1Р(Ф), величины штрафов за ошибочное отнесение точки объекта к фону С(Ф|Об) и точки фона к объекту С(Об|Ф). Тогда, как показано в литературе [2, 3], из условия минимума средних потерь при классификации точек в окне выводится следующее правило:

       (18)

где ,  – многомерные гистограммы признаков Z, построенные в окне и в рамке соответственно, A = [(C(Об|Ф) + С(Ф|Об))/C(Ф|Об)] – параметр стоимости неправильной классификации. При увеличении значения параметра А уменьшается число точек фона, ошибочно классифицированных как объект. Однако одновременно с этим увеличивается число точек объекта, принятых за точки фона, что может сильно исказить форму объекта. С другой стороны, если уменьшать величину параметра А, то многие точки фона будут классифицированы как  объект.

В лабораторной работе реализован частный случай байесовской сегментации -  сегментация по правилу , что соответствует равенству штрафов С(Об|Ф) = С(Ф|Об) (А = 2) и равновероятной принадлежности точки в окне как фону, так и объекту Р(Ф) = Р(Об). На рис. 6 приведен пример сегментации только по яркости некоторого тестового изображения и гистограммы, поясняющих правило классификации. Точки, для которых выполняется условие , считаются принадлежащими объекту, а остальные – фону. Результат классификации представляется в виде бинарной матрицы S(i, j), в которой единичные элементы соответствуют точкам объекта на исходном изображении, а нулевые – точкам фона. Для точной сегментации реальных изображений информации только от одного признака часто бывает недостаточно (рис. 7).

Яркости точек,

принадлежащих

 к объекту

 

Мода, соответствующая

объекту

 

Мода, соответствующая

фону

 

Изображение

объекта

(5 бит)

Бинарное изображение

 а) гистограмма в рамке,
б) гистограмма в окне,
          в) разность двух гистограмм

Рис. 6. Пример сегментации по яркости тестового изображения

Изображение

объекта(5бит)

Бинарное изображение

           а)  гистограмма в рамке,
           б)  гистограмма в окне,
           в)  разность двух 
                  гистограмм

Рис. 7. Пример сегментации по яркости реального изображения

Вопрос о том, из каких признаков должен состоять вектор Z, чтобы получить хорошие результаты сегментации в самых разнообразных ситуациях, до сих пор не имеет однозначного ответа. На сегодняшний день широко используются яркостные, градиентные, спектральные и текстурные признаки. В работе выбраны два признака – яркость и норма ее градиента.