Описаниеалгоритма
Алгоритм позволяет находить для каждого образа целый набор информативных сочетаний (синдромов), каждое из которых выполняется на большом числе реализаций своего образа и на достаточно малом числе реализаций остальных обра-80в. Причем для каждого образа находится полный набор таких Сочетаний, т. е. такое их количество, когда на каждой реализации образа выполняется по крайней мере одно сочетание из найденного набора.
Рассмотрим алгоритм нахождения какого-то одного информативного сочетания, которое выполнялось бы па как можно большем числе реализаций рассматриваемого образа (такой образ будем называть «своим») и на как можно меньшем числе остальных образов (совокупность остальных образов обобщенно назовем «чужим»). Методика определения других сочетаний, а также сочетаний для других своих образов полностью аналогична излагаемой.
Введем следующую количественную оценку степени информативности конкретного сочетания:
(3) |
Y = pc- VP4; Pc= nc!Nc, Рч = n4/N4
где п — число реализаций своего образа из общего числа Nс, на которых выполняется рассматриваемое сочетание; пч — число реализаций чужого образа из общего числа N4, на которых выполняется это же сочетание. Следовательно, числа Рс
и Рч характеризуют оценки вероятностей выполняемое™ рассматриваемого сочетания на своем и чужом образах соответственно. Коэффициент у принимает следующие значения: у — 1, если сочетание состоит из одного какого-то показателя; у = 2, если из двух, и т. д. Естественно, что чем больше величина у у какого-то сочетания по сравнению с величинами у для других сочетаний, тем это сочетание предпочтительнее для диагностики.
Опишем алгоритм нахождения такого сочетания, для которого величина у максимальна при условии Рч ^ А (А — заранее задаваемый порог, больше которого не должна быть величина F,). Обычно А я* 0,01—0,05.
Алгоритм нахождения одного информативного сочетания состоит из следующих этапов.
1. Сначала находится сочетание, состоящее из конкретного значения лишь одного показателя, для которого коэффициент у максимален. Для этого поочередно рассматриваются все значения (градации) п исходных показателей. Если показатель классификационный или булевый, то в качестве сочетания рассматриваются все его значения. Для каждого такого сочетания, состоящего из одного значения, определяется величина у по обучающей выборке. Если же показатель количественный или качественный, то как возможные сочетания рассматриваются его различные (с заданным дискретным шагом) числовые интервалы. Например, возможным сочетание.м для показателя «максимальное артериальное давление» АДшах является интервал 140 ^ АДтах < 180. Полагаем, что данное сочетание (интервал) выполняется на какой-то реализации, если у этой реализации значение соответствующего показателя находится в пределах данного интервала.
В конкретном алгоритме интервал для количественного показателя выбирается следующим образом. Находятся минимальное и максимальное значения показателя по выборке. Этот интервал разбивается на десять равных отрезков. Каждая граница двух соседних отрезков разбивает весь интервал на два. Оба указанных интервала оцениваются по критерию у. Эта процедура проделывается для каждой границы. Выбирается тот интервал, при котором получается максимальное значение у. То же самое делается и для качественного показателя, только границами служат сами значения показателя.
За окончательное сочетание на втором этапе алгоритма берется то значение классификационного или булевого показателя или тот интервал значений количественного или качественного показателя, для которого коэффициент у максимален. Если для полученного сочетания Рч f^. А, то поиск одного информативного сочетания заканчивается, если же Рч > А, то переходим ко нторому этапу.
44
2. Рассматриваются всевозможные сочетания значений или тервалов значений двух различных исходных показателей.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.