Дискриминантный анализ. Проведение дискриминантного анализа на компьютере

Страницы работы

Уважаемые коллеги! Предлагаем вам разработку программного обеспечения под ключ.

Опытные программисты сделают для вас мобильное приложение, нейронную сеть, систему искусственного интеллекта, SaaS-сервис, производственную систему, внедрят или разработают ERP/CRM, запустят стартап.

Сферы - промышленность, ритейл, производственные компании, стартапы, финансы и другие направления.

Языки программирования: Java, PHP, Ruby, C++, .NET, Python, Go, Kotlin, Swift, React Native, Flutter и многие другие.

Всегда на связи. Соблюдаем сроки. Предложим адекватную конкурентную цену.

Заходите к нам на сайт и пишите, с удовольствием вам во всем поможем.

Фрагмент текста работы

После задания всех необходимых параметров, щёлкнем на кнопке OK. Программа выдаст окно для задания вида дискриминантной функции. В этом окне (рис.7.3.4) необходимо ещё раз уточнить набор дискриминантных переменных (в нашем примере это X1, X2, X3) и выбрать метод отбора дискриминантных переменных.

Рис. 7.3.4.Окно для определения методов построения модели

В системе STATISTICA реализованы следующие методы дискриминации:

Standard – стандартный метод, который предполагает использование всех дискриминантных переменных, первоначально указанных пользователем (см. рис.7.3.3), независимо от уровня их информативности.

Forwardstepwise – прямая процедура пошагового отбора переменных, начиная с переменной, обеспечивающей наилучшее различение множеств. На каждом шаге этого алгоритма отбирается очередная переменная, которая в сочетании с ранее отобранными, даёт наилучшее различение групп.

Backwardstepwise – обратная процедура пошагового отбора дискриминантных переменных; когда на первом шаге алгоритма все переменные включаются в дискриминантную функцию. На каждом последующем шаге происходит исключение из набора той переменной, которая вносит наименьший вклад в различение множеств.

В нашем примере был выбран стандартный метод, то есть все переменные (X1, X2, X3) включены в состав дискриминантной функции.

Рис. 7.3.5. Окно для проведения анализа дискриминантных функций.

На следующем шаге проведения дискриминантного анализа нам необходимо оценить коэффициенты дискриминантных функций. Для этого в окне на рис.7.3.5 щёлкнем на кнопку ClassificationFunctions(классификационные, т.е. дискриминантные функции).

Рис. 7.3.6. Расчётные значения коэффициенты дискриминантных функций

Полученные результаты (рис.7.3.6) позволяют нам записать выражения всех трёх дискриминантных функций:

Это так называемые линейные дискриминантные функции Фишера, с которыми подробно можно познакомиться в специальной литературе [12,25].

На основе рассчитанных классификационных функций по определённому правилу производится повторная классификация объектов всех трёх подмножеств [12]. Чтобы увидеть результаты этой процедуры, нужно в окне (рис.7.3.5) щёлкнуть на кнопку ClassificationMatrix.

Рис.7.3.7. Результаты применения классификационных функций

На рис.7.3.7 мы видим, что произошли изменения в первоначальном составе подмножеств. Например, с учётом применения классификационных функций в первую группу отнесены три объекта, хотя первоначально в ней находились четыре объекта. Следовательно, процент корректной классификации составляет 75% (3/4×100). Аналогично трактуются и другие результаты. Средний по всем группам процент корректной классификации составил приблизительно 84,2% (последняя строка таблицы). Это свидетельствует о хорошем качестве классификации.

Рис.7.3.8. Результаты классификации объектов трёх подмножеств банков на основании классификационных функций .

Чтобы получить полную картину классификации, т.е. узнать какие объекты и на каком основании были отнесены к соответствующему множеству, нужно в окне (рис.7.3.5) выбрать процедуру Classificationofcases. В раскрывшемся окне (рис.7.3.8) мы видим детальную картину классификации. Поясним некоторые её фрагменты. В первой графе таблицы указаны номера объектов анализируемой совокупности; во второй графе приведены номера тех групп , к которым мы первоначально причислили изучаемые объекты (прочерками отмечены четыре объекта, которые мы по результатам кластерного анализа не отнесли  ни к одной из выделенных групп). Далее для примера рассмотрим ситуацию с третьим объектом. На первом шаге мы причислили его к первому подмножеству, а по результатам вычислений на базе классификационных функций самой высокой оказалась вероятность его принадлежности к третьему подмножеству (р=0,45). Именно на основании этой (максимальной) вероятности он и был причислен к нему. Для всех остальных случаев рассуждения аналогичны.

В заключение отметим, что пользователь при желании может получить геометрическую интерпретацию результатов классификации, т.е. на графике увидеть расположение анализируемых объектов в пространстве дискриминантных функций.

Рис.7.3.9. Диаграмма рассеивания 20-ти наблюдаемых объектов в координатной системе двух дискриминантных функций.

Для этого нужно в окне (рис.7.3.5) выбрать процедуру Canonicalanalysis & graphs(канонический анализ

Похожие материалы

Информация о работе

Уважаемые коллеги! Предлагаем вам разработку программного обеспечения под ключ.

Опытные программисты сделают для вас мобильное приложение, нейронную сеть, систему искусственного интеллекта, SaaS-сервис, производственную систему, внедрят или разработают ERP/CRM, запустят стартап.

Сферы - промышленность, ритейл, производственные компании, стартапы, финансы и другие направления.

Языки программирования: Java, PHP, Ruby, C++, .NET, Python, Go, Kotlin, Swift, React Native, Flutter и многие другие.

Всегда на связи. Соблюдаем сроки. Предложим адекватную конкурентную цену.

Заходите к нам на сайт и пишите, с удовольствием вам во всем поможем.