Представление исходных данных. Визуализация многомерных данных в среде Statistica (Лабораторная работа № 1), страница 4

Эта таблица  дает   возможность  интерпретации ГК  в  терминах корреляции:  большее  абсолютное значение  координат  (факторной  нагрузки)  исходного  признака  с  каким-либо  ГК  (фактором)  говорит о том,  что  переменная  сильнее  связана  с  этим фактором. Другими словами,  чем  больше  величина  координаты  признака,  тем  лучше переменные  показывают структуру,  представленную  этим  фактором.  

Далее  нажать  на   вкладке  Variables  кнопку  Plotvar. factorcoordinates.2D   для  построения соответствующего  графика  (рис.13).

Рисунок 13 – Переменные  (признаки)  в плоскости  первых  двух  факторов  (главных  компонентов)

Как  видно из  рис.13,  все переменные  изображены  в  виде точек  на  единичном круге,  так  как  корреляции  (координаты  точек)  наблюдений  с  факторными осями  принимают  значения   (по  модулю)  из интервала  [0,1] . 

Горизонтальная  ось  соответствует  фактору  1,  вертикальная  -  фактору  2.  Координаты  точек  -  в  таблице  рис.12.  Кроме  того,  этот рисунок  дает возможность  оценить  корреляцию  между  признаками:  чем  меньше  угол  между  радиус-векторами определенных  признаков,  тем  сильнее корреляция между ними.  Например,  переменные  work  и  transport находятся достаточно   близко  между  собой,  что  свидетельствует  об  их сильной корреляции.  Этот  же  вывод  следует  и  из  матрицы  признак-признак  (рис. 2). 

5. На  вкладке  Cases  нажать  кнопку  Plotcasesfactorcoordinates.2D(график  наблюдений   в  пространстве  факторов).  Появится график  (рис.14),  на  котором  изображены   все  наблюдения  (строки), использованные  при расчете.  При этом  основные  наблюдения  (female)     указаны  кружочками    синего цвета,  а  вспомогательные  (male)     отмаркированы  квадратиками   красного цвета.   Из  графика  видно,  что  основные  и вспомогательные  наблюдения  сгруппированы в  разных  областях  плоскости,  т.е. они  объединены  в разные кластеры.                 

  

Рисунок 14 -  Наблюдения  (строки)  в плоскости  первых  двух  факторов  (главных  компонентов)

3.  Задание

В  пакет  Statistica  ввести  данные  по  результатам сессии  9 студенческих групп,  сдавших  по 4 экзамена  (табл.).  Ввод  данных  осуществляется  через  FileNew,  где  в  появившемся окне  CreateNewDocument  (создать  новый документ)  указать  число  переменных,  равное 4,  а  число  строк  -  9. В  таблице  приведены  средние  баллы экзаменов по  каждой  дисциплине (ОИ - отечественная  история; ЭТ – экономическая  теория;  МА – математический  анализ;  ЛА – линейная  алгебра)  для  каждой  из  9  групп.                                                    

Таблица    Средние  баллы  каждой  группы  по  4  дисциплинам

Вычислить:

1.  Корреляцию  между  дисциплинами  (построить  матрицу  признак-признак).

2.  Расстояние  между  группами  (построить матрицу  группа-группа).

3.  Собственные  числа и главные  компоненты  (ГК).

4.  Качество  представления  при  двух  ГК. 

Построить  графики:

1.  Дендрограмму  студенческих  групп.

2.  Дисциплины   в  плоскости   ГК.

3.  Группы  в плоскости  ГК.

Лабораторная  работа 2

Моделирование  работы  нечеткой  системы 

          Цель  работы:  ознакомить  студентов  с основными  понятиями  нечеткой  логики  и  научить  практическим  навыкам   разработки  нечетких  систем  в  среде  FuzzyLogic  системы  Matlab.     

  1 Теоретические сведения

1.1  Основные  понятия нечеткой  логики