ЛАБОРАТОРНАЯ РАБОТА N 5_1
Проверка наличия зависимости между номинальными признаками.(Таблицы сопряженности).
1.Смоделируйте две выборки из нормального распределения с произвольными математическими ожиданиями и произвольными дисперсиями . (Положите, например, n=50).
Построим двумерную выборку из двух смоделированных выборок: . Разобьем ось на непересекающихся промежутков, а ось на непересекающихся промежутков.
В результате можем считать, что имеется два номинальных признака - признак имеет уровней , признак имеет уровней , можно считать, что имеется выборка случайно отобранных объектов из генеральной совокупности, по которой нужно найти частоты совместной встречаемости событий .
Частоты следует собрать в таблицу, называемую таблицей сопряженности. Выборочные частоты совместной встречаемости различных градаций двух признаков запишем в таблицу сопряженности признаков и .
|
|
||||
, , .
Положим , , .
Формулировка гипотезы о независимости признаков и :
, , . При этом , .
Метод проверки гипотезы основан на статистиках:
Если признаки и (имеющие и уровней соответственно) независимы, то статистики и имеют (приближенно, при большом числе ) распределение с степенями свободы.
Величины называют ожидаемыми частотами (ожидаемыми при выполнении гипотезы) появления события .
При этом величина представляет собой наблюдаемую в опыте частоту события . Считается достаточным, чтобы по всем ячейкам ожидаемые частоты были бы не меньше 3.
Таким образом, при больших :
· для независимых признаков статистика асимптотически распределена по закону с степенями свободы.
· для зависимых признаков неограниченно возрастает при увеличении .
Для проверки гипотезы на уровне значимости необходимо вычислить одну из статистик (или ) и сравнить ее значение с соответствующим критическими значениям верхняя квантиль уровня из распределения с степенями свободы, квантиль можно найти из таблиц математической статистики или с помощью функции ХИ2ОБР при этом:
· принимаем , если
· отвергаем , если
2. По смоделированным выборкам постройте таблицу сопряженности, выбрав .
Проверьте гипотезу о независимости номинальных признаков, используя каждую из двух статистик. Напишите отчет.
3. Попробуйте найти содержательные данные, например в Интернете, для проверки наличия взаимосвязи признаков с помощью таблиц сопряженности.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.