Группа |
Отечественные |
Зарубежные |
Итого |
Количество |
15 |
35 |
50 |
Можно ли на основании полученных данных сказать, что все фильмы пользуются одинаковой популярностью?
В данном случае имеется одна выборка и необходимость проверить, соответствует ли распределение результатов в выборке предполагаемому распределению.
Так
как в данном случае у нас имеется небольшая выборка, используется непараметрический
тест. Для решения подобных задач применяется один из наиболее популярных
непараметрических тестов — тест .
В качестве теоретического распределения в нашем случае используется равномерное распределение. Смысл его в том, что все результаты считаются равновероятными. При наличии двух групп фильмов вероятность встретить фильм, принадлежащую какой-либо из них, должна быть одна и та же и равна 1/2=0,5.
С учетом данного обстоятельства окончательный вариант расчетной таблицы для данного примера представлен в таблице 1.2.
Таблица 1.2
Теоретическое и эмпирическое распределение фильмов
Группа |
Отечественные |
Зарубежные |
Итого |
Теоретическое количество |
25 |
25 |
50 |
Эмпирическое количество |
15 |
35 |
50 |
Формулируем
нулевую и альтернативную гипотезы и задаем уровень значимости .
Н0:
Вероятность встретить на сайте megogo.net фильм отечественного производства,
равна вероятности встретить фильм, произведенный в зарубежных странах (Если меньше
).
Н1: Вероятность
встретить на сайте megogo.net фильм отечественного производства, не равна
вероятности встретить фильм, произведенный в зарубежных странах (Если больше или равно
).
Вычисляем сумму отклонений между наблюдаемыми и теоретическими значениями по формуле:
, где
— наблюдаемые, или эмпирические, значения (частоты) для каждой
из категорий,
— ожидаемые, или теоретические, значения (частоты) для
каждой из категорий таблицы
Подставим
соответствующие значения и
в расчетную формулу:
Таблица 1.3
Распределение теоретических и эмпирических частот
Категории |
|||
1 |
2 |
итого |
|
Ожидаемые и эмпирические частоты |
|
|
50 |
Полученное
значениесравнивается со значением
, которое берется из таблицы критических значений для
теста
(см. Приложение Таблица 1)в зависимости от
выбранного уровня значимости
и числа степеней свободы . В свою очередь, число степеней
свободы для теста
зависит от размера
расчетной таблицы и равно
. В нашем случае
.
Если больше или равно
, то нулевая гипотеза отклоняется и принимается
альтернативная (эмпирическое распределение значимо отличается от
теоретического: фильмы одних стран-производителей встречаются на просторах сайта
megogo.net чаще или реже, чем фильмы других).
Из
таблицы 1 находим, что для и
,
.
Поскольку
гораздо больше, чем
, то нулевая гипотеза отклоняется и принимается
альтернативная. То есть, Вероятность встретить на сайте megogo.net фильм
отечественного производства, не равна вероятности встретить фильм,
произведенный в зарубежных странах.
Для определения популярности «отечественных» фильмов можно воспользоваться и параметрическими методами. Для этого необходимо собрать несколько больше статистических данных.
Для исследования были собраны данные из 100 выборок, в каждой из которых рассматривалось по 20 фильмов. Статистические данные представлены в таблице 1.4.
Таблица 1.4
Статистические данные фильмов из 100 выборок
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.