4. Проверьте гипотезу о том, что чем старше респонденты, тем более вероятно, что они будут затрудняться с ответами на вопросы анкеты. Для этого постройте коэффициент «99». Сначала пересчитайте: сколько подсказок «затрудняюсь ответить» выбрал респондент, отвечая на вопросы v5 – v9 и v14_1 – v16_4. Затем постройте новую переменную K, которая будет равна «количество ответов 99, деленное на количество вопросов». Проверьте с помощью теста Колмогорова-Смирнова, распределены ли признаки (возраст и коэффициент) нормально, в зависимости от результатов выберите адекватный коэффициент корреляции. Опишите полученный результат.
Задание 7.
1. С помощью процедуры Means опишите распределения возраста в разных районах города (или в других интересующих Вас группах). В качестве зависимой переменной выберите признак возраст (dependent list) и в качестве независимого признака – критерий деления на группы, например, район (independent list). В списке Options отметьте статистики, с помощью которых можно описать распределения возраста по районам. В каком из районов города самый возрастной состав жителей, какой район самый молодой? С помощью опций Excel постройте график, в котором по оси У расположены районы, а по оси Х – среднее значение возраста в районе.
2. Проверьте: в каких районах города средний возраст статистически значимо не отличается от среднего возраста по городу (43 года). Воспользуйтесь командой Split file для того, чтобы провести одновыборочный тест для каждого из районов. Проверьте гипотезу для двух вариантов доверительной вероятности – 95% и 99%. Прокомментируйте полученный результат с использованием знаний о доверительном интервале.
3. Существуют ли возрастные отличия в группе «удовлетворенных работой городских служб» и в группе «неудовлетворенных»? Воспользуйтесь возможностями t-теста для 2-х несвязанных выборок. В окно test var. перенесите признак возраст, в окно grouping var. – степень удовлетворенности. В качестве интересующих групп отметьте крайние значения признака «степень удовлетворенности работой городских служб». Для построения данного признака воспользуйтесь процедурами Count и recode/ compute (исходные переменные: V14_1 – V14_5). Проверьте гипотезу для двух вариантов доверительной вероятности – 95% и 99%. Прокомментируйте полученный результат. Постройте наглядную диаграмму (средний возраст в группах «удовлетворенных» и «неудовлетворенных»).
Для тех, кто желает повысить свое мастерство, предлагаю выполнить (с содержательным комментарием) те же задания, только применительно к признаку «сумма необходимая для обеспечения ребенка».
Задание 8.
1. С помощью однофакторного дисперсионного анализа (процедура ANOVA) ответьте на вопрос: можно ли утверждать, что жители города, различающие в своих оценках работы городских служб (ранее полученная переменная), различаются и по возрасту? Воспользуйтесь тесты попарных множественных сравнений для выделения схожих и различающихся по возрасту групп с разными оценками работы городских служб.
2. По данным всероссийского социологического центра в России 20,1% считают, что в следующем году их семья будет жить лучше, 16,8% - будет жить хуже и 52,4% - полагают, что ничего не изменится (затруднились с ответом 10,7%). Проанализируйте, как соотносятся всероссийские данные с распределением ответов на аналогичный вопрос жителей нашего города (v8). Используйте одновыбочный тест хи-квадрат.
3. В рамках одного из исследовательских проектов было выдвинуто следующее предположение: для людей разного возраста характерна различная степень готовности рисковать, а именно представители старших возрастных групп в большей степени предпочли бы положить деньги в банк с низкими процентами, но с высокой надежностью, молодые – наоборот. Проверьте правомерность данной гипотезы с помощью теста Манна-Уитни (для 2-х групп) и дисперсионного анализа Краскэла-Уоллиса (для нескольких возрастных групп).
Задание 9.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.