3. Используя данные нового файла, ответьте на вопрос: имеется ли линейная зависимость между долей людей с высшим образованием, проживающих в том или ином районе города и тем чувствуют ли жители района защищенность своего правового и трудового положения. А также: можно ли утверждать, что в увеличением среднего возраста в районе возрастает доля людей, чувствующих себя защищенными. Аналогично и в отношении связи с долей людей, хорошо оценивающих свой уровень жизни. Для получения ответов на данные вопросы воспользуйтесь процедурой CORRELATE/ BIVARIATE/ Pearson, в итоге вы получите значение и эмпирический уровень значимости коэффициента корреляции Пирсона. Для обоснованного ответа на поставленные вопросы воспользуйтесь также графическим представлением «поля рассеяния» признаков с наложением регрессионной прямой. GRAPHS/ SCATTER/SIMPLE, обратите внимание на расположение признаков по осям. В окно Label cases by вставьте признак V02 (район), тогда точки на диаграмме будут маркированы. Если этого не произойдет, то перейдите в режим редактирования диаграммы выберите из меню Chart/ Options/ case label ON. Для наложения регрессионной прямой в том же окне поставьте галочку около Fit line TOTAL. Проанализируйте все случаи, даже если в них не фиксируется наличие линейной связи. С чем это может быть связано?
4. Известно, что распределение жителей города по районам следующее: Кировский (11,9%), Заельцовский (9,7%), Ленинский (19,2%), Калининский (12,2%), Первомайский (5%), Железнодорожный (4,4%), Дзержинский (11%), Советский (9,2%), Центральный (5,1%) и Октябрьский (12,4%). Необходимо произвести ремонт выборки с учетом структуры по районам, то есть добиться репрезентативности выборки по данному признаку. Первый шаг – рассчитайте весовые коэффициенты, второй шаг – с помощью процедуры COMPUTE/ IF создайте признак «вес» - поставьте в соответствие каждому району его весовой коэффициент. Затем произведите взвешивание массива (WEIGHT cases/ weight cases by). Помните, что особенностью программы является то, что процедура взвешивания производится по одному признаку, поэтому если для анализа отпала необходимость в репрезентации по районам, не забудьте отключить «веса» (в том же меню, где и включали взвешивание).
Задание 6
1. Выберите из массива GOROD два ранговых признака, подготовьте их к дальнейшему анализу. Постройте таблицу сопряженности, в клетках которой отразите либо процент по строке, либо процент по столбцу в зависимости от своих исследовательских задач. Кроме того, в клетках таблицы должны присутствовать значения стандартизованных остатков (Z-статистки). Опишите полученную таблицу.
2. Осуществите проверку гипотез о связи двух ранговых признаков с использованием критерия хи-квадрат. Соотнесите его значение и значения Z-статистик в разных клетках, связи между какими именно значениями признаков формируют общую связь между признаками. Если статистика хи-квадрат указывает на отсутствие связи между признаками, «поработайте» с исходными признаками. Например, укрупните, или уменьшите группы. В крайнем случае, используйте для построения таблицы сопряженности другие признаки.
3. С помощью коэффициентов ранговой корреляции, проверьте гипотезу о наличии линейной связи между выбранными ранговыми признаками. Опишите полученный результат: можно ли действительно утверждать, что между выбранными признаками существует линейная зависимость, или, например, вы получили ложную корреляцию, которая обусловлена влиянием третьего признака. Постройте диаграмму рассеяния и опишите ее.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.