Метод анализа данных путем построения кросс-таблиц имеет большое распространение, о чем свидетельствует наличие средств кросс-табуляции во многих приложениях. Это и сводные таблицы в Excel, и перекрестный запрос в Access. Часто такие таблицы называются таблицами сопряженности признаков.
В простейшем варианте кросс табуляции используется две переменные. Пусть исследуется зависимость частоты покупок модной одежды от семейного положения. Кросс-таблица для этого случая имеет вид табл. 3. Исходные данные взяты из таблицы П.1.
Таблица 3
Зависимость частоты покупок модной одежды от семейного положения
Частота покупки |
Женат / замужем |
Не женат / |
Всего |
Часто |
65 32% |
49 57% |
114 41% |
Редко |
127 68% |
42 43% |
169 59% |
Всего |
192 100% |
91 100% |
283 100% |
В числителе каждой клетки[15] ставится количество респондентов, удовлетворяющих условиям попадания в эту клетку. Например, в верхней левой клетке со знаком дроби в числителе ставится число и женатых (замужних), и часто покупающих модные вещи респондентов. Но число респондентов не очень показательно, поэтому для увеличения наглядности таблицы лучше использовать проценты (указаны в знаменателе).
Исходя из того, что кросс табуляции подвергаются две переменные, проценты можно считать либо применительно к столбцу, либо применительно к строке. Выбор того или иного способа зависит от того, какая переменная является независимой (причиной), а какая – зависимой (следствием). В данном случае независимой переменной является семейное положение, а зависимой – частота покупки одежды. Поэтому проценты считаются для частот покупки относительно всей группы респондентов, имеющих одинаковое семейное положение. Сумма процентов по клеткам, соответствующим одному значению независимой переменной, должна составить 100%.
Такая таблица поможет сформулировать предварительную гипотезу о наличии или отсутствии связи между семейным положением и частотой покупок модной одежды. Влияние семейного положения на частоту покупок определяется следующим образом. Среди женатых (замужних) модную одежду часто покупают 32% респондентов, а среди неженатых (незамужних) – 57%, то влияние семейного положения на частоту покупки можно оценить как 57-32=25 процентных пунктов.
1. Постройте таблицу, аналогичную табл. 3, по данным листа Одежда файла CrossTab.xls. Открыв файл, по данным листа создайте на новом листе кросс-таблицу, воспользовавшись опцией Данные à Сводная таблица.
2. Определите по таблице влияние семейного положения на частоту покупок модной одежды среди всех опрошенных.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.