Сводка и группировка. Абсолютные и относительные величины. Средние величины. Ряды распределения.
Создайте файл с расширением «.xls», названием которого является Ваша фамилия. Выполните работу и сохраните на сервере в папке «практика 03.10.2012».
Прочитайте в файле «Лекция модуль 2» информацию о видах группировки и выполните задачи 1, 2.
ГРУППИРОВКА ДАННЫХ
Под группировкой в статистике понимают разделение множества статистических данных на группы по одному (простая группировка) или по нескольким (сложная группировка) признакам. Результаты группировки представляют в табличном виде.
Группировка данных выполняется с целью получения общей информации о статистической совокупности, изучения структуры явления и взаимосвязей между признаками. Различают типологическую, структурную, и аналитическую группировки [1, с. 49-73].
Задание 1. Структурная группировка
По данным, полученным в результате контроля диаметра заготовок, построить структурную группировку, по полученному результату построить гистограмму, полигон, кумуляту. Сделать выводы.
Таблица 1
5,51 |
5,56 |
5,51 |
5,61 |
5,64 |
5,61 |
5,72 |
5,44 |
5,54 |
5,35 |
5,43 |
5,48 |
5,43 |
5,36 |
5,39 |
5,65 |
5,48 |
5,46 |
5,67 |
5,38 |
5,54 |
5,55 |
5,54 |
5,62 |
5,66 |
5,62 |
5,53 |
5,58 |
5,46 |
5,34 |
5,71 |
5,74 |
5,71 |
5,62 |
5,63 |
5,62 |
5,34 |
5,63 |
5,53 |
5,56 |
5,63 |
5,46 |
5,63 |
5,32 |
5,38 |
5,37 |
5,74 |
5,67 |
5,46 |
5,47 |
5,73 |
5,72 |
5,73 |
5,63 |
5,65 |
5,65 |
5,55 |
5,64 |
5,67 |
5,66 |
5,57 |
5,55 |
5,57 |
5,36 |
5,34 |
5,65 |
5,48 |
5,32 |
5,33 |
5,39 |
5,65 |
5,64 |
5,56 |
5,32 |
5,33 |
5,64 |
5,52 |
5,55 |
5,37 |
5,69 |
Указания по выполнению.
Скопируйте таблицу данных в файл формата «.xls», измените данные в соответствии с указанием: при выполнении задания каждому студенту использовать свой набор данных. Для этого к значениям, приведенным в таблице 1, необходимо прибавить число N/2, где N – номер студента по журналу группы.
Вначале следует определить структуру группировочной таблицы, количество групп и границы интервалов. Структура группировочной таблицы в данном случае будет иметь следующий вид (таблица 2):
Таблица 2
Номер группы |
Нижняя граница интервала |
Верхняя граница интервала |
Середина интервала |
Частота |
Кумулята |
Показатель структуры |
1 |
||||||
2 |
||||||
... |
||||||
n |
||||||
Итого: |
- |
- |
- |
- |
Для определения количества групп в структурной группировке удобно применять формулу Стерджесса , где n – количество групп, N количество единиц статистической совокупности. Для определения высоты интервала следует использовать формулу . Полученную длину интервала округляют с необходимой точностью. Нижняя граница первого интервала устанавливается равной наименьшему значению признака, для определения верхней границы следует к нижней границе каждого интервала прибавить высоту h . Затем выполняется подсчет количества значений, попадающих в каждый интервал, и результат записывают в колонку «Частота». Если значение признака и граница интервала совпадают, то такое значение относят к младшей группе. При группировке отдельные группы могут оказаться «пустыми», в этом случае высоту интервала следует изменить и заново определить границы всех интервалов. Выполнить расчет показателей структуры.
Построить гистограмму распределения частот. Построить полигон частот. Построить кумуляту. Построить структурную диаграмму. Сделать вывод о структуре.
Задание 2. Аналитическая группировка
Построить аналитическую группировку, в которой отразить зависимость оплаты труда от стажа работы.
Таблица 3
Стаж работы, лет. |
Оплата за час, руб. |
2 |
30 |
5 |
50 |
4 |
30 |
4 |
50 |
6 |
50 |
7 |
50 |
8 |
60 |
7 |
40 |
6 |
50 |
9 |
60 |
7 |
60 |
5 |
40 |
6 |
40 |
4 |
30 |
3 |
30 |
3 |
30 |
4 |
40 |
5 |
40 |
2 |
30 |
4 |
30 |
1 |
30 |
6 |
50 |
6 |
60 |
5 |
50 |
4 |
50 |
7 |
60 |
8 |
60 |
1 |
40 |
3 |
30 |
2 |
30 |
4 |
40 |
3 |
30 |
6 |
50 |
7 |
50 |
4 |
40 |
6 |
50 |
5 |
50 |
7 |
60 |
4 |
60 |
5 |
40 |
3 |
40 |
8 |
60 |
4 |
50 |
6 |
40 |
3 |
30 |
8 |
60 |
7 |
60 |
7 |
50 |
Указания по выполнению.
Скопируйте таблицу данных в файл формата «.xls», измените данные в соответствии с указанием: каждому студенту использовать свой набор данных из таблицы 3, для этого к значениям колонки «Стаж работы» прибавить число N/2, а к значениям колонки «Оплата за час» – число 2N, где N – номер студента по журналу группы. Измененные данные ранжировать по факторному признаку, используя сортировку.
Для проведения аналитической группировки в основу группировки следует положить факторный признак – причину, которая вызывает изменение результативного признака. В данном случае факторным признаком будет «Стаж работы». Определение наличия зависимости между признаками следует осуществлять по внутригрупповым средним величинам, поэтому аналитическую группировку можно представить таблицей следующей структуры (таблица 4):
Таблица 4
Номер группы |
Нижняя граница интервала |
Верхняя граница интервала |
Частота |
Средняя x |
Средняя y |
1 |
|||||
2 |
|||||
... |
|||||
n |
|||||
Итого: |
- |
- |
- |
- |
В колонках «Средняя x» и «Средняя y» следует вычислить их средние величины в каждой группе данных, пользуясь функцией «СРЗНАЧ». Количество групп и границы интервалов определяют способом, указанным в предыдущем задании. Сделать вывод о наличии зависимости между вариацией факторного и результативного признаков. Построить график зависимости среднего значения результативного признака от вариации среднего значения факторного признака.
Прочитайте в файле «Лекция модуль 2» информацию о видах средних
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.