Разведывательный анализ данных с использованием модуля Basic Statistics (Основные статистики) и Distribution Fitting (Подгонка распределений) пакета STATISTICA., страница 9

это говорит об отсутствии корреляции между ДГУПом и «Доходом», т.е. показывает независимость каждого ДГУПа по отношению к наблюдаемой прибыли (доходу).



ЧАСТЬ 2

 1. Построение и анализ таблиц категориальных данных

Кросстабуляция для исходных данных:

Кросстабуляция для полученных групп продукции по видам продукции:

Можно отвергнуть гипотезу о независимости факторов. Для обоснованного применения критерия нужно исключить редкие данные. Для этого объединим в одну группу такие виды продукции как «Хлебобулочные изделия» и «Торты» получим новый вид – «Торты_хлеб»

Таким образом, после исключения редких данных можно отвергнуть гипотезу о независимости факторов. Следовательно, можно сказать, что фактор «Вид продукции» и фактор «ДГУП» не являются независимыми.

Зависимость факторов можно рассмотреть на следующих рисунках:

2. Многомерные отклики и дихотомии

Рассмотрим данные (результат опроса заказчиков ДГУП №042 Абакан):

Переменные «Вид доставки 1», «Вид доставки 2» и «Вид доставки 3»  определяют на каком транспорте будет осуществлена доставка, исходя из срочности заказа и месторасположения. Таким образом,  в распоряжении ДГУП №042 имеется 4 Газели, следовательно, должна быть единая система кодирования, а из следующей таблицы видно, что, к примеру, Газель №601 имеет код для Вид_доставки 1 – 3, для Вид_доставки 2 – 3, НО для Вид_доставки 3 – 1:

Для того, чтобы разные переменные имели одинаковую систему кодирования, используем инструмент Данные/редактор текста языков (иначе одинаковые текстовые значения разных переменных будут иметь разные числовые коды, что приведёт к неправильным результатам анализа).

Приведение к единой системе кодирования:

Таким образом, настроив систему, получаем единую систему кодирования:

Рассмотрим переменные «Вид_доставки 1», «Вид_доставки 2» и  «Вид_доставки 3» как переменную с многомерным откликом. Таблица значений этой переменной:

Таким образом, наиболее часто выбираемая машина для перевозки заказов – Газель 504, что составляет 36,36% относительно числа ответов и 80% наблюдений [80% респондентов выбрали Газель 504 первым, вторым или третьим пунктом ответа]

Рассмотрим переменные «Утро», «День», «Вечер» как переменную с многомерным откликом. Таблица значений этой переменной:

Таким образом, наиболее часто предпочитаемое время привоза – утро, что составляет 63,64% относительно числа ответов и 93,33% наблюдений – респондентов, которые предпочли Утро первым, вторым и третьим пунктом ответа.

Кросстабуляция многомерных откликов и дихотомий

Время суток – Вид доставки

Данная таблица показывает соответствие времени суток и предпочитаемого вида транспорта (водителя, его пунктуальности, вежливости, качества перевозки). В первой половине дня пользуется спросом Газель 504 (85,71%), днем – Газель 602 (75,00%)

Время суток – Вид доставки с простой группирующей переменной «Группа заказчиков».

Эта таблица показывает соответствие времени суток для доставки товара, вида доставки внутри групп заказчиков (например, среди утренних заказов в группе заказчиков «Столовые» спросом пользуются Газели №601 и 504 и составляют по 83,33%).

Вывод: при анализе таблиц категориальных данных выяснилось, что можно отвергнуть гипотезу о независимости факторов (ДГУП и Вид продукции не являются независимыми). Для обоснованного применения критерия исключили редкие данные: объединили в одну группу такие виды продукции как «Хлебобулочные изделия» и «Торты» получив новый вид – «Торты_хлеб».

При рассмотрении результата опроса заказчиков ДГУП №042 Абакан, были выявлены предпочтения заказчиков при Виде доставки (Газель 504) и Времени суток –Утро. А также были рассмотрены различные вариации откликов (кросстабуляции многомер