Расчётная оценка числовых характеристик выборки. Расчётное определение параметров линейной регрессии и коэффициента корреляции, страница 6

«Фоновый» массив С

Анализ корреляционного поля позволяет сделать следующие выводы:

-  очевидна связь «убывание у с ростом х», «на глаз» связь довольно тесная и, похоже, близкая к линейной;

-  особые точки (i=43; 69; 99; 51) вполне «ложатся» на эту зависимость.

Получим математическое выражение линии регрессии графическим методом (см. прил. 5).

На графике для этого проведём прямую вдоль облака точек так, чтобы по обе стороны от неё точек было примерно поровну. Для составления уравнения на прямой выбираем две хорошо разнесённые точки: К (2; 32), М (28; 6).

Уравнение прямой имеет вид:

=,

 или .

«Аномальные» серии А и В

Рассмотрение совместного корреляционного поля «аномальных» участков А и В приводит к следующим выводам:

-  точки обоих участков «хорошо перемешаны»;

-  точки все вместе тяготеют к некоторой наклонной прямой, отличной от «линии тяготения» фонового массива;

-  особые точки (i=1; 14; 21) не выделяются из особого облака и не нарушают общую зависимость.

Получим математическое выражение линии регрессии графическим методом. Для составления уравнения на прямой выбираем две хорошо разнесённые точки: К (2; 43), М (30; 13).

Уравнение прямой имеет вид:

=,

.

Шаг 2. Оценка ширины облака наблюдений

«Фоновый» массив С

Ширину облака рассеяния оценим следующим образом:

а) проведём две линии, которые параллельны линии регрессии

ву  и ну

так, чтобы 70% точек оказались между этими линиями;

б) средние значения нижней и верхней амплитуд разброса вуну, а также их среднее

у=(ву+ну)/2, запишем в таблицу VI.1.

«Аномальные» серии А и В

Оценка ширины облака наблюдений проводится аналогично «фоновому» массиву С. Данные заносятся в таблицу VI.1.

Корреляционные поля (рис.II.1 и рис.II.2) приобрели вид: рис.VI.1.

Таблица VI.1

Линии регрессий

Серии

()

()

Уравнение регрессии

Верхняя амплитуда разброса

ву

Нижняя амплитуда разброса

ну

Средняя амплитуда разброса

у

«Аномальные» А и В

(2;43)

(30;13)

3

3

3

«Фоновая» С

(2; 32)

(28; 6)

1.8

1.8

1.8

Корреляционные поля

«Аномальные» участки А и В

«Фоновый» массив С

Рис. VI.1.

Исходя из визуальной оценки корреляционных полей данных с 1 по 25 день и с 26 по 100 день работы предприятия, можно сделать следующие предварительные выводы:

ежедневные издержки предприятия на ед. продукции с 1 по 25 день достаточно сильно зависят от объёма выручки за день. Чем больше выручка, тем меньше издержки. Связь между ежедневными издержками предприятия на ед. продукции и объёмом ежедневной выручки с 1 по 25 день может быть выражена линейным уравнением:  .

Ежедневные издержки предприятия на ед. продукции с 26 по 100 день сильно зависят от дневной выручки. Чем больше выручка, тем меньше издержки на ед. продукции. Связь между этими показателями с 26 по 100 день достаточна тесная и линейно может быть выражена уравнением: .

ЗАДАЧА VII. ЛИНЕЙНАЯ РЕГРЕССИЯ

Цель задачи VII. Для каждой выделенной в предварительном анализе генеральной совокупности найти коэффициенты уравнений выборочных линейных средних квадратических регрессий Х на Y и Y на Х и остаточные средние квадратические отклонения.

«Фоновый» массив С 

Проведём анализ совместного распределения двухмерной выборки (х, у) «фонового» массива С. Теоретические пояснения к задаче-в прил. 5.