.
Нижче наведені обчислені за цією формулою координати вузлів емпіричної лінії регресії для нашого прикладу.
x = |
4,5; |
5,5; |
6,5; |
7,5; |
8,5; |
9,5; |
10,5; |
11,5 |
u = |
27,0; |
25,7; |
25,2; |
28,7; |
27,7; |
31,2; |
38,3; |
35,0 |
Розрахунки цих вузлів емпіричних ліній регресії будуть більш докладно наведені далі у загальній таблиці розрахунку сум (див. табл. 4).
При малому числі спостережень у деякі групи потрапляє занадто мало даних, тому середні значення показників у цих інтервалах будуть малонадійними. Емпірична лінія регресії в цьому випадку буде мати невиправдані зломи, “провали” чи “викиди”, які треба згладити. Рекомендується об’єднувати малонасичені інтервали з сусідніми доти, поки в кожному інтервалі буде не менш 5 спостережень, а для малої вибірки (n<100) – не менш 5% від загальної кількості спостережень, тобто не менш 0,05·n . Для нашого прикладу 0,05·60=3, тому об’єднанню підлягають крайні інтервали з частотами k1=k8=1. Для об’єднаних інтервалів треба обчислити обидві координати вузлів:
.
Точки з координатами (xi , ui) з’єднуємо відрізками прямих і одержуємо графік кореляційної залежності, навколо якого розсіяні вихідні точки (рис. 2).
У тих випадках, коли напрямок причинно-наслідкових зв’язків не відомий, обчислюють також вузли спряженої лінії регресії x по y (див. рис. 3), тобто середні значення показника x у кожній горизонтальній смузі табл. 2 :
.
Малонасичені інтервали (9, 10, 11) об’єднуємо.
Зараз нам здається, що є єдиний можливий напрямок причинно-наслідкових зв’язків – від x до y , тобто зростання обсягів прохідницьких робіт може підвищувати собівартість продукції, але не навпаки; побудова ж спряженої залежності виправдано лише методичними міркуваннями, щоб показати, як це робиться в разі потреби. Однак не будемо квапитися з остаточними висновками. Кореляційний аналіз не вирішує питання ані про природу досліджуваних зв’язків, ані про їхній напрямок (“кореляція - не є причина”). Цілком можливо, що кореляція між двома змінними спостерігається лише тому, що обидва показники залежать від однієї і тієї ж самої причини. У такому випадку немає підстав підносити будь-який показник у ранг результативної ознаки і тим самим віддавати перевагу одній з спряжених залежностей; тут більш доцільним представляється використання “діагональної регресії”, графік якої збігається з головною віссю облака розсіювання. Спосіб побудови діагональної регресії буде поданий далі.
Рис. 2. Емпірична лінія |
Рис. 3. Емпірична лінія |
регресії y по x |
регресії x по y |
¶ – центр ; ––○–– – вузли ліній регресії (xi , ui) і (vj, yj) ; · – дані . |
Наша мета – оцінити (обчислити) параметри лінійної моделі
y = b0 + b1 x + e .
Відомо, що ці параметри (коефіцієнти регресії) визначають за формулами:
де .
Отже, нам потрібно підрахувати суми [x], [y], [x2], [y2], [xy], де квадратними дужками позначено сумування по всім спостереженням (позначення Гауса). У попередньому розділі дані були піддані подвійному угрупованню (на kx=8 класів – по змінній x і на ky= 11 класів – по змінний y). У кореляційній табл. 2 приведені значення центрів класів, частоти mij влучення емпіричних даних у клітинку з центром (xi , yj), сумарні частоти по стовпцях і рядках . Загальне число спостережень .
Розглянемо детально суми, що необхідні для розрахунку параметрів лінійної моделі, по згрупованих даних:
Першу суму можна обчислити по двох еквівалентних формулах і . Подвійний розрахунок забезпечує надійний контроль. Для інших сум можна також запропонувати обчислення з поточним контролем.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.