Сільськогосподарське виробництво у селянському господарстві Харківської губернії, страница 14

В умовах високого темпу росту населення, показники зборів зернових культур і кількості худоби мають сенс скоріше у відносному вираженні (на душу населення, на двір і т.д.). Для одержання відносних даних, в аналіз був включений показник абсолютної кількості сільського населення (понад 95 % якого складали селяни). Показники збору без урахування насіння п'яти основних зернових культур і вартість худоби на душу населення стали відповідно четвертою і п'ятою перемінною.  

Земля була основою матеріально-технічної бази селянського господарства. Основу селянського землекористування складала надільна земля. Однак постійного обліку надільного землеволодіння не велося, є лише дані за окремі роки – в основному, матеріали земельних переписів. Але з огляду на те, що протягом післяреформеного періоду загальна кількість надільної землі практично залишалась незмінною (за 1877-1905 рр. приріст склав 3,6 %) цей показник не такий уже і цікавий. А от у приватному селянському землеволодінні відбувалися значні зміни, тому абсолютну кількість приватного селянського землеволодіння було обрано в якості шостого показника.

Отже, предмет аналізу склали шість динамічних рядів (графік 129): збори без урахування насіння п'яти основних зернових культур (у млн. крб.) на надільних селянських землях за 1883-1915 рр.; вартість усієї сільської худоби (у млн. крб.) за 1878-1916 рр.; кількість сільського населення (у тис. чол.) за 1871-1915 рр.; збори без урахування насіння п'яти основних зернових культур (у крб.) на душу сільського населення за 1883-1915 рр.; вартість худоби (у крб.) на душу сільського населення за 1878-1915 рр.; рух приватного селянського землеволодіння (тис. дес.) у 1862-1914 рр. Що стосується довжини рядів, то бралося максимально можлива (наявна в джерелах) кількість перемінних.

Два основних моменти технічного аналізу полягали у визначенні природи рядів і побудові на їхній основі прогнозу. Реалізовувалися вони в рамках програм MS EXCEL і  STATISTICA.

Спочатку був проведений візуальний аналіз даних. Для попередньої оцінки тренда рядів на графіки додавався поліном другого порядку. Поліноміальний підбор відбив тенденції абсолютного росту всіх трьох показників. За відносними показниками, спостерігається зростання чистого збору на душу населення й зниження кількості худоби.

Наступний етап аналізу – попередній вибір функції згладжування рядів. Критерієм вибору функції служить величина вірогідності апроксимації (коефіцієнт детермінації R2). Усі ряди найкраще описуються трьома видами функцій: лінійною, поліноміальною і експонентною. Ці функції дуже добре описують динаміку абсолютної кількості населення і приватного землеволодіння, досить непогано динаміку абсолютної вартості худоби. Невеликі коефіцієнти детермінації по зборам і худобі пояснюються наявністю значної стохастичної компоненти (через сильні коливання врожаїв у першому випадку і, швидше за все, помилок обліку в другому). По відносним даним ці функції пояснюють дисперсію усього на     16-19 % у першому і на менше 10 % у другому випадку. Таким чином, уже на цьому етапі аналізу можна відзначити, що ряди з відносними даними досить "проблемні": невелика кількість перемінних і значна дисперсія дуже утруднить аналіз і знизить рівень вірогідності прогнозованих даних.

Спеціальний модуль STATISTICA Time series/Forecasting (Аналіз часових рядів і прогнозування) пропонує два основних методи прогнозування часових рядів – метод Авторегресії та проінтегрованого змінного середнього (АРПЗС/ARIMA) і метод експонентного згладжування й прогнозування (Exponential smoothing&forecasting).

Обидва ці методи мають свої переваги й недоліки, тому використаємо їх разом. Передбачувана подібність буде служити важливим показником адекватності побудованої моделі. Не зупиняючи докладно на описанні аналізу кожного показника, наведемо загальний алгоритм дій.