Метод наименьших квадратов. Простая линейная регрессия, страница 6

Всякий временной ряд теоретически может быть представлен в виде суммы составляющих yi = f(ti) + di + ei, где f(t) – некоторая функция, называемая трендом,           di - циклические (периодические) колебания, в том числе сезонные, ei – случайные отклонения. Сезонные колебания – это возрастание или убывание уровней ряда, повторяющиеся регулярно с определенным интервалом (например, потребление топлива и электроэнергии, сезонная продажа товаров и т.д.). В дальнейшем мы не будем рассматривать влияние сезонных колебаний, т.е. будем полагать, что yi = f(ti) + ei. Полагаем, что ei – независимые нормально распределенные случайные величины с нулевым математическим ожиданием (Mei = 0) и дисперсией Dei = si2 = si.

Одной из важных задач анализа временных рядов является выделение тренда, т.е. построение функции g(t), которая достаточно близка к f(t). Эту задачу называют задачей сглаживания.

Задача сглаживания. Задача сглаживания заключается в построении функции g(t), которая приближает неизвестный нам тренд f(t) на основании имеющегося у нас временного ряда (ti, yi), 1 £ i £ n.

Задача прогноза. По имеющимся значениям уровней временного ряда (ti, yi),        1 £ i £ n предсказать значения временного ряда (tn+1, yn+1), (tn+2, yn+2),…, (tn+p, yn+p).

Отметим, что при решении задачи прогноза сначала, как правило, решается задача сглаживания, а затем, используя тренд, строится прогноз. Функцию f(t) выбирают таким образом, чтобы она давала содержательное объяснение изучаемого процесса /5/.

5.3. Решение задач сглаживания и прогноза методом

наименьших квадратов

Для решения задач сглаживания и прогноза используются различные методы, мы рассмотрим только метод наименьших квадратов для линейной и параболической зависимостей.

Линейная зависимость

Линейная зависимость выбирается, как правило, в тех случаях, когда в исходном временном ряду более или менее постоянные абсолютные цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению /5/.

Пусть задан временной ряд (ti, yi), 1 £ i £ n. Считаем, что yi = f(ti)+ei, 1 £ i £ n. Предполагаем, что тренд f(t) – линейная функция, а именно: f(t) = a+bt.

Применим метод наименьших квадратов для решения задачи сглаживания. Запишем функцию  и будем искать такие значения параметров a и b, при которых функция U достигает минимума (см. п.п. 4.2). Запишем нормальную систему:

Эта система линейных уравнений имеет единственное решение, которое находится методом Гаусса с частичным выбором ведущего элемента. Функция f(t) = a+bt является решением задачи сглаживания.

Зная a и b, мы можем вычислить значение функции f(t) = a+bt  для любого значения t. Значения прогноза yn+1, yn+2,…, yn+p, находятся по формуле yn+j = f(a, b, tn+j), где    j принимает значения 1, 2,…, p.

Параболическая (квадратичная) зависимость

Параболическая зависимость используется, если абсолютные цепные приросты обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второго порядка) никакой тенденции развития не проявляют /5/.

Пусть задан временной ряд (ti, yi), 1 £ i £ n. Считаем, что yi = f(ti)+ei, 1 £ i £ n. Предполагаем, что тренд f(t) – параболическая (квадратичная) функция, а именно:    f(t) = a+bt+ct2.

Применим метод наименьших квадратов для решения задачи сглаживания. Запишем функцию

и будем искать такие значения параметров a, b и c, при которых функция U достигает минимума (см. п.п. 4.3). Запишем нормальную систему:

Эта система линейных уравнений имеет единственное решение, которое находится методом Гаусса с частичным выбором ведущего элемента. Функция f(t) = a+bt+ct2 является решением задачи сглаживания.

Зная a, b и c, мы можем вычислить значение функции f(t) = a+bt+ct2 для любого значения t. Значения прогноза yn+1, yn+2,…, yn+p, находятся по формуле                         yn+j = f(a, b, с, tn+j), где   j принимает значения 1, 2,…, p.