- Использование периодов времени
Если базовый набор данных указывает на наличие тренда в последовательных периодах времени, то само время можно использовать в качестве предиката прогнозирования.
Регрессии, которые используют взаимосвязь между двумя переменными для предсказания значения одной из них, называются простыми регрессиями. Метод регрессии позволяет использовать и несколько переменных предиката.
Предположим, что у нас есть доступ к историческим данным трех показателей: ежемесячному объему продаж (ОП), инвестициям в рекламу (ИР) и количеству задействованных торговых агентов (ТА) в каждом из месяцев. Функция пакета анализа в этом случае может вернуть следующее уравнение для прогноза в следующем периоде:
ОП = (25 * ИР) + (802 * ТА) + 37, 268
Здесь все усложняется. Чем больше переменных предикатов используется, тем длиннее должен быть базовый набор данных, в противном случае прогнозы будут крутиться вокруг одного места, как в водовороте. А если количество переменных в уравнении приблизиться к количеству записей в базовом наборе данных, прогноз станет недостоверным.
Поэтому лучше всего использовать в качестве периода прогноза 1 месяц. Месяц – достаточно длительных период, чтобы использовать его для прогноза, в то же время данные всего за 4 года составят 48 записей в базовом наборе данных, чего вполне достаточно для использования 4-5 переменных предикатов. Главное – правильно выбирать эти предикаты: ведь объем продаж потенциально может зависеть от размера инвестиций в рекламу, количества торговых агентов и периодов времени.
Для того чтобы облегчить анализ данных необходимо вывести его на точечную диаграмму. Если мы увидим нечто, напоминающее диагональную линию, то продолжать работу имеет смысл. Если же это нечто больше напоминает окружность, то взаимосвязь между переменными, скорее всего, отсутствует.
Рис.10 (диаграмма и данные)
Как воспользоваться функцией регрессии пакета анализа:
1) Выбрать в меню пункт Данные → Анализ данных
2) Выделить в списке инструментов элемент Регрессия и щелкнуть на кнопке ОК
Откроется диалоговое окно
3) Щелкнуть в поле Входной интервал Yи протащить указатель мыши по ячейкам, содержащим значения прогнозируемой переменной
4) Щелкнуть в поле Входной интервал Xи протащить указатель мыши по ячейкам, содержащим значения переменных предиката
5) Так как в диапазоны значений переменных X и Y входит первая строка, содержащая названия переменных, следует установить флажок Метки
6) Если необходимо, то щелкнуть в поле Выходной интервал
7) Когда будет выделено поле Выходной интервал, щелкнуть в ячейке, начиная с которой должны выводиться результаты выполнения процедуры, а затем щелкнуть на кнопке ОК.
Функция регрессии сформирует массив информации (рис.11)
Рис.11 (массив информации)
На что следует обратить внимание в результатах вычислений:
- Значение Множественный R. На рис.11 это значение находится в ячейке В4. Чем ближе это значение к единице, тем сильнее взаимосвязь прогнозируемой переменной и переменных предиката и с тем большим доверием можно относиться к прогнозу. В простой регрессии значение Множественный Rявляется обычной корреляцией между предикатом и переменной прогнозирования
- Значения Y- пересечение и Месяц. На рис.11 эти значения находятся в ячейках В17 и В18. Они являются коэффициентами уравнения прогноза
Используя информацию, предоставленную функцией регрессии, можно немного округлить значения и записать следующее уравнение:
Выручка = (18 * Месяц) + 404
Можно сказать, что в данном базовом наборе данных лучшей оценкой ежемесячного объема продаж было бы произведение номера месяца (от 1 до 24) и 18, сложенное с числом 404.
Следовательно, для вычисления прогноза на следующий месяц (с номером 25) ее можно подставить в соответствующую ячейку в следующем виде:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.