асс. кафедры информатики ФГБОУ ВПО «АмГПГУ»
Применение вейвлет –анализа в задаче оценки регрессии
Основные определения
Регрессия – это зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости , когда каждому значению независимой переменной x соответствует одно определённое значение величины , при регрессионной связи одному и тому же значению могут соответствовать в зависимости от случая различные значения величины .
Пусть существует зависимость переменной от переменных .
Переменные называются предикторами, это те переменные, для которых можно устанавливать желаемые значения или те которые можно только наблюдать, но не управлять ими.
Зависимая переменная , или переменная отклик, это такая переменная, которая изменяется в результате изменений переменных .
Классическая схема регрессии- это случай, когда значения детерминированы, предопределены. Обычно в этом случае значения переменной расположены равномерно.
Стохастическая схема регрессии - это случай, когда значения являются результатами измерений, обработки или случайно выбраны. Обычно значения располагаются нерегулярно.
Пары случайных чисел имеют двумерное распределение вероятностей некоторого типа. Если связь между зависимой случайной величиной и величиной , которая не является случайной переменной, установлена, то уравнение относительно будет назваться уравнением регрессии.
Изображение чисел на графике называется диаграммой рассеивания или точечной диаграммой.
Для случая n независимых переменных сложно изобразить диаграмму рассеивания, так же существует сложность определения принадлежности точки заданной области.
Оценивание регрессии
Сначала по данным строится регрессионная поверхность, а затем, зная эту зависимость и новый набор независимых переменных оцениваются значения зависимой переменной .
Использование вейвлет-анализа
В системе Matlab реализован случай , по следующему алгоритму:
1. Преобразование данных в данные, используя процедуру разбиения области значений на малые промежутки. Значения равномерно распределены. Для каждого промежутка определяем:
2. Делаем вейвлет-разложение сигнала , используя быстрые алгоритмы. Здесь предполагается, что данные есть 1,2,…,nb , где nb – число промежутков;
рис.1. реализация одномерной регрессии в Matlab.
3. Делаем пороговую обработку вейвлет-коэффициентов;
4. Восстанавливаем оценку функции из обработанных вейвлет-коэффициентов, используя быстрые алгоритмы;
5. Перемасштабируем результирующую функцию , преобразовывая 1,2,…,nb в данные , и интерполируем в каждом промежутке, чтобы найти оценку .
Расширив этот алгоритм до случая n-переменных , возможно, реализовать многомерную регрессию.
Библиографический список:
1. Дрейпер, Н., Смит, Г. Прикладной регрессионный анализ. Перевод с английского Адлера , Ю.П.,Горского, В.Г. М. «Финансы и статистика» 1986 книга 1.
2. Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в MATLAB.М.: ДМК, 2005. – 305 с.
3. www.mathworks.com
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.