Алгоритм
1.1 Назначение алгоритма
Алгоритм предназначен для группировки объектов выборки в группы и вычисления статистических характеристик каждой группы и выборки в целом.
1.2 Содержательная постановка задачи и расчетная схема
Имеется
совокупность NO объектов .
Функционирование каждого объекта описывается рядом количественных признаков
. Один из этих признаков
является зависимым от остальных
,
.
Форма зависимости известна. Необходимо определить теоретические значения зависимого признака (Y*) для каждого объекта выборки и сгруппировать по нему объекты в группы. Границы групп (по выравненному Y*) заданы. Для каждой группы и выборки в целом определить статистические характеристики. Решение осуществляется на основе исходной матрицы данных X(NO, NP) по следующей схеме:
а) среди признаков, характеризующих объекты выборки, устанавливается зависимый (Y);
б) задается вид уравнения многофакторной регрессии;
в) задаются число групп и границы каждой по теоретическому значению зависимого признака Y;
г) по
заданному уравнению регрессии и фактическим значениям определяются
теоретические значения зависимого признака (Y*) для каждого объекта выборки;
д) по выравненному Y * объекты группируются;
е) для каждой группы устанавливаются номера объектов, вошедших в группу, фактическое и выравненное значение зависимого признака, отклонение выравненного значения от фактического, среднемодульная ошибка аппроксимации зависимого признака;
ж) для выборки в целом определяются среднее значение каждого признака, среднее значение зависимого признака, среднемодульная ошибка аппроксимации зависимого признака.
1.3 Математическая постановка и описание алгоритма
Пусть
значение ,
характеризует
i-й объект выборки
. Форма зависимости задана уравнением:
, (1)
где Y* - теоретическое значение зависимого признака;
Xj - фактическое значение независимой переменной, j = 1,…, NP;
- коэффициенты регрессии.
Задано
число групп (KG) и нижняя
граница B (KG) каждой группы по выравненному значению зависимого признака (Y*).
Определить
вектор , среднее значение зависимого признака
, среднемодульную ошибку аппроксимации
зависимого признака
, среднее значение независимого
признака
для
выборки в целом. Сгруппировать объекты в группы, определить номера объектов,
вошедших в группу, среднемодульную ошибку аппроксимации зависимого признака в
группе. Вектор
определяется по формуле.
Среднее
значение зависимого признака определяется по
формуле:
, (2)
где
NO - число объектов выборки;
Yi - фактическое значение зависимого признака для i-го объекта.
Среднемодульная
ошибка аппроксимации зависимого признака определяется по формуле
, (3)
где - теоретическое значение зависимого признака для i-го объекта.
Среднее
значение независимого признака определяется по формуле
, (4)
где - фактическое значение j-го признака для i-го объекта.
Пусть
- нижняя граница K-ой группы объектов по выравненному значению Y*,
- нижняя граница следующей по порядку
-ой группы. Тогда в группу K войдут те объекты, для которых
.
Среднемодульная ошибка аппроксимации зависимого признака Y в K-й группе определяется по формуле
, (5)
где l - число объектов, вошедших в K -ю группу;
- теоретическое значение зависимого признака для объекта i в группе K.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.