Алгоритм
1.1 Назначение алгоритма
Алгоритм предназначен для группировки объектов выборки в группы и вычисления статистических характеристик каждой группы и выборки в целом.
1.2 Содержательная постановка задачи и расчетная схема
Имеется совокупность NO объектов . Функционирование каждого объекта описывается рядом количественных признаков . Один из этих признаков является зависимым от остальных , .
Форма зависимости известна. Необходимо определить теоретические значения зависимого признака (Y*) для каждого объекта выборки и сгруппировать по нему объекты в группы. Границы групп (по выравненному Y*) заданы. Для каждой группы и выборки в целом определить статистические характеристики. Решение осуществляется на основе исходной матрицы данных X(NO, NP) по следующей схеме:
а) среди признаков, характеризующих объекты выборки, устанавливается зависимый (Y);
б) задается вид уравнения многофакторной регрессии;
в) задаются число групп и границы каждой по теоретическому значению зависимого признака Y;
г) по заданному уравнению регрессии и фактическим значениям определяются теоретические значения зависимого признака (Y*) для каждого объекта выборки;
д) по выравненному Y * объекты группируются;
е) для каждой группы устанавливаются номера объектов, вошедших в группу, фактическое и выравненное значение зависимого признака, отклонение выравненного значения от фактического, среднемодульная ошибка аппроксимации зависимого признака;
ж) для выборки в целом определяются среднее значение каждого признака, среднее значение зависимого признака, среднемодульная ошибка аппроксимации зависимого признака.
1.3 Математическая постановка и описание алгоритма
Пусть значение , характеризует i-й объект выборки . Форма зависимости задана уравнением:
, (1)
где Y* - теоретическое значение зависимого признака;
Xj - фактическое значение независимой переменной, j = 1,…, NP;
- коэффициенты регрессии.
Задано число групп (KG) и нижняя граница B (KG) каждой группы по выравненному значению зависимого признака (Y*).
Определить вектор , среднее значение зависимого признака , среднемодульную ошибку аппроксимации зависимого признака , среднее значение независимого признака для выборки в целом. Сгруппировать объекты в группы, определить номера объектов, вошедших в группу, среднемодульную ошибку аппроксимации зависимого признака в группе. Вектор определяется по формуле.
Среднее значение зависимого признака определяется по формуле:
, (2) где NO - число объектов выборки;
Yi - фактическое значение зависимого признака для i-го объекта.
Среднемодульная ошибка аппроксимации зависимого признака определяется по формуле
, (3)
где - теоретическое значение зависимого признака для i-го объекта.
Среднее значение независимого признака определяется по формуле
, (4)
где - фактическое значение j-го признака для i-го объекта.
Пусть - нижняя граница K-ой группы объектов по выравненному значению Y*, - нижняя граница следующей по порядку -ой группы. Тогда в группу K войдут те объекты, для которых .
Среднемодульная ошибка аппроксимации зависимого признака Y в K-й группе определяется по формуле
, (5)
где l - число объектов, вошедших в K -ю группу;
- теоретическое значение зависимого признака для объекта i в группе K.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.