Основные формулы математической статистики

Страницы работы

Фрагмент текста работы

Стандартное отклонение – величина именованная, выраженная в тех же единицах измерения, как и средняя арифметическая.

Поэтому для сравнения разных признаков, выраженных в разных единицах измерения, используется не абсолютное, а относительное значение стандартного отклонения в форме коэффициента вариации:

, где

σ – стандартное отклонение;

μ – средняя арифметическая.

Асимметрия

Правосторонняя асимметрия – отрицательна, левосторонняя–положительна.

Эксцесс

Эксцесс положителен при островершинной кривой, отрицателен при плосковершинной.

Ошибка репрезентативности (выборочной средней)

 – возможная максимальная абсолютная погрешность при прогнозе генерального параметра;

t – критерий надежности, или показатель вероятности того, что величина генерального параметра действительно будет находиться внутри найденных доверительных границ;

 – максимальная доверительная граница, или возможный максимум;

 – минимальная доверительная граница, или гарантированный минимум.

Три порога надежности (вероятности безошибочных прогнозов)

Порог

Применение

Надежность или вероятность безошибоч-ных прогнозов

Критерий надежности для достаточно больших выборок

Объем достаточно больших выборок

1

Обычные требования надежности в большинстве биологических исследований

b1 = 0,95

t1= 1,960

n1 > 30

2

Повышенные требования, надежности при проверочных опытах и в экономических работах

b2 =0,99

t2=2,576

n2 > 100

3

Высокие требования  надежности при разрешении спорных вопросов, при проверке гипотез и при исследованиях вредных и ядовитых веществ

b3 = 0,999

t3 = 3,291

n3 > 200

Показатель точности

Ошибка стандартного отклонения

Ошибка коэффициента вариации

Ошибка показателя асимметрии

Ошибка показателя эксцесса

Средняя ошибка суммы нескольких средних

Средняя ошибка произведения двух выборочных средних

Средняя ошибка частного двух выборочных средних

Средняя ошибка разности выборочных средних двух независимых распределений

При n1 = n2

При n1≠n2

σ – объединенная дисперсия двух выборок

Средняя ошибка разности в парных опытах

Di разности между вариантами сопряженных рядов X1 и X2;

n – общее число парных наблюдений.

Корреляция. Коэффициент корреляции

, где

– нормированные отклонения данных по первому и второму признаку;

n= n–1 – число степеней свободы, равное в данном случае числу сравниваемых пар без одной.

          

Ошибка репрезентативности коэффициента корреляции:

Коэффициент прямолинейной регрессии

, где

s2 – стандартное отклонение второго признака, который изменяется в связи с изменением первого;

s1 – стандартное отклонение первого признака, в связи с изменением которого изменяется второй признак;

r12 – коэффициент корреляции между первым и вторым признаками.

Уравнение прямолинейной регрессии

(X22)=R2/1 (X1- μ 1)

Ошибка коэффициента регрессии

.

Корреляционное отношение второго признака по первому

, где ,

Примерное значение ошибки квадрата корреляционного отношения η2

, где

g – число классов первого признака;

N – объем выборки.

Критерий достоверности (F) и доверительные границы квадрата корреляционного отношения

,

,

Критерий линейности корреляции

, где

η2 – квадрат корреляционного отношения Y по Х;

r2 – квадрат коэффициента линейной корреляции;

n – объем выборки;

kx – число групп по ряду X.

Связь можно практически принять за линейную, если Fфакт < Fтеор. Корреляция нелинейная, если Fфакт ≥ Fтеор.

Частные коэффициенты корреляции

;

;

.

Множественный коэффициент корреляции трех переменных – это показатель тесноты линейной связи между одним из признаков (буква индекса перед тире) и совокупностью двух других признаков (буквы индекса после тире):

;

;

.

Значимость множественной корреляции оценивается по F–критерию:

, где:

n – объем выборки,

k – число признаков.

Множественное линейное уравнение плоскости регрессии

Однофакторный статистический комплекс

, где

СY – сумма квадратов по всему комплексу;

СV сумма квадратов между выборками;

Czсумма квадратов внутри выборок.

N – 1 – общее число степеней свободы;

l–1 – степени свободы для вариантов и N–l для случайного варьирования.

 – корректирующий фактор (поправка);

 – общая сумма квадратов;

 – сумма квадратов для вариантов;

 сумма квадратов для ошибки (остаток).

Оценка значимости действия изучаемых факторов

.

Если Fфакт < Fтеop, то нулевая гипотеза Но: d = 0 не отвергается; между всеми выборочными средними нет существенных различий. Нулевая гипотеза отвергается, когда Fфакт ≥ Fтеop.

Многофакторный дисперсионный анализ

В двухфакторном опыте, поставленном методом обычных повторений, сумма квадратов для вариантов CV расчленяется на три, а в трехфакторном – на семь компонентов. Общая сумма квадратов для этих опытов будет представлена следующими выражениями (в скобках указаны суммы квадратов

Похожие материалы

Информация о работе