Точечные оценки неизвестных параметров. Интервальные оценки неизвестных параметров. Проверка статистических гипотез. Оценка ошибки выборки

Страницы работы

20 страниц (Word-файл)

Фрагмент текста работы

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ СИБСТРИН

Кафедра прикладной математики

Индивидуальное задание

по математической статистике

Выполнила: студентка 253 группы

Соломатина А.А.

Проверил: Соппа М.С.                                                                                                   

Новосибирск, 2010г.

СОДЕРЖАНИЕ:

Введение………………………………………………………………………

1 Раздел Точечные оценки неизвестных параметров………………………

Задача…………………………………………………………………

Построить гистограмму……………………………………………

Задача…………………………………………………………………

Задача…………………………………………………………………

Задача…………………………………………………………………

Задача…………………………………………………………………

Раздел 2  Интервальные оценки неизвестных параметров………………

2.1 Задача……………………………………………………………………

2.2 Задача…………………………………………………………………

2.3 Задача…………………………………………………………………

Раздел 3  Проверка статистических гипотез …………………………

3.1.1 Задача………………………………………………………………

3.1.2 Задача……………………………………………………………

3.2.1 Задача…………………………………………………………………

3.2.2 Задача……………………………………………………………

Раздел 4 Оценка ошибки выборки…………………………………………

4.1 Задача……………………………………………………………

Раздел 1.  Точечные оценки неизвестных параметров

Математическая статистика — раздел математики, посвященный методам и правилам обработки и анализа статистических данных, т. е. сведений о числе объектов, обладающих определенными признаками, в какой-либо более или менее обширной совокупности. Сами методы и правила строятся безотносительно к тому, какие статистические данные обрабатываются (физические, экономические и др.), но обращение с ними требует обязательного понимания сущности явления, изучаемого с помощью этих правил.

Генеральная совокупность – совокупность результатов всех мыслимых наблюдений, проводимых в кажущихся неизменных условиях над одной из случайных величин X , связанных с данным видом объектов.

Статистический ряд распределения – таблица, в верхней строчке которой записываются все различные элементы выборки, а в нижней строчке – относительные частоты, соответствующие данным элементам.

Обычно в распоряжении имеются лишь данные выборки, например значения количественного признака х1, х2, …, хn, полученные в результате n наблюдений. Через эти данные и выражается оцениваемый параметр. Рассматривая х1, х2, …, хn как независимые случайные величины Х1, Х2, …, Хn, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения – это значит найти функцию от наблюдаемых случайных величин, которая и даёт приближённое значение оцениваемого параметра.

Оценкой неизвестного параметра Ѳ называется любая случайная величина Ѳ*, зависящая от (Х1, Х2,…, Хn).

Выборочная средняя хср – это понятие математической статистики — один из основных параметров, характеризующих распределение как выборки, так и генеральной совокупности, это среднее арифметическое значение признака выборочной совокупности.

Выборочная дисперсия Dв – это среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения хср.

Задача 1.1.

Дана выборка Y:

3,63

4,52

2,12

3,78

4,62

1,91

4,12

3,85

2,65

2,72

5,79

2,93

4,67

4,72

5,54

3,13

3,16

2,03

2,72

3,49

4,38

4,54

3,42

3,45

2,63

4,79

4,70

4,23

5,08

4,17

6,06

4,36

5,52

5,22

6,89

1,42

2,97

5,58

5,70

3,75

6,64

3,62

5,39

3,79

5,67

5,18

3,11

2,42

4,94

5,10

Табл.1

Задание: Построить интервальный вариационный ряд, разбив выборку на 5 частей.

Решение: Для построения  интервального вариационного ряда необходимо    найти максимальное и минимальное значение выборки.

n=50

Ymax=6,64

Ymin=1,42

Находим величину интервала h, используя максимальное и минимальное значение выборки:

h= (Ymax - Ymin)/5,

h= (6,64-1,42)/5=1,044

Теперь строим интервальный вариационный ряд с указанием абсолютных и относительных частот.

Относительная частота – это есть вероятность попадания  определённого значения в конкретный интервальный ряд.

Y

F

ω(Р)

1,42-2,464

5

0,1

2,464-3,508

12

0,24

3,508-4,552

13

0,26

4,552-5,596

14

0,28

5,596-6,64

6

0,12

Табл. 2

 Границы интервальных рядов считаются по формулам: сi=a + i*h, где i изменяется от 1 до 5.

Задача 1.2.

 Построить гистограмму относительных частот, используя интервальный вариационный ряд. Сделать предположение о виде генеральной совокупности.

Решение

Используя данные табл.2, построим гистограмму относительных частот.

Для построения необходимо найти середины интервалов:

1) 1,42 + 0,522 = 1,942

2) 2,464 + 0,522 = 2,986

3) 3,508 + 0,522 = 4,03

4) 4,552 + 0,522 = 5,074

5) 5,596 + 0,522 = 6,118

Гистограмма относительных частот:

Вывод: По построенной гистограмме мы можем выдвинуть гипотезу о виде распределения генеральной совокупности. Генеральная совокупность распределена по закону близкому к нормальному закону.

Задача 1.3.

Найти двумя способами состоятельную и несмещённую оценку для Хг.

Состоятельной и несмещённой оценкой Хг является Хв.

1-й способ:

Хв = хср. Рассчитаем хср с помощью Excel. В результате этого получим хср=4,1364.

2-й способ

Вычисляем хср  приближённо, используя интервальный вариационный ряд.

Для этого находим середины интервалов:

Середины интервалов:

[1,42; 2,464) – 1,942;

[2,464; 3,508) – 2, 986;

[3,508; 4,552) – 4,03;

[4,552; 5,596) – 5,074;

[5,596; 6,64] – 6,118.

Вычисляем по формуле:

хср ≈ а11 + а22 +… +аn*ωn,

хср1,942*0,1+2,986*0,24+4,03*0,26+5,074*0,28+6,118*0,124,1135

Задача 1.4

Найти двумя способами состоятельную и несмещённую оценку для дисперсий генеральной совокупности.

S2= n/(n-1)*DB.

S2 найти двумя способами.

1-й способ 

Найдём  значение дисперсии точно, с помощью Excel.

DB= 0,83057.

S2=50/49*0,83057=0,8475.

2-й способ 

Найдём значение дисперсии приблизительно по следующей формуле:

DB ≈ а121 + а222 +… +аn2n,

       S2 ≈50/49*0,913≈0,932.

DB≈(0,1)2*1,942+(0,24)2*2,986+(0,26)2*4,03+(0,28)2*5,074+(0,12)2*6,118 ≈ 0,0192+0,1799+0,2724+0,3978+0,0881 ≈ 0,9574.

       S2 ≈50/49*0,9574≈0,9769.

Задача 1.5  

Построить корреляционную таблицу

 Y

Х

[1,42-2,464)

[2,464-3,508)

[3,508-4,552)

[4,552-5,596)

[5,596-6,64]

[2,18;3,07)

0,04

0,02

0

0

0,02

[3,07;3,96)

0,04

0,08

0,1

0,1

0,06

[3,96;4,85)

0

0,08

0,08

0,12

0,02

[4,85;5,74)

0,02

0,02

0,08

0,06

0,02

[5,74;6,63]

0

0,04

0

0

0

Задача 1.6

Оценить коэффициент корреляции двумя способами: Excel и с помощью корреляционной таблицы. Выдвинуть гипотезу о существовании корреляционной связи между Х и Y.

1 способ

Рассчитываем коэффициент корреляции в Excel: rв =0,2306.

2 способ

Рассчитываем коэффициент корреляции, пользуясь корреляционной таблицей, по следующей формуле:

rв ≈( x*y – xср*yср )/*,

x*y=∑∑xiyiωi,,

x*y=2,625*(1,942*0,04 + 2,986*0,02 +6,118*0,02) +

3,515*(1,942*0,04 + 2,986*0,08 +4,03*0,01+5,074*0,01+6,118*0,06) +

4,405*(2,986*0,08 +4,03*0,08 + 5,074*0,12 + 6,118*0,02) +

5,295*(1,942*0,02 + 2,986*0,02 + 4,03*0,08 + 5,074*0,06 + 6,118*0,02) +

6,185*2,986*0,04 ≈ 17,489

xср =4,223,      DX= 0,373.

yср = 4,113,      DY=0,977.

rв = (17,489– 4,223*4,113) / (0,611*0,988)= 0,12/0,6037 ≈0,19.

Коэффициент корреляции был посчитан двумя способами и получился примерно одинаковым: rв≈0,19.

На основании полученных данных можно сказать, что между

Похожие материалы

Информация о работе