Полезные материалы:

Решения типовых задач - Теория вероятностей

Критерий Пирсона. Проверка гипотезы о нормальном распределении.

Задача 1.

Используя критерий Пирсона, при уровне значимости a = 0,05 проверить, согласуется ли гипотеза о нормальном распределении генеральной совокупности X с эмпирическим распределением выборки объема n = 200.

5

7

9

11

13

15

17

19

21

15

26

25

30

26

21

24

20

13

Решение.

1. Вычислим  и выборочное среднее квадратическое отклонение .
2. Вычислим теоретические частоты учитывая, что n = 200, h = 2,  = 4,695, по формуле
.

 

Составим расчетную таблицу (значения функции j(x) приведены в приложении 1).


i

 

 

1

5

-1,62

0,1074

9,1

2

7

-1,20

0,1942

16,5

3

9

-0,77

0,2966

25,3

4

11

-0,35

0,3752

32,0

5

13

0,08

0,3977

33,9

6

15

0,51

0,3503

29,8

7

17

0,93

0,2589

22,0

8

19

1,36

0,1582

13,5

9

21

1,78

0,0818

7,0

      
3. Сравним эмпирические и теоретические частоты. Составим расчетную таблицу, из которой найдем наблюдаемое значение критерия :


i

 

 

 

 

1

15

9,1

5,9

34,81

3,8

2

26

16,5

9,5

90,25

5,5

3

25

25,3

0,3

0,09

0,0

4

30

32,0

2,0

4,0

0,1

5

26

33,9

7,9

62,41

1,8

6

21

29,8

8,8

77,44

2,6

7

24

22,0

2,0

4,0

0,2

8

20

13,5

6,5

42,25

3,1

9

13

7,0

6,0

36,0

5,1

Сумма

200

 

 

 

=22,2

По таблице критических точек распределения  (приложение 6), по уровню значимости a = 0,05 и числу степеней свободы k = s – 3 = 9 – 3 = 6 находим критическую точку правосторонней критической области  (0,05; 6) = 12,6.
Так как =22,2 >  = 12,6, гипотезу о нормальном распределении генеральной совокупности отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо.

 

Задача2

Представлены статистические данные.

Результаты измерений диаметров n = 200 валков после шлифовки обобщены в табл. (мм):
Таблица Частотный вариационный ряд диаметров валков

i

1

2

3

4

5

6

7

8

xi, мм

6,68

6,69

6,7

6,71

6,72

6,73

6,74

6,75

ni

2

3

12

6

11

14

30

25

 

i

9

10

11

12

13

14

15

16

xi, мм

6,76

6,77

6,78

6,79

6,8

6,81

6,82

6,83

ni

27

31

14

8

5

6

5

1

Требуется:

1) составить дискретный вариационный ряд, при необходимости упорядочив его;

2) определить основные числовые характеристики ряда;

3) дать графическое представление ряда в виде полигона (гистограммы) распределения;

4) построить теоретическую кривую нормального распределения и проверить соответствие эмпирического и теоретического распределений по критерию Пирсона. При проверке статистической гипотезы о виде распределения принять уровень значимости a = 0,05


Решение: Основные числовые характеристики данного вариационного ряда найдем по определению. Средний диаметр валков равен (мм):
xср =  = 6,753;
исправленная дисперсия (мм2):
D =  = 0,0009166;
исправленное среднее квадратическое (стандартное) отклонение (мм):
s =   = 0,03028.

Рис. Частотное распределение диаметров валков

Исходное («сырое») частотное распределение вариационного ряда, т.е. соответствие ni(xi), отличается довольное большим разбросом значений ni относительно некоторой гипотетической «усредняющей» кривой (рис.). В этом случае предпочтительно построить и анализировать интервальный вариационный ряд, объединяя частоты для диаметров, попадающих в соответствующие интервалы.
Число интервальных групп K определим по формуле Стерджесса:
K = 1 + log2n = 1 + 3,322lgn,
где n = 200 – объем выборки. В нашем случае
K = 1 + 3,322×lg200 = 1 + 3,322×2,301 = 8,644 » 8.
Ширина интервала равна (6,83 – 6,68)/8 = 0,01875 » 0,02 мм.
Интервальный вариационный ряд представлен в табл.

Таблица Частотный интервальный вариационный ряд диаметров валков.

k

1

2

3

4

5

6

7

8

xk, мм

6,68 – 6,70

6,70 – 6,72

6,72 – 6,74

6,74 – 6,76

6,76 – 6,78

6,78 – 6,80

6,80 – 6,82

6,82 – 6,84

nk

5

18

25

55

58

22

11

6

Интервальный ряд может быть наглядно представлен в виде гистограммы частотного распределения.

Рис. Частотное распределение диаметров валков. Сплошная линия – сглаживающая нормальная кривая.

Вид гистограммы позволяет сделать предположение о том, что распределение диаметров валков подчиняется нормальному закону, согласно которому теоретические частоты могут быть найдены как
nk, теор = n×N(a; s; xk)×Dxk,
где, в свою очередь, сглаживающая гауссова кривая нормального распределения определяется выражением:
N(a; s; xk) = .
В этих выражениях xk – центры интервалов в частотном интервальном вариационном ряде.

Например, x1 = (6,68 + 6,70)/2 = 6,69. В качестве оценок центра a и параметра s гауссовой кривой можно принять:
a = xср.
Из рис. видно, что гауссова кривая нормального распределения в целом соответствует эмпирическому интервальному распределению. Однако следует удостовериться в статистической значимости этого соответствия. Используем для проверки соответствия эмпирического распределения эмпирическому критерий согласия Пирсона c2 [2-4]. Для этого следует вычислить эмпирическое значение критерия как сумму
= ,
где nk и nk,теор – эмпирические и теоретические (нормальные) частоты, соответственно. Результаты расчетов удобно представить в табличном виде:
Таблица Вычисления критерия Пирсона


[xk, xk+1), мм

xk, мм

nk

nk,теор

6,68 – 6,70

6,69

5

4,00

0,25

6,70 – 6,72

6,71

18

14,57

0,81

6,72 – 6,74

6,73

25

34,09

2,42

6,74 – 6,76

6,75

55

51,15

0,29

6,76 – 6,78

6,77

58

49,26

1,55

6,78 – 6,80

6,79

22

30,44

2,34

6,80 – 6,82

6,81

11

12,07

0,09

6,82 – 6,84

6,83

6

3,07

2,80

 

 

 

c2эмп

10,55

Критическое значение критерия найдем по таблице Пирсона [2, 3] для уровня значимости a = 0,05 и числа степеней свободы d.f. = K – 1 – r, где K = 8 – число интервалов интервального вариационного ряда; r = 2 – число параметров теоретического распределения, оцененных на основании данных выборки (в данном случае, – параметры a и s). Таким образом, d.f. = 5. Критическое значение критерия Пирсона есть крит(a; d.f.) = 11,1. Так как c2эмп < c2крит, заключаем, что согласие между эмпирическим и теоретическим нормальным распределением является статистическим значимым. Иными словами, теоретическое нормальное распределение удовлетворительно описывает эмпирические данные.

 

Задача3

Коробки с шоколадом упаковываются автоматически. По схеме собственно-случайной бесповторной выборки взято 130 из 2000 упаковок, содержащихся в партии, и получены следующие данные об их весе:

Вес упаковки (гр.)

Менее 975

975-1000

1000-1025

1025-1050

Более 1050

Всего

Число упаковок

6

38

44

34

8

130

Требуется используя критерий  Пирсона при уровне значимости a=0,05 проверить гипотезу о том, что случайная величина X – вес упаковок – распределена по нормальному закону. Построить на одном графике гистограмму эмпирического распределения и соответствующую нормальную кривую.

Решение

1012,5
= 615,3846

Примечание:

В принципе в качестве дисперсии нормального закона распределения следует взять исправленную выборочную дисперсию. Но т.к. количество наблюдений – 130 достаточно велико, то подойдет и “обычная” .
Таким образом, теоретическое нормальное распределение имеет вид:

подставляем  а = 1012,5     = 615,3846  24,8069

Для расчета вероятностей piпопадания случайной величины в интервал [xi ; xi+1] используем функцию Лапласа:

в нашем случае получаем:





Примечание: Такие симметричные вероятности получились из-за того, что по нашим начальным условиям выборочная средняя попала точно в середину среднего интервала выборки.

Составим таблицу:

i

Интервал

[xi ; xi+1]

Эмпирические частоты

ni

Вероятности
pi

Теоретические частоты
npi

 

(ni-npi)2

1

Менее 975

6

0,0597

7,761

3,101

0,3996

2

975-1000

38

0,2431

31,603

40,922

1,2949

3

1000-1025

44

0,3829

49,777

33,374

0,6705

4

1025-1050

34

0,2431

31,603

5,746

0,1818

5

Более 1050

8

0,0597

7,761

0,057

0,0073

 

130

0,9885

128,5

 

 

Итого, значение статистики .

Определим количество степеней свободы по формуле: .
m – число интервалов (m = 5)
r– число параметров закона распределения (в нормальном распределении r = 2)
Т.е. k = 2.

            Соответствующее критическое значение статистики
Поскольку , гипотеза о нормальном распределении с параметрами
N(1012,5; 615,3846) согласуется с опытными данными.

            Ниже показана гистограмма эмпирического распределения и соответствующая нормальная кривая.

 



Учебники
Предлагаем наиболее хорошие на наш взгляд учебники для самостоятельного изучения математики и экономики Comment

Справочники
Компактные справочные материалы, формулы по различным разделам высшей математики и экономической статистики. Comment

Онлайн калькуляторы
Некоторые задачи можно решить онлайн, введя числовые значения, с подробным решением. Comment