Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика _Овсянникова (исправленный)

.pdf
Скачиваний:
200
Добавлен:
08.04.2015
Размер:
1.05 Mб
Скачать
xm+1 .

по специальности – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.

Решение. Параметры теоретического нормального закона распределения a и σ 2 , являющиеся соответственно математическим ожиданием и дисперсией случайной величины X, неизвестны, поэтому заменяем их «наилучшими» оценками по выборке – несмещенными и состоятельными оценками соответственно выборочной средней xB и «исправленной» выборочной дисперсией S 2 . Так как число наблюдений n =100 достаточно велико, то вместо исправленной S 2 можно взять «обычную» выборочную дисперсию σB2 . В задании 2 а1 было найдено a = xB =10,12 ; σ =σB2 =19,07 . Тогда

σ = σB2 = 19,07 = 4,37 .

Так как случайная величина имеет нормальное распределение, то для расчета вероятностей попадания случайной величины X в интервал [xi ; xi+1 ], где i =1, 2,K, m , используем функцию Лапласа в соответствии со свойствами нормального распределения:

 

 

 

 

 

x

 

a

x

a

p = P(x X x

)= Φ

i+1

 

 

 

−Φ

i

 

=

 

 

 

 

 

 

i

i

i+1

 

 

σ

 

 

 

σ

 

 

 

 

 

 

 

x

10,12

x

10,12

 

 

 

= Φ

i+1

 

 

−Φ

i

 

 

 

.

 

 

 

 

4,37

 

4,37

 

 

 

 

 

 

 

 

 

 

 

Так как нормальное распределение определено на всей число-

вой оси, то есть

x (−∞;), то указанная выше формула применя-

ется при нахождении вероятностей попадания случайной величины X в интервал [xi ; xi+1 ] для всех значений случайной величины X, за исключением крайних значений, то есть x1 и

При нахождении вероятности попадания случайной величины X в интервал [x1; x2 ] полагаем x1 = −∞, то есть искомая вероятность будет определяться следующей формулой:

60

 

 

 

 

 

 

 

 

 

 

x

a

−∞−a

 

p

= P(x

X x )= P(−∞≤ X x )

2

 

 

 

−Φ

 

 

=

 

 

 

 

 

1

 

1

 

 

2

 

 

 

2

 

σ

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x a

 

x a

 

 

 

x

 

a

 

 

2

 

 

−Φ(−∞)

2

 

()

2

 

+0,5.

 

 

σ

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

В

силу

нечетности

 

функции Лапласа

Φ(x) ,

 

то есть

Φ(x) = −Φ(x) , находим значения функции Лапласа для отрицательных аргументов, используя таблицы приложения 2 в настоящих методических указаниях или в книгах [1] или [5].

При нахождении вероятности попадания случайной величины

X в интервал

[xm ; xm+1 ],

полагаем

 

xm+1 = ∞,

то есть искомая вероят-

ность будет определяться следующей формулой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∞−a

x

a

 

p = P(x X

x

 

)= P(x X ≤∞)

 

 

−Φ

m

 

 

=

 

 

 

 

m

m

 

 

m+1

m

 

 

 

σ

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

x

a

 

x

 

a

 

 

 

 

 

 

 

()−Φ

m

 

 

=0,5 −Φ

m

 

.

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

Таким образом, в нашем примере получим:

p1 = P(− ∞ ≤ X 5)= Φ 5 10,12 − Φ(− ∞)=4,37

= Φ(1,17)− Φ(− ∞)= −Φ(1,17)+ Φ() = −0,3790 + 0,5 = 0,121,

p2

9

10,12

5

10,12

=

= P(5 X 9)= Φ

4,37

 

−Φ

4,37

 

 

 

 

 

 

 

= Φ(0,26)−Φ(1,17)= −Φ(0,26)(1,17) = −0,1026+0,3790 = 0,2764,

 

13

10,12

9

10,12

 

 

p3

= P(9 X 13)= Φ

 

 

 

−Φ

 

 

 

 

=

 

4,37

 

4,37

 

 

 

 

 

 

 

 

= Φ(0,66)−Φ(0,26)= Φ(0,66)(0,26) = 0,2453+0,1026 = 0,3479,

p4

= P(13

 

17 10,12

1310,12

=

X 17)= Φ

4,37

 

−Φ

4,37

 

 

 

 

 

 

 

 

= Φ(1,58)−Φ(0,66)= 0,44290,2453 = 0,1976,

 

 

p5

 

 

∞−10,12

 

17

10,12

 

=

= P(17 X ≤ ∞)= Φ

4,37

−Φ

4,37

 

 

 

 

 

 

 

 

= Φ()−Φ(1,58)= 0,5 0,4429 = 0,0571.

61

Для определения выборочной статистики (4.6)

χ2 = (ni ni)

,

m

2

 

=

n

 

i 1

i

 

где ni′ = n pi – теоретические частоты, составим расчетную табл.4.1.

Таблица 4.1

 

Ин-

Эмпири-

Веро-

Теорети-

 

(ni ni)2

 

 

 

 

ческие

ятно-

ческие

2

 

ni

 

i

тервал

частоты

сти

частоты

(ni ni)

ni

wi =

 

 

n

 

 

[xi ; xi +1 ]

 

 

 

 

ni

pi

ni′ = n pi

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

– 5

15

0,121

12,10

8,41

0,695

0,15

 

2

5

– 9

20

0,2764

27,64

58,3696

2,1118

0,2

 

3

9 – 13

45

0,3479

34,79

104,2441

2,9964

0,45

 

4

13

– 17

12

0,1976

19,76

60,2176

3,0474

0,12

 

5

17

– 21

8

0,0571

5,71

5,2441

0,9184

0,08

 

 

 

100

 

 

 

9,769

 

 

 

Из табл. 4.1 находим фактически наблюдаемое значение статистики (выборочная статистика) χ2 = 9,769 .

Так как число интервалов k = 5 , а нормальный закон распределения определяется s = 2 параметрами, точечные оценки которых были получены по выборочным данным, то число степеней

свободы r = k s 1 = 5 2 1 = 2 .

Соответствующее критическое

значение статистики χкр2 = χ2 (α, k)

можно найти по таблице «Кри-

тические точки распределения χ2 » в приложении 3 настоящих методических указаний или в приложении 5 в книгах [1] или [5].

Имеем χкр2 = χ2 (0,05;2) = 6,0 .

Так как 9,769 = χ2 > χкр2 = 6,0 , то гипотеза о выбранном теоретическом нормальном законе распределения с параметрами a =10,12 и σ = 4,37 не согласуется с опытными данными (в данном примере), то есть гипотеза отвергается на заданном уровне значимости α = 0,05 .

62

Изобразить эмпирические распределения можно, например, ступенчатой фигурой, состоящей из прямоугольников с основания-

ми, равными величинам интервалов

x = xi+1 xi , и высотами, равны-

ми частностям

wi =

ni

(или частотам

ni ) этих интервалов, называе-

n

 

 

 

 

мой гистограммой. При построении нормальной кривой для каждого интервала по оси ординат откладываем соответствующие вероятности pi (теоретические частоты ni′ = n pi ). Вершина нормальной кри-

вой

имеет

координаты x = a =10,12 ; y =

x

ϕ(0) =

4

0,3989 = 0,37

σ

4,37

 

 

 

 

 

 

 

 

 

ϕ(x) =

1

e

x2

 

 

 

 

 

(где

2

– малая функция Лапласа, значения которой

2π

 

 

 

 

 

 

 

 

 

приведены в приложении 1 настоящих методических указаний или в приложении 1 в книгах [1] или [5]).

0,5

 

 

 

 

0,45

 

 

 

 

0,4

 

 

 

 

0,35

 

 

 

 

0,3

 

 

 

 

0,25

 

 

 

 

0,2

 

 

 

 

0,15

 

 

 

 

0,1

 

 

 

 

0,05

 

 

 

 

0

 

 

 

 

1 – 5

5 – 9

9 – 13

13 – 17

17 - 21

 

 

Рисунок 4.3

 

 

Выполнив чертеж (рис. 4.3), можно увидеть, что нормальная кривая теоретического распределения практически не «выравнивает» гистограмму эмпирического распределения.

Замечание 1. Если при проверке гипотезы используется таблица вероятностей P(χ2 > χкр2 (α, k)), как, например, таблицы, приве-

63

денные в пособиях [3] (приложение 4) , то необходимо найти вероятность Р для вычисленного значения χ2 = 9,769 при числе степеней свободы r = k s 1 = 2 . Непосредственно такого значения в таблицах нет. Но (при r = 2 ) для ближайших соседних значений χ2 , равных 9 и 10, вероятность Р соответственно равна 0,0111 и 0,0067. Таким образом, и без интерполяции ясно, что вероятность Р меньше заданного уровня значимости α = 0,05 , то есть Р<0,05, следовательно, нулевая гипотеза H0 не согласуется с опытными данными.

Задание 2

Пример 2, г2

Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в процентах к предыдущему году):

Выработка в отчет-

94-104

104-114

114-124

124-134

134-144

Итого

ном году (в % к

предыдущему году)

 

 

 

 

 

 

 

 

 

Количество рабочих

6

 

20

 

45

27

 

6

100

На уровне значимости

α = 0,05

проверить

гипотезу

о нор-

мальном распределении случайной величины X – выработки рабочих – с помощью критерия χ2 Пирсона. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.

Решение. Параметры теоретического нормального закона распределения a и σ 2 , являющиеся соответственно математическим ожиданием и дисперсией случайной величины X, неизвестны, поэтому заменяем их «наилучшими» оценками по выборке – несмещенными и состоятельными оценками соответственно выборочной средней xB и «исправленной» выборочной дисперсией S 2 . Так как число наблюдений n =100 достаточно велико, то вместо исправленной S 2 можно взять «обычную» выборочную дисперсию σB2 .

64

Найдем выборочную среднюю xB (по упрощенной формуле):

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xB =

ui ni

k + А,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и выборочную дисперсию (также по упрощенной формуле):

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ui2ni

(xB А)2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

σB2 =

 

 

i=1

 

 

 

k 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для этого составим расчетную табл. 4.2 при А=119 и k =10 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4.2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выработка

 

Середина

 

 

Количество

 

xi А

 

xi А

 

x А 2

в отчетном

 

интервала

 

 

студентов

ui =

 

 

 

 

ni

 

i

 

 

 

ni

 

k

 

k

 

 

 

 

k

 

году (%)

 

 

xi

 

 

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

94-104

 

 

 

99

 

 

 

 

 

6

 

 

 

 

-2

 

 

-12

 

 

 

24

 

104-114

 

 

 

109

 

 

 

 

 

20

 

 

 

 

-1

 

 

-20

 

 

 

20

 

114-124

 

 

 

119

 

 

 

 

 

45

 

 

 

 

0

 

 

0

 

 

 

 

0

 

 

124-134

 

 

 

129

 

 

 

 

 

27

 

 

 

 

1

 

 

27

 

 

27

 

134-144

 

 

 

139

 

 

 

 

 

2

 

 

 

 

2

 

 

4

 

 

 

 

8

 

 

Сумма

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

-1

 

 

79

 

Тогда выборочная средняя

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ui ni

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xB =

i=1

 

k + А=

 

10 +119 118,9

(%).

 

 

 

 

 

 

 

n

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочная дисперсия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σB2 =

ui2ni

k 2

(xB

А)2

=

79

 

102

(118,9 119)2 78,99 .

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом,

a = xB =118,9 ; σ =σB2 = 78,99 .

 

 

 

 

 

 

 

 

Тогда σ =

σB2 =

78,99 8,89 .

 

 

 

 

 

 

 

 

 

 

 

 

 

65

i =1, 2,K, m

Так как случайная величина имеет нормальное распределение, то для расчета вероятностей попадания случайной величины X в интервал [xi ; xi+1 ], где , используем функцию Лапласа в соответствии со свойствами нормального распределения:

 

 

 

 

 

x

 

a

x

a

 

p

= P(x X x

)= Φ

i+1

 

 

 

 

−Φ

 

i

 

 

=

 

 

 

 

 

 

 

i

i

i+1

 

 

 

σ

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

x

118,9

 

 

x

118,9

 

 

 

 

 

 

= Φ

i+1

 

 

−Φ

i

 

 

 

 

.

 

 

 

 

 

8,89

 

8,89

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как нормальное распределение определено на всей числовой оси, то есть x (−∞;), то указанная выше формула применяется при нахождении вероятностей попадания случайной величины X в интервал [xi ; xi+1 ] для всех значений случайной величины X, за исключением крайних значений, то есть значений x1 и xm+1 .

Вероятность попадания случайной величины X в интервал [x1; x2 ] определяется следующей формулой

 

 

 

 

 

 

 

 

 

 

 

x

 

a

 

 

 

−∞−a

 

p

= P(x

X x )= P(−∞≤ X x )

2

 

 

 

 

−Φ

 

 

=

 

 

 

 

 

1

 

 

1

 

 

2

 

 

 

2

 

 

σ

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

a

x

a

 

 

 

 

x

a

 

 

 

2

 

 

 

−Φ(−∞)

2

 

()

2

 

 

+0,5.

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

σ

 

 

 

 

 

 

 

σ

 

 

 

 

 

Вероятность попадания случайной величины X в интервал [xm ; xm+1 ] определяется следующей формулой

pm = P(xm X xm+1 )= P(xm X ≤∞)σa −Φ xmσa =

x

 

a

 

x

 

a

()−Φ

m

 

 

=0,5

−Φ

m

 

.

 

 

 

 

 

 

σ

 

 

 

 

σ

 

Таким образом, в нашем примере получим:

66

 

104 118,9

 

 

p1

= P(−∞ ≤ X 104)= Φ

 

 

−Φ(−∞)=

8,89

 

 

 

 

= Φ(1,68)−Φ(−∞)= −Φ(1,68)+ Φ() = −0,4535 + 0,5 = 0,0465;

 

 

114 118,9

 

104 118,9

 

 

p2

= P(104

X 114)= Φ

 

 

−Φ

 

 

=

8,89

8,89

 

 

 

 

 

 

 

= Φ(0,55)−Φ(1,68)= −Φ(0,55)(1,68) = −0,2088+0,4535 = 0,2447;

 

124 118,9

 

114 118,9

 

 

p3

= P(114 X 124)= Φ

 

 

−Φ

 

 

=

8,89

8,89

 

 

 

 

 

 

= Φ(0,57)−Φ(0,55)= Φ(0,57)(0,55) = 0,2157 +0,2088 = 0,4245;

p4

134 118,9

 

124 118,9

 

=

= P(124 X 134)= Φ

8,89

 

−Φ

8,89

 

 

 

 

 

 

 

= Φ(1,70)−Φ(0,57)= 0,45540,2157 = 0,2397;

 

 

 

 

∞−118,9

134 118,9

 

 

p5 = P(134 X ≤ ∞)= Φ

 

 

−Φ

 

 

 

=

8,89

 

8,89

 

 

 

 

 

= Φ()−Φ(1,70)= 0,5 0,4554 =

0,0446.

 

 

 

 

Запишем в табл. исходные данные и найденные вероятности. Вычислим в табл. теоретические частоты ni′ = n pi .

Таблица 4.3

i

Интервал

Эмпириче-

Вероят-

Теоретические

 

ni

 

[x ; x

]

ские частоты

ности

частоты

wi =

 

 

n

 

 

i i+1

 

ni

pi

ni′ = n pi

 

 

 

 

 

 

 

 

 

1

94 – 104

6

0,0465

4,65

0,06

 

2

104 – 114

20

0,2447

24,47

0,2

 

3

114 – 124

45

0,4245

42,45

0,45

 

4

124 – 134

27

0,2397

23,97

0,27

 

5

134 – 144

2

0,0446

4,46

0,02

 

 

 

100

 

 

 

 

 

Так как в последнем (пятом) интервале число наблюдений меньше пяти, то имеет смысл для применения критерия χ2 Пирсона объединить последний интервал с предыдущим (как для эмпирических так и для теоретических частот), полагая при вычислении

67

χ2 эмпирическую частоту, равной 27 + 2 = 29 , теоретическую час-

тоту, равной 23,97 + 4,46 = 28,43 .

Для определения выборочной статистики (4.6)

χ2 = m (ni ni)2 ,

i=1 ni

составим расчетную табл. 4.4.

 

 

 

 

 

Таблица 4.4

 

 

 

 

 

 

i

Эмпирические

Теоретические

 

(ni ni)2

(ni ni)2

 

частоты, ni

частоты, ni

 

 

ni

1

6

4,65

 

1,8225

0,3919

2

20

24,47

 

19,9809

0,8165

3

45

42,45

 

6,5025

0,1532

4

29

28,43

 

0,3249

0,0114

100

 

 

 

1,373

 

Из табл. 4.4 находим фактически наблюдаемое значение ста-

тистики (выборочную статистику) χ2 =1,373.

 

 

Так как число интервалов m = 4 , а нормальный закон распре-

деления определяется

r = 2 параметрами,

точечные оценки кото-

рых были получены по выборочным данным, то число степеней

свободы k = m r 1 = 4 2 1 =1.

Соответствующее критическое

значение статистики χкр2 = χ2 (α, k)

можно найти по таблице «Кри-

тические точки распределения χ2 » в приложении 3 настоящих методических указаний или в приложении 5 в книгах [1] или [5]. Имеем χкр2 = χ2 (0,05;1) = 3,8. Так как 1,373 = χ2 < χкр2 =3,8 , то гипотеза о выбранном теоретическом нормальном законе распределения с параметрами a =118,9 и σ = 8,89 согласуется с опытными данными, то есть гипотеза принимается на заданном уровне значимости

α = 0,05 .

На одном чертеже построим нормальную кривую и гистограмму. Вершина нормальной кривой имеет координаты x = a =10,12 ;

68

y =

x

ϕ(0) =

10

0,4488

= 0,45 (где

ϕ(x) =

1

e

x2

 

2 – малая функция

σ

8,89

π

 

 

 

 

 

 

 

 

2

 

 

 

 

Лапласа, значения которой приведены в приложении 1 настоящих методических указаний или в приложении 1 в книгах [1] или [5]).

Выполнив чертеж (рис. 4.4), можно увидеть, что нормальная кривая теоретического распределения достаточно хорошо «выравнивает» гистограмму эмпирического распределения.

0,5

 

 

 

 

0,45

 

 

 

 

0,4

 

 

 

 

0,35

 

 

 

 

0,3

 

 

 

 

0,25

 

 

 

 

0,2

 

 

 

 

0,15

 

 

 

 

0,1

 

 

 

 

0,05

 

 

 

 

0

 

 

 

 

94 – 104

104 – 114

114 – 124

124 – 134

134 - 144

Рисунок 4.4

Замечание. Если при проверке гипотезы используется таблица вероятностей P(χ2 > χкр2 (α, r)), как, например, таблицы, приведенные в пособии [3] (приложение 4) или в более ранних изданиях [1] и [5], то необходимо найти вероятность Р для вычисленного значения χ2 =1,373 при числе степеней свободы r = k s 1 =1. Непосредственно такого значения в таблице нет. Но (при r =1) для ближайших соседних значений χ2 , равных 1 и 2, вероятность Р соответственно равна 0,3173 и 0,1574. Таким образом, и без интерполяции ясно, что вероятность Р больше заданного уровня значимости α = 0,05 , то есть Р>0,05, следовательно, нулевая гипотеза H0 согласуется с опытными данными.

69