Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика_2.pdf
Скачиваний:
0
Добавлен:
28.12.2025
Размер:
1.51 Mб
Скачать

Решение. Так как a = 100, σ = D = 3 , то

 

 

 

 

9

 

 

P (91 < X < 109) = P (| X − 100 |< 9) = 2Φ

 

 

= 2Φ(3) = 0,9973.

 

 

3

 

 

8.Математическая статистика

8.1.Выборочный метод. Статистическое распределение выборки. Эмпирическая функция распределения.

Изучение всего набора элементов генеральной совокупности часто оказывается невозможным из-за больших материальных затрат или бесконечности генеральной совокупности. В этом случае применяется выборочный метод. Сущность выборочного метода заключается в том, что из генеральной совокупности извлекается выборка. На выборке производят нужные исследования, а полученные результаты распространяют на всю совокупность.

Пусть для изучения количественного признака Х из генеральной совокупности извлечена выборка x1, x 2 , x 3 ,K, x n объема n. Наблюдаемые значения хi при-

знака Х называют вариантами, а последовательность вариант, записанную в возрастающем порядке, – вариационным рядом. Статистическим распределением выборки называется перечень хi и соответствующих им частот тi или относитель-

ных частот ϖi.

Графически статистическое распределение выборочной совокупности представляется в виде полигона или гистограммы. Полигоном частот выборочной совокупности называется ломаная линия, соединяющая точки с координатами

(x i ; mi ) .

Гистограммой выборочной совокупности называется фигура, составленная в декартовой системе координат из прямоугольников, основаниями которых явля-

ются частичные интервалы [x i−1; x i

], а высоты соответственно равны

mi

, где

 

 

 

n × h

h = x i x i−1.

 

 

 

25

Эмпирической функцией распределения называется функция F (x ) = nx , n

где nх – число вариант в выборке, меньших х; п – объем выборки. Эмпирическая функция распределения при больших п служит оценкой неизвестной функции распределения генеральной совокупности. Эмпирическая функция распределения обладает следующими свойствами:

1.0 ≤ F (x ) ≤ 1.

2.Эмпирическая функция распределения является неубывающей функцией,

т.е. если x 2 > x1 , то F (x 2 ) ³ F (x1 ) .

3. Если x1 – наименьшая варианта, а x n – наибольшая варианта, то

F (x ) = 0 при x < x1 и F (x ) = 1 при x > x n .

8.2. Точечные оценки неизвестных параметров распределения. Статистической оценкой неизвестного параметра генеральной совокупности называется функция от наблюдаемых значений случайной величины Х. Сами наблюдаемые значения (варианты) x1,K, x n рассматриваются как значения п независимых СВ x1,K, x n , имеющих тот же закон распределения, что и изучаемая СВ Х. Поэтому статистические оценки также являются случайными величинами.

Статистическая оценка называется точечной, если она определяется одной величиной. Точечная оценка, математическое ожидание которой равно оцениваемому параметру, называется несмещенной, в противном случае – смещенной.

Несмещенной оценкой для математического ожидания генеральной совокуп-

ности является x в – выборочная средняя

1 k

x в = n i=1 x i mi .

Смещенной оценкой для дисперсии генеральной совокупности является выборочная дисперсия Dв , а несмещенной оценкой для дисперсии генеральной со-

вокупности является исправленная выборочная дисперсия S 2 .

 

 

 

k

 

 

 

2

Dв

=

1

mi

(x i

- x в ) .

 

 

 

n i=1

 

 

 

 

26

 

 

 

1

k

 

 

2

 

1 k

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

=

 

m

x

 

 

 

 

x

m

 

= X 2 − (x в )2 .

в

 

i

 

 

 

 

 

 

i

 

 

 

 

i

 

i

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2 =

 

 

n

 

 

 

D

;

 

σ

 

=

D

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n − 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

в

 

 

в

 

 

 

 

Оценка θ = θ(x1, x 2 ,K, x n ) параметра θ называется состоятельной, если она сходится по вероятности к оцениваемому параметру при неограниченном числе испытаний, т.е. для любого сколь угодно малого ε > 0 выполнено предельное равенство

lim P ( θ − θ < ε) = 1.

n→∞

Один и тот же параметр может иметь несколько оценок, которые обладают различными дисперсиями при ограниченном числе опытов. Чем меньше дисперсия оценки, тем меньше вероятность совершить ошибку при оценке параметра. Поэтому в качестве оценки берется оценка, обладающая минимальной дисперсией. Такая оценка называется эффективной.

8.3. Интервальные оценки неизвестных параметров распределения. Статистическая оценка называется интервальной, если она характеризуется двумя случайными величинами: началом и концом интервала. В качестве интервальной оценки используются доверительные интервалы.

Пусть θ является статистической оценкой неизвестного параметра θ. Тогда при некоторых ε > 0 вероятность P ( θ − ε < θ < θ + ε) = γ близка к единице, т.е.

неизвестный параметр θ с вероятностью γ накрывается интервалом (θ − ε; θ + ε) .

Вероятность γ называется доверительной вероятностью или надежностью оценки. Интервал, который с заданной надежностью накрывает неизвестный параметр, называется доверительным интервалом.

Доверительный интервал для неизвестного математического ожидания нор-

мально распределенной СВ при известном среднем квадратическом отклонении σ генеральной совокупности определяется неравенством

 

 

 

t

σ

< a <

 

 

+ t

σ

,

x

в

x

в

 

n

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

27

 

 

 

 

 

где t – значение функции Лапласа Φ(t ) , при котором Φ(t ) = γ . 2

Если среднее квадратическое отклонение σ нормально распределенной СВ неизвестно, но по результатам выборки вычислены x в и s, то доверительный ин-

тервал для математического ожидания определяется неравенством

x в tγ,n

s

< a < x

в + tγ,n

s

,

 

 

 

n

 

n

где tγ,n находится из таблицы (приложение 5) по заданным значениям γ и n.

Доверительный интервал для среднего квадратического отклонения σ нормально распределенной СВ определяется неравенством

sq1 < σ < sq2 ,

где q1, q2 определяются из таблицы (приложение 6) по заданным γ и ν = n – 1. 8.4. Статистическая проверка гипотезы о нормальном распределении. Статистической называют гипотезу о виде неизвестного распределения или о

параметрах известных распределений. Важнейшим среди законов распределения является нормальный закон распределения с функцией распределения

 

1

x a

F (x ) =

 

+ Φ

 

.

2

σ

 

 

 

Нормальный закон распределения является предельным для ряда законов распределения. Поэтому основные методы математической статистики разработаны применительно для нормального закона.

Пусть F (x ) – функция распределения изучаемой СВ. Обозначим через Но

 

 

1

x a

гипотезу о нормальном распределении СВ с функцией F0

(x ) =

 

+ Φ

 

, где а

 

σ

 

 

2

 

 

и σ – конкретные значения параметров распределения. Для проверки гипотезы проводят серию из n независимых испытаний. В результате получают выборочную совокупность x1, x 2 , x 3 ,K, x n , по которой делают вывод о правильности ги-

потезы Но. Так как СВ может принимать бесчисленное множество значений, то выборочная совокупность содержит неполную информацию о законе распределения генеральной совокупности. По этой причине при проверке гипотезы Но может

28

быть допущена ошибка. Вероятность ошибочного отклонения правильной гипотезы Но называется уровнем значимости. Обычно при проверке гипотезы уровень значимости α берут равным 0,001; 0,01; 0,05.

Одним из методов статистической проверки гипотезы о законе распределе-

ния является критерий согласия Пирсона (χ2 ) . Пусть статистическое распределе-

ние выборки задано в виде последовательности интервалов (x i ; x i+1 ) и соответст-

вующих частот mi

( mi – сумма частот, которые попадают в i-ый интервал).

 

 

 

 

 

 

 

 

 

x i ; x i+1

 

x1; x 2

x 2 ; x 3

x 3 ; x 4

. . .

x k ; x k +1

 

mi

 

m1

m2

m3

. . .

mk

 

 

 

 

 

 

 

 

По результатам выборки вычисляем выборочное среднее x в и выборочное среднее квадратическое отклонение σв . Предположим (гипотеза Но), что СВ рас-

пределена нормально с параметрами a = x в, σ = σв . Теоретическая функция рас-

пределения имеет вид

 

 

 

 

 

 

 

1

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x ) =

 

 

+ Φ

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

2

 

 

 

 

 

 

 

σв

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определим теоретические вероятности попадания СВ в интервал ( x i ; x i+1 )

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

+1

x

в

i

x

в

 

 

p

= p(x

i

< X

< x

i+1

) = Φ

 

 

 

 

 

 

 

− Φ

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

σв

 

 

 

 

 

 

 

 

σв

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычисляем теоретические частоты m′ = np

 

и вычисляем χ2

 

(статистику

 

 

 

 

 

 

 

 

 

 

i

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

набл.

 

Пирсона)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

(m

i

 

m′ )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χнабл2 . = ∑

 

 

 

 

 

i

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из таблицы критических точек распределения Пирсона (χ2 ) по заданному уровню значимости α и число степеней свободы ν = k – 3 ( k – число интервалов)

определяем критическое значение χ2кр .

29

Если χ2набл. < χ2кр. , то нет оснований отвергать гипотезу Н0 о нормальном

распределении генеральной совокупности. Если χ2набл. > χ2кр. , то гипотеза Н0 от-

вергается с вероятностью ошибки α.

Пример 1. Дано статистическое распределение срока службы инструмента до выхода за пределы точности (в месяцах).

x i – срок службы

20–25

25–30

30–35

35–40

40–45

в мес.

 

 

 

 

 

mi частота

9

24

35

22

10

 

 

 

 

 

 

Требуется:

1)построить полигон и гистограмму относительных частот (частостей);

2)по виду полигона и гистограммы и, исходя из механизма образования исследуемой СВ, сделать предварительный выбор закона распределения;

3)предполагая, что СВ распределена по нормальному закону, найти точечные оценки параметров распределения, записать гипотетичную функцию распределения;

4)найти теоретические частоты нормального распределения и проверить ги-

потезу о нормальном распределении с помощью критерия Пирсона χ2 при уровне значимости α = 0,05 ;

5)найти доверительные интервалы для математического ожидания и среднего квадратического отклонения нормально распределенной СВ при надежности γ = 0,95 .

 

 

Решение. Вычислим относительные частоты ϖi =

mi

, середины интервалов

 

 

 

 

 

 

 

 

 

 

 

 

n

x

*

, высоты прямоугольников гистограммы h = ϖi .

 

 

 

 

 

i

 

 

 

 

i

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ϖi

0,09

0,24

0,35

0,22

 

0,1

 

 

 

 

*

22,5

27,5

32,5

37,5

 

42,5

 

 

 

 

x i

 

 

 

 

 

 

 

 

 

 

 

ϖi

0,018

0,048

0,07

0,044

 

0,02

 

 

 

 

h

 

 

 

 

 

 

 

 

Построим гистограмму и полигон частостей.

ωi / h

0,07

30

0,06

полигон

0,05

Так как полигон частостей приближенно представляет кривую Гаусса и срок службы инструмента зависит от большого количества независимых параметров, то можно сделать предположение о нормальном распределении срока службы инструмента. Вычислим точечные оценки параметров распределения.

 

 

 

 

 

 

 

 

1

k

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

a »

 

 

 

в =

x i mi

=

 

 

(22,5 ×9 + 27,5 × 24 + 32,5 ×35 + 37,5 × 22 + 42,5 ×10) = 32,51.

x

 

 

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sв » s =

 

X

 

 

-

 

(x в )

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n -1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

k

2

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X 2

=

(x i ) mi

=

 

 

 

(22,52 × 9 + 27,52 × 24 + 32,52 × 35 + 37,52 × 22 + 42,52 ×10) = 1086,75 .

 

100

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s =

 

100

(1086,75 - 32,512 )= 5,49 .

 

 

 

 

 

 

 

 

 

 

99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Запишем гипотетичную функцию распределения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

x - a

 

1

x - 32,51

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x ) =

 

+ F

 

 

=

 

+ F

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

s

 

2

5,49

 

Вычислим теоретические частоты в предположении, что СВ распределена по нормальному закону

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- x

 

- x

 

m

¢

= np ;

p = F

x i+1

в

 

- F

x i

в

.

 

 

 

 

 

 

 

 

 

i

i

i

 

s

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычисления значений функции Лапласа приведены в таблице.

31

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

x i x в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x i

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x i

 

x i x в

 

 

s

 

 

 

Φ

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

− ∞

 

− ∞

 

 

− ∞

 

 

 

 

–0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

25

 

–7,51

 

 

–1,38

 

 

 

–0,4162

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

30

 

–2,51

 

 

–0,46

 

 

 

–0,1772

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

35

 

2,49

 

 

0,45

 

 

 

0,1736

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

40

 

7,49

 

 

1,36

 

 

 

0,4131

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

+ ∞

 

+ ∞

 

 

+ ∞

 

 

 

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим теоретические частоты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1 = P ( < X < 25) = -0,4162 + 0,5 = 0,0838 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p2 = P (25 < X < 30) = -0,1772 + 0,4162 = 0,239 ;

 

 

 

 

 

 

 

 

 

 

 

p3 = P (30 < X < 35) = 0,1772 + 0,1736 = 0,359 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p4 = P (35 < X < 40) = 0,4131 - 0,1736 = 0,239 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p5 = P (40 < X < +¥) = 0,5 - 0,4131 = 0,087 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m = np = 100 × 0,0838 = 8,38;

m

= 23,9; m

= 35,9;

 

m

= 23,9;

m

= 8,7 .

1

1

 

 

 

2

 

 

 

3

 

 

 

 

4

 

 

 

5

 

 

 

 

Проверим гипотезу о нормальном распределении с помощью критерия c2 .

Вычислим статистику Пирсона

c2

 

 

k

(mi - mi¢ )

2

 

 

(9 - 8,38)

2

 

(24 - 23,9)

2

 

(35

- 35,1)

2

 

=

 

=

 

+

 

+

 

+

 

 

i=1

mi¢

 

8,38

 

23,9

 

 

 

35,1

 

 

 

+

 

(22 - 23,9)2

 

+

 

(10 - 8,7)2

 

= 0,375.

 

 

 

 

 

 

 

 

 

23,9

 

8,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из таблицы критических точек распределения c2 по уровню значимости

α = 0,05

и числу степеней свободы ν = k – 3 = 2

найдем χкр2 = χ (0,05; 2) = 5,991.

Так как c2 < c2кр , то нет оснований отвергать гипотезу о нормальном распределе-

нии СВ.

Найдем доверительные интервалы для а и σ.

 

tγ,n

s

< a <

 

 

+ tγ,n

s

,

x в

x

в

 

 

 

 

n

 

 

n

 

 

32

 

 

 

 

 

t γ,n = t(0,95; 100) = 1,984 (приложение 5). Поэтому 31,433<a<33,587.

s × q1 < s < s × q2 , где q1 = 0,878; q2 = 1,161 (приложение 6). Значит 4,82<σ<6,37.

33

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]