Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1802.pdf
Скачиваний:
17
Добавлен:
07.01.2021
Размер:
1.85 Mб
Скачать

Можно доказать, что при достаточно большом объеме выборки и при достаточно мелком делении интервалов с практической достоверностью близка к истинной функции распределения F (x).

§ 4. Числовые характеристики статистического распределения: выборочное среднее, дисперсия

4.1. Параметры распределения

Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины. Основными числовыми характеристиками выборки явля-

ются выборочное среднее хв и выборочная дисперсия Dв .

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

Иn

 

Определение. Выборочным средним

называется среднее арифме-

тическое значений случайной величины, принимаемых в выборке:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x n

 

 

 

x

в

=

x1 + ... + xn

или

 

x

в

=

i=1 i i

.

(3.3)

 

 

 

 

 

 

 

 

 

 

Аn

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выборочное среднее xв служит для точечной оценки математи-

 

l

 

 

б l

 

 

 

 

 

 

 

 

 

 

ческого ожидания М (Х )

исследуемойДслучайной величины

 

 

 

 

 

 

 

 

x =

 

x1

+ ... + xn

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение. Выборочной дисперсией называется

 

 

(x x

в

)2

n

 

 

x 2

n

 

 

 

 

 

 

 

i

 

 

 

i

 

 

 

 

i

 

i

 

 

 

 

 

Dв (Х ) =

i=и1

 

 

=

i=1

 

 

 

 

xв 2 .

(3.4)

 

 

 

n

 

 

 

 

 

 

n

 

 

 

Выборочная дисперсия Dв (Х )

служит для точечной оценки дис-

персии D(Х ) .С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.2. Несмещенность, состоятельность, эффективность параметров распределения

Получив статистические оценки параметров распределения (выборочное среднее, выборочную дисперсию и т.д.), нужно убедиться, что они в достаточной степени служат приближением соответствующих характеристик генеральной совокупности. Определим требования, которые должны при этом выполняться.

110

Пусть θ статистическая оценка неизвестного параметра θ теоретического распределения. Извлечем из генеральной совокупности несколько выборок одного и того же объема n и вычислим для каждой

из них оценку параметра θ : θ1 ,θ2 ,θ3 , ,θn .

Тогда оценку θ можно рассматривать как случайную величину, принимающую возможные значения θ1 ,θ2 ,θ3 , ,θn .

1. Если математическое ожидание θ не равно оцениваемому параметру, мы будем получать при вычислении оценок систематические

ошибки одного знака (с избытком, если М (θ ) > 0 , и с недостатком, если М (θ ) < 0). Следовательно, необходимым условием отсутствия

2.Определение. Оценка θ называетсяДИэффективной, если она несмещенная и при этом имеет наименьшую дисперсию (наименьший разброс относительно θ ) по сравнениюА с другими несмещенными оценками параметра θ .

3.Определение. Оценкабθ называется состоятельной, если при неограниченном увеличенииио ъема выборки θ сходится по вероят-М (θ ) = 0 .математическое-Ссистематических ошибок является требование

 

xini

 

xв =

i=1

.

n

В отличие от выборочного среднего, выборочная дисперсия является смещенной оценкой дисперсии генеральной совокупности. Пользуясь оценкой Dв вместо D , мы будем совершать некоторую систе-

матическую ошибку, так как её математическое ожидание несколько меньше истинного значения. Чтобы её ликвидировать, достаточно

ввести поправку, умножив D

на

n

 

. Таким образом, можно пред-

 

в

 

n 1

 

ложить другую оценку дисперсии – исправленную дисперсию s², вы-

111

 

 

 

 

 

l

(x

x

)2 n

 

n

 

 

 

числяемую по формуле s2 =

D

=

i=1

i

в

i

. Эта оценка яв-

n 1

 

n 1

 

 

в

 

 

ляется состоятельной несмещенной оценкой дисперсии D.

Такая оценка будет являться несмещенной. Ей соответствует ис-

правленное среднее квадратическое отклонение (СКО)

 

 

 

 

 

 

 

 

 

l

(x x

 

)2 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

в

 

i

 

 

 

 

 

 

 

 

 

 

s =

s2 =

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

(3.5)

 

 

 

 

n

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При больших n поправка

 

 

 

становится близкой к единице и её

n 1

применение теряет смысл.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

И

 

 

 

 

 

 

 

Пример 1. Оптический пирометр установлен на светящуюся нить

накала,

различными операторами было произведено несколько изме-

рений температуры. Получены следующие результаты (табл. 9).

 

 

 

 

 

 

 

 

 

 

 

 

 

Д

 

 

Таблица 9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Температура, °С

925

 

950

 

 

 

 

975

 

 

1000

1025

 

500

 

Число измерений

1

 

9

 

 

 

 

 

6

 

 

18

10

 

2

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Требуется найти среднюю квадратическую и вероятную ошибки

 

 

 

и

Аорка взята из нормально распределен-

в предположении, что эта вы

ной совокупности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Найдем сначала выборочное среднее значение

х

в .

Проще наход ть среднее для 1000 – х, а не для х (табл. 10).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 10

1000–хi

 

Число измере-

 

 

 

n·(1000–хi)

 

 

(1000–хi) 2

 

n· (1000–хi) 2

 

 

ний n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

75

 

1

 

 

75

 

 

 

 

 

 

 

 

5625

 

5625

 

 

 

 

 

50

 

9

 

 

450

 

 

 

 

 

 

 

 

2500

 

22500

 

 

 

 

 

25

 

6

 

 

150

 

 

 

 

 

 

 

 

625

 

3750

 

 

 

 

 

0

 

18

 

 

0

 

 

 

 

 

 

 

 

0

 

 

 

0

 

 

 

 

 

-25

 

10

 

 

-250

 

 

 

 

 

 

 

625

 

6250

 

 

 

 

 

-50

 

2

 

 

-100

 

 

 

 

 

 

 

2500

 

5000

 

 

 

 

 

l

 

46

 

 

325

 

 

 

 

 

 

 

 

 

43125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

112

 

 

l

 

 

 

 

 

 

 

 

 

 

 

x n

 

 

 

 

 

 

 

 

1000 x

=

i=1

i i

= 325 = 7,1 или х

=1000 7,1 = 992,9°.

 

 

в

 

n

46

 

 

 

в

 

 

l

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

x 2

 

 

 

 

 

 

 

 

D (Х ) =

i=1

i

i

x

2

= 43125

7,12 = 887 .

 

 

 

 

 

в

 

n

 

в

 

 

46

 

 

Найдем исправленную дисперсию

 

 

 

 

 

s2 =

 

 

n

 

D =

46

887 = 906,7 С .

 

 

 

 

 

n 1

 

 

 

 

 

 

в

45

 

4.3.Интервальные оценки математического ожидания

исреднего квадратического отклонения

оценками, то есть указывать интервал, в которыйИс заданной вероятностью попадает истинное значение оцениваемого параметра. Разу-

При выборке малого объема точечная оценка может значительно

отличаться от оцениваемого параметра, что приводит к грубым ошиб-

кам. Поэтому в таком случае лучше пользоваться интервальными

меется, чем меньше длина этого интервала, тем точнее оценка пара-

метра.

Д

Поэтому, если для оценки θ* некоторого параметра θ справедли-

во неравенство | θ* – θ | < δ, число δ > 0 характеризует точность

 

А

оценки (чем меньше δ, тем точнее оценка). Но статистические методы

С

б

 

позволяют говорить только о том, что это неравенство выполняется с

некоторой вероятностью.

 

 

Определение. Доверительными

интервалом называется интервал

θ* – δ < θ < θ* + δ, в котором с заданной вероятностью γ заключено

истинное значение неизвестного параметра θ. Величина γ называется доверительной вероятностью или надежностью. Из определения доверительной вероятности следует, что

γ =Р ( θ* – δ < θ < θ* + δ ).

На практике обычно берут γ=0,95 или γ=0,99.

Рассмотрим построение доверительных интервалов для математического ожидания и среднего квадратического отклонения нормально распределенной случайной величины.

1. Доверительный интервал для оценки математического ожидания нормального распределения при неизвестной дисперсии.

Если известно, что исследуемая случайная величина Х распреде-

113

лена по нормальному закону с неизвестным средним квадратическим отклонением, то для поиска доверительного интервала для ее математического ожидания а построим новую случайную величину

T =

xв a

 

 

,

n

s

 

 

 

 

где хв – выборочное среднее; s2 – исправленная дисперсия; n – объем выборки. Эта случайная величина, возможные значения которой будем обозначать через t, имеет распределение Стьюдента с k = n – 1 степенями свободы. Плотность распределения Стьюдента явным образом не зависит от а и σ ( неизвестное СКО), а зависит только от n.

По определению доверительного интервала с заданной надежно-

стью γ имеем

γ = P(хв δ < а < хв + δ )= Р(

 

хв а

 

< δ )=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

И

 

 

 

 

 

 

 

 

хв а

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

< δ n

= Р(

 

< tγ ),

 

 

 

 

 

= Р

 

 

 

 

T

(3.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

Д

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

где tγ =

δ

n

.

 

 

 

 

А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(к)называется критерием Стьюдента для уровня значи-

Число tγ

 

 

 

 

 

 

 

б

 

 

 

 

 

 

 

 

 

 

 

 

мости α и числа степеней сво оды k = n – 1. Его определяем по табли-

це для распределения Стьюдента (прил. 3). При определении довери-

 

 

n

 

и

 

 

 

s

 

 

 

тельных интервалов задаются о ычно надежностями γ=1–α, равными

0,9;

0,95;

0,99. Затем з

выражения (3.6)

определяем величину

 

s tγ

 

С

 

 

 

δ

 

 

 

 

δ =

,

которую наход м

 

з соотношения

tγ =

 

n

 

. Таким обр а-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

зом, доверительный интервал с надежностью γ для математического ожидания а при неизвестном s есть интервал вида

xв tγns < а < xв + tγns .

При больших n (n >30) распределение Стьюдента практически совпадает с нормальным. В этом случае tγ можно найти из уравнения

2Ф(tγ )=1α = γ .

Пример 2. По 25-ти деталям выборочные характеристики прочности Х составили: хв = 3; s = 1,5. Найти доверительный интервал для математического ожидания нормально распределенной случайной величины Х и точность оценки δ при γ= 0,99.

114

Решение. Из таблицы распределения Стьюдента (см. прил. 3) на-

ходим, что tγ (n = 25; к=25–1; α = 1–γ=1–0,99=0,01) = 2,80.

Тогда

3

2,8 1,5

< а < 3 +

2,8 1,5

,

 

25

 

 

25

 

 

 

 

 

 

или 2,16< a < 3,84 – доверительный интервал, в который попадает а с

вероятностью 0,99. Точность оценки δ = 0,84.

2. Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения.

Пусть по выборке объёма n получено исправленное среднее

 

 

 

 

 

квадратическое отклонение s =

n

 

D

, которое является точечной

n 1

 

 

в

И

оценкой среднего квадратического отклонения σ случайной величины

Х. Будем искать для s нормально распределенной случайной величины доверительный интервал вида (s δ;s + δ ), где s – исправленное выборочное среднее квадратическое отклонение. По определению,

доверительный интервал с заданной надежностью Р( |σ s| < δ ) = γ имеет вид s δ < σ < s + δ .

 

 

 

 

δ

 

 

δ

 

или обо-

Запишем это неравенство в видеДs 1

< σ < s 1+

 

 

 

 

 

 

s

 

s

 

значим δ

= q и, подставив q в Арассмотренное выше неравенство, по-

s

 

б

 

 

 

 

 

 

 

лучим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s(1q)< σ < s(1+ q) при q<1;

 

 

 

 

и0 < σ < s(1+ q)

 

при q>1,

 

 

 

где q = q(n,γ ).

 

 

 

 

 

 

 

 

 

С

 

 

 

 

 

 

 

 

Существуют таблицы, из которых можно найти q по заданным n

и γ (прил. 5). Случайная величина q имеет распределение, зависящее только от n.

Для дисперсии оценка имеет вид

s2 (1q)2 < D < s2 (1+ q)2 при q<1;

0 < D < s2 (1+ q)2 при q>1.

Пример 3. Произведено 20 измерений одним прибором некоторой случайной величины, имеющей нормальное распределение. Исправленное выборочное среднее квадратическое отклонение случайных ошибок измерений равно 1,3. Найти точность прибора с надежностью 0,95.

115

Решение. Точность прибора – это среднее квадратическое отклонение σ случайных ошибок измерений. По условию задачи, n = 20; s = 1,3. Найдем доверительный интервал для σ при заданной надежно-

сти γ = 0,95. По прил. 5 находим q (n = 20; γ = 0,95 ) = 0,37. Следовательно, границы доверительного интервала: 1,3(1–0,37) = 0,819 и 1,3(1+0,37) = 1,781. Итак, 0,819 < σ < 1,781 с вероятностью 0,95.

3. Доверительные интервалы для оценки дисперсии.

Считаем, что, вообще говоря, математическое ожидание неиз-

вестно, а известна только точечная несмещенная оценка дисперсииs2 . Тогда доверительный интервал для дисперсии, соответствующий доверительной вероятности γ = 1α , имеет вид

 

(n 1)s2

 

(n 1)s2

.

 

 

 

 

 

(3.7)

 

 

 

 

 

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

χ

2

 

 

 

 

 

 

χ 2

И

 

 

 

 

 

 

 

2

 

 

 

 

 

 

γ

1

 

 

 

 

 

 

 

 

Так как по заданной вероятности

можно построить множество

 

 

 

 

 

 

 

 

 

Д

 

 

 

 

χ 2 выби-

доверительных интервалов для дисперсии, то принято χ 2 и

рать так, чтобы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

А

 

 

 

 

 

 

 

 

 

 

P(χ 2 > χ 2 )

= 1

α

, а P(χ 2 < χ 2 )

= α

,

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

2

 

2

 

 

2

2

 

б

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где числа χ1 и

χ2 находят по прил. 4 при числе степеней свободы

 

и

 

 

 

α

и р =

α .

 

 

 

 

k = n –1 и соответственно при р = 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

Пример 4. Пользуясь 90%-ным доверительным интервалом, оце-

С

 

 

 

зменение прочности деталей во всей ге-

ните в условиях пр мера 2

неральной совокупности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. По условию, п=25; s=1,5; γ=0,9. Найдем доверительный

интервал для оценки дисперсии.

 

 

 

 

 

 

 

 

 

 

 

 

 

Согласно формуле (3.7)

 

 

(n 1)s

2

σ

 

 

(n 1)s

2

, а так как при

 

 

 

 

 

 

 

 

 

 

 

 

 

χ22

 

 

 

 

 

 

 

χ12

 

 

 

k=n–1=25–1=24 верхняя доверительная граница равна

 

 

 

χ22 (р;к) = χ22

 

1γ

;к

 

 

 

 

 

 

 

 

 

 

 

 

2

= χ22 (0,05;24) = 36,4,

 

нижняя определяется как

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

γ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ12 (р;к) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

χ12 1

 

2

 

;к = χ12 (0,95;24) = 13,8(см. прил. 4),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

116

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]