Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2078.pdf
Скачиваний:
90
Добавлен:
07.01.2021
Размер:
2.92 Mб
Скачать

n – объем выборки. Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно:

1. 0 ≤ F*(x) ≤ 1.

 

 

 

 

 

 

 

2. F*(x) – неубывающая функция.

 

 

 

 

3. Если х1

– наименьшая варианта, то F*(x) = 0 при хх1; если хк

С

 

 

 

х > хк .

 

– наибольшая варианта, то F*(x) = 1 при

 

На оси ординат откладываем накопленные относительные час-

тоты. Кружочки на графике означают, что соответствующие точки

выброшены (р с.2.2).

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

F*(x)

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

n1

бА

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

x1 x2 x3

 

 

 

xm-1 xm

x

 

 

 

 

 

 

 

 

 

Д

 

 

 

 

 

 

Рис. 2.2. Выборочная функция распределения

 

Можно доказать, что при достаточно большом объеме выборки и при достаточно мелком делении интервалов с практической достоверностью близка к истинной функции распределенияИF (x).

§ 4. Числовые характеристики статистического распределения: выборочное среднее, дисперсия

Параметры распределения

Одна из задач математической статистики: по имеющейся выборке оценить значения числовых характеристик исследуемой случайной величины. Основными числовыми характеристиками выборки являются выборочное среднее хв и выборочная дисперсияDв .

Определение. Выборочным средним называется среднее ариф-

146

метическое значений случайной величины, принимаемых в выборке:

 

 

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

 

x1

... xn

 

 

 

 

xini

 

 

 

x

в

или

x

в

 

i 1

.

(2.3)

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

Выборочное среднее

x

в

служит для точечной оценки математи-

ческого ожидания М (Х )исследуемой случайной величины

 

 

 

 

 

 

 

x

 

x1

... xn

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

Определен е. Выборочной дисперсией называется

 

С

l

x

 

 

2

 

 

 

 

l

 

 

 

 

 

 

 

 

 

x

в

n

x 2

n

 

 

 

i 1

i

 

 

i

i 1

i

i

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D (Х)

 

 

 

 

 

 

 

 

 

 

 

x

в

.

(2.4)

 

 

 

 

 

 

 

 

 

 

 

 

в

 

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

Dв(Х)

 

 

 

 

 

 

 

Выборочная д сперсия

служит для точечной

оценки

D(Х).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дисперс

 

 

 

 

 

 

 

 

 

 

 

 

 

Несмещенность, состоятельность, эффективность

 

 

параметров распределения

 

 

борочное среднеебА, вы орочную дисперсию и т.д.), нужно убедиться, что они в достаточной степени служат приближением соответствующих характеристик генеральной совокупности. Определим требования, которые должны при этом выполняться.

Получив статистические оценки параметров распределения (вы-

Пусть – статистическая оценка

неизвестного параметра

теоретического распределения. Извлечем из генеральной совокупно-

сти несколько выборок одного и того же объема n и вычислим для

каждой из них оценку параметра : ,

, , , .

Д1 2 3 n

Тогда оценку можно рассматривать как случайную величину,

принимающую возможные значения 1 , 2

, 3 , , n .

1. Если математическое ожидание Ине равно оцениваемому параметру, мы будем получать при вычислении оценок систематиче-

ские ошибки одного знака (с избытком, если М ( ) 0, и с недос-

татком, если М( ) 0). Следовательно, необходимым условием от-

сутствия систематических ошибок является требование М ( ) 0.

Оценка называется несмещенной, если ее математическое

147

ожидание совпадает с истинным значением параметра :M .

2. Определение. Оценка называется эффективной, если она несмещенная и при этом имеет наименьшую дисперсию (наименьший разброс относительно ) по сравнению с другими несмещенными оценками параметра .

3. Определение. Оценка называется состоятельной, если при неогран ченном увел чении объема выборки сходится по вероят-

ности к ст нному значению параметра : при n .

остоятельной несмещенной оценкой математического ожида-

а является

 

 

 

С

 

l

 

 

 

 

 

xini

 

 

x

в

 

i 1

.

 

n

 

 

 

 

 

В отл ч е от вы орочного среднего, выборочная дисперсия яв-

ния

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ляется смещенной оценкой дисперсии генеральной совокупности.

Пользуясь оценкой Dв

вместо

 

 

D, мы будем совершать некоторую

систематическую оши ку, так как её математическое ожидание не-

сколько меньше истинного значения. Чтобы её ликвидировать, доста-

точно ввести поправку, умножив

D

 

на

n

 

 

. Таким образом, можно

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

n 1

 

 

 

 

 

предложить другую оценку дисперсии – исправленную дисперсию s²,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

 

 

бА

 

 

2

ni

 

вычисляемую по формуле s2

 

 

n

 

 

 

 

 

(xi xв )

 

 

 

 

D

i 1

 

 

 

 

. Эта оценка

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

n 1

в

 

 

 

 

 

является состоятельной несмещенной оценкой дисперсии D.

Такая оценка будет являться несмещенной. Ей соответствует ис-

 

 

 

 

 

 

Д

правленное среднее квадратическое отклонение (СКО)

 

 

 

 

 

 

l

(x

 

x

)2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

s2

i 1

i

 

 

в

i

 

 

.

 

 

 

(2.5)

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

И

При больших n поправка

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

становится близкой к единице и

 

 

 

 

 

 

n 1

её применение теряет смысл.

Пример 1. Оптический пирометр установлен на светящуюся нить накала, различными операторами было произведено несколько измерений температуры. Получены следующие результаты (табл. 2.4).

148

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Температура, °С

925

 

 

 

 

 

 

950

 

975

 

 

 

 

 

1000

1025

 

500

 

 

 

Число измерений

1

 

 

 

 

 

 

9

 

 

6

 

 

 

 

 

 

18

10

 

2

 

 

 

С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Требуется найти среднюю квадратическую и вероятную ошибки

 

в предположении, что эта выборка взята из нормально распределен-

 

ной совокупности.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решен е. Найдем сначала выборочное среднее значение

х

в .

 

и

 

 

 

 

 

х, а не для х (табл. 2.5).

 

Проще наход ть среднее для 1000 –

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.5

 

1000–хi

 

 

бА

 

 

 

n· (1000–хi)2

 

 

 

 

Ч сло

змере-

 

 

n·(1000–хi)

 

 

 

(1000–хi)2

 

 

 

 

 

 

 

 

 

 

 

н й n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

4

 

 

5

 

 

 

 

75

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

75

 

 

 

 

 

 

5625

 

 

5625

 

 

 

50

 

 

 

 

 

 

 

9

 

 

 

 

 

 

 

 

 

 

 

450

 

 

 

 

 

 

2500

 

 

22500

 

 

 

25

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

150

 

 

 

 

 

 

625

 

 

3750

 

 

 

0

 

 

 

 

 

 

 

18

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

0

 

 

0

 

 

 

 

-25

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

-250

 

 

 

 

 

625

 

 

6250

 

 

 

-50

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

-100

 

 

 

 

 

2500

 

 

5000

 

 

 

l

 

 

 

 

 

 

 

46

 

 

 

 

 

 

 

 

 

 

325

 

 

 

 

 

 

 

 

 

43125

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xini

325

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1000

x

в

 

 

 

i 1

 

 

 

 

 

 

7,1 или

х

в

 

1000 7,1 992,9 .

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

46

 

 

 

 

 

 

 

 

 

 

И

 

 

 

 

 

 

 

 

 

2 n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

i

2

 

 

43125

 

 

2

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dв

(Х)

 

 

 

 

 

 

 

xв

 

Д7,1 887.

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

46

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем исправленную дисперсию s²,

 

 

 

 

 

 

 

 

 

 

 

s2

 

n

 

 

D

46

887 906,7 С.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

45

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Интервальные оценки математического ожидания и среднего квадратического отклонения

При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, что приводит к грубым ошибкам. Поэтому в таком случае лучше пользоваться интервальны-

149

ми оценками, то есть указывать интервал, в который с заданной вероятностью попадает истинное значение оцениваемого параметра. Разумеется, чем меньше длина этого интервала, тем точнее оценка параметра.

Поэтому, если для оценки θ* некоторого параметра θ справед- Сливо неравенство | θ* – θ | < δ, число δ > 0 характеризует точность

оценки (чем меньше δ, тем точнее оценка). Но статистические методы позволяют говор ть только о том, что это неравенство выполняется с

некоторой вероятностью.

истинноеОпределен е. Доверительным интервалом называется интервал θ* – δ < θ < θ* + δ, в котором с заданной вероятностью заключено значен е не звестного параметра θ. Величина называется доверительной вероятностью или надежностью. Из определения до-

Если бАизвестно, что исследуемая случайная величина Х распределена по нормальному закону Дс неизвестным средним квадратическим отклонением, то для поиска доверительного интервала для ее

верительной вероятности следует, что

=Р ( θ* – δ < θ < θ* + δ ).

На практ ке о ычно ерут =0,95 или =0,99.

Рассмотр м построение доверительных интервалов для математического ож дан я среднего квадратического отклонения нормально распределенной случайной величины.

1. Доверительный интервал для оценки математического ожи-

дания нормального распределения при неизвестной дисперсии.

математического ожидания а построим новую случайную величину

T xв a n, s

где хв – выборочное среднее; s2 – исправленная дисперсия; n – объем

выборки. Эта случайная величина, возможные значения которой бу-

дем обозначать через t, имеет распределение Стьюдента с k = n – 1

степенями свободы. Плотность распределения Стьюдента явным об-

разом не зависит от а и σ (неизвестное СКО), а зависит только от n.

По определению доверительного интервалаИс заданной надеж-

ностью имеем

 

 

 

 

 

в Р

 

 

 

 

 

 

 

 

 

 

 

P

х

в а

х

 

х

в а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

хв а

 

 

n

 

 

n

 

 

 

 

 

 

Р

 

 

 

 

Р

 

T

 

t ,

(2.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

150

где t n .

 

s

 

Число t к называется критерием Стьюдента для уровня значи-

мости α и числа степеней свободы k = n – 1. Его определяем по табли-

С

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

це для распределения Стьюдента (прил. 3). При определении довери-

тельных интервалов задаются обычно надежностями =1–α, равными

0,9; 0,95; 0,99. Затем з (2.6) определяем величину

s

t

, которую

интервалn

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

n

наход м

з соотношен я t

 

 

n

. Таким образом, доверительный

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

с надежностью для математического ожидания а при неиз-

вестном s есть нтервал вида

 

 

 

 

 

 

 

 

 

 

 

 

 

 

больш

 

 

 

 

 

 

x

в

t s

 

а

x

 

t

s

.

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

При

х n (n >30) распределение Стьюдента практически

совпадает с нормальным. В этом случае t можно найти из уравнения

 

А

 

 

 

2Ф t

1 .

 

 

 

 

 

Пример 2. По 25 деталям выборочные характеристики прочности Х составили: хв = 3; s = 1,5. Найти доверительный интервал для математического ожидания нормально распределенной случайной величины Х и точность оценки при = 0,99.

Решение. Из таблицы распределения Стьюдента (см. прил. 3)

находим, что t (n = 25; к=25–1; α = 1– =1–0,99=0,01) = 2,80.

Тогда

 

 

И

3 2,8 1,5

а 3

 

2,8 1,5,

 

 

 

 

 

Д

 

 

 

 

 

 

 

 

 

 

25

 

 

25

 

или 2,16< a < 3,84 – доверительный интервал, в который попадает а с вероятностью 0,99. Точность оценки = 0,84.

2. Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения.

Пусть по выборке объёма n получено исправленное среднее

квадратическое отклонение s

n

 

D

, которое является точечной

n 1

 

в

 

оценкой среднего квадратического отклонения σ случайной величины Х. Будем искать для s нормально распределенной случайной величи-

151

ны доверительный интервал вида s ;s , где s – исправленное выборочное среднее квадратическое отклонение. По определению, доверительный интервал с заданной надежностью Р( |σ s| < ) = имеет вид s s .

С

 

 

 

 

 

 

Запишем это неравенство в виде s 1

 

 

 

s 1

 

или обо-

 

 

 

 

 

 

 

 

 

 

s

 

s

значим

q , подставив q в рассмотренное выше неравенство, по-

 

 

s

 

 

 

 

 

 

 

 

 

лучим

 

 

 

 

 

 

 

 

 

 

s1 q s1 q при q<1;

 

 

где q q n, .

0 s1 q

при q>1,

 

 

 

 

бА

 

 

Существуют та л цы, из которых можно найти q по заданным n

и (пр л. 5). Случайная величина q имеет распределение, зависящее

только от n.

 

 

 

 

 

 

 

 

 

Для д сперс оценка имеет вид

 

 

 

 

 

 

 

 

 

 

s2 1 q 2

D s2 1 q 2

при q<1;

 

 

 

 

 

0 D s2 1 q 2

при q>1.

 

 

Пример 3. Произведено 20 измерений одним прибором некото-

рой случайной величины, имеющей нормальное распределение. Ис-

 

Д

правленное выборочное среднее квадратическое отклонение случай-

ных ошибок измерений равно 1,3. Найти точность прибора с надеж-

ностью 0,95.

 

Решение. Точность прибора – это среднее квадратическое отклонение σ случайных ошибок измерений. По условию задачи, n = 20; s =1,3. Найдем доверительный интервал для σ при заданной надежности = 0,95. По прил. 5 находим q (n = 20; = 0,95 ) = 0,37.

с вероятностью 0,95. И

Следовательно, границы

доверительного

интервала:

1,3(1–0,37)

= 0,819 и 1,3(1+0,37)

= 1,781. Итак,

0,819 <

σ < 1,781

3. Доверительные интервалы для оценки дисперсии.

Считаем, что математическое ожидание неизвестно, а известна

только точечная несмещенная оценка дисперсииs2 . Тогда доверительный интервал для дисперсии, соответствующий доверительной вероятности 1 , имеет вид

152

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]