Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Гришин В.К. Статистические методы анализа результатов измерений учеб. пособие

.pdf
Скачиваний:
27
Добавлен:
23.10.2023
Размер:
4.93 Mб
Скачать

-ад-

Если рассеяние результатов, возникающее в процессе самого измерения, монет трактоваться как мера погрешнос­ тей, допускаемых в измерениях, то неопределенность значений, связанная с природой исследуемого процесса, позволяет лишь судить о статистических закономерностях этого явления и не может называться собственно ошибкой.

Таким образом, следуя одностороннее определению ошиб­ ки, можно "обнаружить" ее даже в условиях идеального экспе­ римента, в то время как несовпадение данных будет отражать объективную реальность явления (обсуждаемый вопрос перекли­ кается с проблемами объяснения результатов, вытекающих из квантового описания микромира, в свое время вызвавших целый переворот в философских концепциях современной физики). Конечно, можно упомянуть класс экспериментов по измере­ нию абсолютных констант (зарпд, масса, спин элементарннх частиц и т . д . ) , в которых разброс значений приопределении этих величин, по-видимому, нужно отнести к "чистым" ошибкам измерения.

Учитывая сказанное,, становит-тя понятным, что оценка погрешностей наблюдений должна базироваться не на строго детерминированных, а на вероятностных представлениях.

§ 5. Доверительный интервал и доверительная вероятность

в качестве характеристики неопределенности или несовер­

шенства в описании измеряемых величин, базирующемся на дан­

ной эмпирическом материале., избирают доверительный интервал.

-м -

впределах которого с заданной доверительной вероятностью

можно обнаружить

значения исследуемой величины.

К сожалению,

на практике погрешности методики измере­

ния на всегда поддаются оценке. Поэтому доверительный ин­ тервал, соответствующий заданной доверительной вероятности, указывает значения величин, наблюдаемые в эксперименте в

условиях

предлагаемое

методики

измерений.

 

 

 

 

 

При заданной доверительной вероятности доверительный

интервал

мокно

вычислить,

если

удается

установить

распреде­

ление

исследуемых величин.

 

 

 

 

 

 

 

 

 

Действительно,

мы знаем,

что

для данного

распределения

p(Lj)

,

вероятность

события

у

< ij p

равна

 

 

 

где ij^-

Р-

квантиль. Поэтому

доверительной

вероятности

Р

сопоставляется

доверительный

интервал ур

«

у

< у р

,

который

вычисляется

согласно соотношению

 

 

 

 

 

 

 

 

 

h

 

 

 

 

 

 

 

 

где

^

и

 

соответствуют

квартилям P(iJ

 

<

flp )ж

Pf z

(см.рис.8).

 

 

 

 

 

 

 

 

 

 

 

 

Величина

 

е

я ,

_

р

 

 

 

 

( 5 в 3

)

называется уровнем значимости, или коэффициентом надежнос­ ти ( в технике).

 

 

 

 

 

 

 

 

 

 

 

У

 

 

Рис.8. Квантили ij

-

распределения

р ( ^ )

 

 

 

 

На

рнс.8

значения

киинтилеК

К,

 

соответствуют

на­

 

копленным

вероятностям

 

 

 

 

 

 

 

 

 

, численно совпадающим с ве­

личинами

площадей заштрихований

областей

(

Р2

соответст­

вует

вся

заштрихованная

область,так

что

Р(у

г ^

) = / - Р£

)

 

Очевидно,

границы

доверительного

интервала

 

, ^

J

можно

смещать

в стороны

больших

или меньших

значений

IJ

*

не изменяя

величины Р

.

І. ія

придания

большей

определен­

ности,границы

доверительного интервала

обычно устанавливают

таким образом,

чтобы накопленные вероятности

P(ij

< ур)-

Р1

и

Р(у

* Ур)х

 

1 ~ Рг

 

равны

между собой. В этой

слу­

чае

становятся

одинаковыми

(в предгчах

интервала

,

^ р ~] )

вероятности отклонений

у

в стороны больших и меньших

значений

IT

у

. Тогда,

полагая

Pf

= 1 -

Р^ =

 

 

имеем:

 

 

 

 

 

 

 

 

 

 

- чз -

Для

сиі.'.і'.еїричнік

распреде. ениіі со

средним у

имеем

ур ~ ^ я

У ~ Уі р

» и Г І РИ

= 1~Рг

= ^2 Д ° и е

Р и т е л ь н н й

интервал оказывается симметричным относительно среднего зна­ ченії

Н і Г ^ ^ ^ - ^ і ) ' 1 - Е-

(5.5)

Обычно доверительный интервал указывают в единицах сред­ него квадратичного отклонения б" . Если последнее из­ вестно, то можно сделать опое деле шгге суждения о границах доверительного интервала, даже не исследуя характер распре­ деления результатов. Согласно неравенству Чебышева,

 

P

f

l

y

-

#

v

i

 

т . е . интервалу

^Cj

± 6cj]

 

соответствует доверительная

вероятность

не

меньшая,

чем

Р «

/ -

*/дг

. Однако это

ЗНР-

чение

Р ,

как пратшло, оказывабх'сн

очень

заниженным»

Так,

для нормального

распределения

 

 

 

 

для

Pfly-yl «

6

) - 0,683

*

0,7.

 

 

 

Поэтому неравенство

Чебышева

монет

быть

использовано лишИ

 

ориентировочных

оценок.

 

 

 

 

 

 

Заметим, что в силу традиции, - значение jym o 7^|.соответ­

ствующее доверительной вероятности

0,683

(уровень значимооти

с

- 0,3), часто называют средней

квадратичной ошибкой.

Для

нормального распределения

эта

величина

совпадает со сред-

 

 

 

 

- 'If -

 

 

 

 

 

ник

квадратичным отклонением. Поэтому

параметр

назы­

вают

средней

квадратичной

ошибкой

 

 

 

 

 

 

Однако

и последнее

время

принято

указывать

интервалы,

соответствующие

доверительно!;

вероятности

Р

2

 

0,95

( Є

$ 0,05).

Нелишне подчеркнуть, что в то

иреми

как для

нормального распределения такой интервал определяется удво­

ен, ым средним квадратичным отклонением,

в реальных распреде­

лениях его границы могут заметно превосходить

значения, рав­

ные среднему + удвоенная "средняя квадратичная

ошибка",

особе

но

в случае ограниченной эмпирической информации.

§

б.

Схема эксперимента. Выборочной

метод

и задачи

 

 

С ЧТИСТ ИШ1

 

 

Приступая к эксперименту, исследователь ставит сиоей целью выяснение определенных объективных характеристик ин­ тересующего его явления. К таким характеристикам могут отно­ ситься, например, данные о распределении какой-либо величины (среднее, дисперсия и т . д . ) .

Как правило, исследователь располагает некоторой пред­ варительной информацией, позволяющей в той или иной степени спланировать направленное проведение наблюдений. В процессе наблюдений экспериментатор собирает дополнительную информа­ цию, которая и служит реальной базой для вынесения суждений.

Как бы ни был обширен эксперимент, собираемая информа­ ция никогда не бывает абсолютно исчерпывающей. Наоборот, обычно (особенно в малоизведанных областях) эмпирическая

- 1*5 -

информация оказывается ограниченной.

Собранный материал может представлять несомненный ин­

терес сам но себе . Однако задача статистического

анализа

аксперименталыюго материала заключается в том (и в этом

состоит его сложность), что на основании

конечного числа

дан чих приходиться делать выводы (и оценивать их

достовер­

ность) относительно более широкого круга явлений.

Например, ми изучаем угловое распределение

продуктов

какой-нибудь ядерной реакции. Допустим,

что, исходя иа неко­

торых предварительных соображений, мы измерили интенсивность

выхода продуктов реакции под определенными углами. Этот ма­

териал уие представляет определенную ценность. Тем не менее,

задачей исследования является установление условий зависи­

мости выхода реакции во всем интервале изменения переменных,

т . е . необходимо, опираясь на ограниченный материал, вынести

суждения о более широкой совокупности явлений.

 

И этой связи

мы будем

рассматривать собранный

материал

как некую про'іиую группу ИЛИ выборку, представляющую лишь

один

из возможных

вариантов

наблюдений значений из

генераль­

ной

совокупности

исходной величины.

 

 

Разумеется,

в силу случайности пробной выборки, суждении

о характере генеральной совокупности, сделанные на ее основа­

нии, имеют случайный характер. Теория должна указать, следо­

вательно, как наилучшим способом распорядиться накопленной

эмпирической информацией для получения наиболее достоверных выводов, и одновременно оценить степень их надежности.

Наконец, теория должна предсказывать та.сже пути получе-

- k6 -

ния наиболее полезной информации, i . e . выработать методы научного планирования эксперимента.

§ ?. Принцип максимального правдоподобия

Принцип максимального правдоподобия является одной из самых плодотворных идей, лежащих в основе построения методов

статистического

анализа.

 

 

Кратко

принцип максимального правдоподобия может

быть

сформулирован

следующим образом:

 

Наилучшим описанием исследуемого явления является

 

то, при котором максимальна вероятность получить

 

фактически

наблюдаемые значения измеряемых величин.

В дальнейшем принцип

максимального правдоподобия

будет

иопользоваи для

различного

рода статистических оценок.

При

атом, в качестве исходного материала будет использоваться совокупность экспериментальных данных, рассматриваемых,сог­ ласно вышесказанному, как случайная выборка конечного объема из генеральной совокупности значений наблюдаемых величин.

Безусловно, никакой ограниченный материал не дает воз­ можности точно определить параметры генеральной совокупности. Такой материал позволяет лишь указать оценки искомых парамет­ ров. Теория утверждает, однако, что способ оценок, следую­ щий из принципа максимального правдоподобия, обладает рядом отличительных свойств, заставляющих,при сравнении различных критериев,отдать предпочтение этому принципу.

Перечислим основные свойства оценок, следующих иа прин­ ципа максимально го правдоподобия.

 

Прежде

всего,

оценки являются состоятельными, т . е .

сходятся

по вероятности к соответствующим параметрам.

 

 

Пусть, например, в генеральной совокупности оценивается

параметр

(X

. На основании выборки объема

П.

получена

его

оценка

Сі

. Тогда" при бесконечном

увеличении

объ-

ема

выборки

вероятность того, что значение

Q

отклонит­

ся

от CL

на сколь угодно малую величину,

стремится

к нулю.

 

Оценки, базирующиеся на случайном материале, сами яв ­

ляются случайными величинами и имеют некоторое

выборочное

распределение. Однако, оценки являются асимптотически

зор -

мальными и асимптотически эффективными, т . е . кх распределе­

ние сходится

к

нормальному при

П — с о

и

дисперсия этих

распределений

при

М »

I меньше дисперсий

любых других

сценок.

 

 

 

 

 

 

 

Оценки

оказываются

также

достаточными,

 

т . е . содержат

максимум информации относительно исходных параметров.

Отметим

еще

одно важное свойство статистических оценок,

которое, впрочем,не вытекает безусловно из принципа максималь­

ного

правдоподобия.

Это-

так называемая несмещенность оце­

нок,

требующая, чтобы при

любом объеме

выборки IX

ореднее

оценок по всем

возмокным

в генеральной

совокупности

значе­

ниям" величин,

имеющимся

в

выборке, совпадало с истинными зна­

чениями параметров

( о

процедуре такого

усреднения см. § 8) .

 

Если имеется несколько оценок, то обычпо выбирают не ­

смещенную оценку, поскольку в последней отсутствуют систе­

матические смещения.

 

 

 

 

 

Условие несмещенности особенно важно при калом объеме

выборки. С помощью

этого

требования удается уточнись

оценки,

вытекающие из общего принципа.

§ 8. Оценка параметров физических распределений

В большинстве физических экспериментов общий характер

распределений случайных величин можно предсказать

зарвнее

или на сснованги некоторых предварительных

измерений, или

с помощью определенных теоретических соображений.

Неизвест­

ны лишь параметры З'^их распределений. Укажем способ

их оцен­

ки, опираясь на метод максимального правдоподобия.

 

 

Пусть в эксперименте исследуетоя величина

,

причем

измеренные значения оказались равными Lj t ,

. ,

 

;

измерения ъезависимы между собой. Если теоретическая веро­

ятность наблюдений

некоторого значения

и.

есть о

( и . ,

то вероятность

получения

в

опыте

указанных

значений

равна

 

 

 

 

к

 

 

 

(8.1)

L f y » f c , - - - > # J - Л р ( ^ , * , Д . . . ) .

Величина

L

называется

функцией

правіоподобия

вы­

борки. Заменим

теперь в

L

параметры

dtp7...

на

их

оценки

Согласно принципу максимального правдоподобия, наилуч- ими оценками с(ур, . - . являются такие, при которых функция правдоподобия L ' принимает максимальное значение.

 

-

1\Э -

 

т . е . прі*

 

 

 

 

% = о ;

И

= о > • • -

(8.3)

Вместо (8.3) часто

удобтее

использовать

уравнения

d8nL _ п

<)&iL

п

 

В качестве примеров рассмотрим задачи определения пара­ метров пуассоновского и нормального распределений.

 

 

8.1.

Распределение

Пуассона

 

 

 

 

 

Для распределения Пуассона функция правдоподобия имеет

вид

:

 

 

 

 

 

 

 

 

 

 

 

 

 

*-

 

 

І

(Н)

е

 

 

 

 

 

 

ы

 

 

i't

 

N.!

 

 

 

(8.5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

где

\)

- средняя

 

интенсивность

процессов,

N.

-

зна­

чения числа

событий,

 

фиксируемых

в

течение

времени

Ь

.

 

В соответствии

с

(8.4), ^ля

оценки

V

имеем :

 

 

| £ i . -

R

t * i

£ W

j

. O .

 

 

(8.6)

И, следовательно,

наилучшей

оценкой

ї) является

выбороч­

ное

среднее

от эмпирических

интенсивиоптей

^t/l

 

, т . е .

 

 

 

 

 

 

 

 

 

 

 

<8 -7 '

Оценки V является несмещенной* поскольку

Соседние файлы в папке книги из ГПНТБ