Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МНИ / МНИ / МНИ_1.doc
Скачиваний:
154
Добавлен:
28.03.2015
Размер:
477.7 Кб
Скачать
    1. Нормальное распределение

Предельное распределение f(x) результатов измерения некоторой величины x дает вероятность получения любого данного значения x. Интеграл – есть вероятность того, что любое единичное измерение приведет к результату, лежащему внутри интервалаaxb. Если предельное распределение есть функция Гаусса, то этот интеграл можно вычислить. В частности, можно вычислить вероятность того, что результат измерения окажется в пределах одного стандартного отклонения σ от истинного значения X.

P(в пределах σ)=; (14)

P(в пределах σ)=. (15)

Смысл этого интеграла проиллюстрирован на рис. 2:

Площадь между X – tσ и X + tσ равна вероятности того, что результат измерения будет лежать в пределах t стандартных отклонений от X.

Этот интеграл можно привести к более простому теперь уже обычной для нас подстановкой (x-X)/σ=z. В этом случае dxdz и пределы интегрирования становятся равными ±1. Следовательно,

P(в пределах σ)=. (16)

В общем случае можно вычислить вероятность P(в пределах tσ), что означает «вероятность того, что результат будет лежать в пределах tσ от X», где t – любое положительное число. Эта вероятность показана заштрихованной площадью на рисунке, и расчет, аналогичный приведшему к (15), дает

P(в пределах tσ)=. (17)

Интеграл – стандартный интеграл математической физики; он часто называется функцией ошибок, обозначаемой erf(t), или нормальным интегралом ошибок. На рис. 3 его значения представлены графически и приведены несколько его значений:

Таблица 1

t

0

0,25

0,5

0,75

1,0

1,25

1,5

1,75

2,0

2,5

3,0

3,5

4,0

Р,%

0

20

38

55

68

79

87

92

95,4

98,8

99,7

99,95

99,99

Как можно заметить, вероятность того, что результат измерения окажется в пределах одного стандартного отклонения от истинного результата, составляет 68%. Если мы будем рассматривать стандартное отклонение как нашу погрешность в измерениях (т.е. запишем x= xнаил±δx и примем δx =σ), то мы можем быть на 68% уверены, что наш результат будет в пределах σ от правильного результата.

Число 68% – это просто доверительный уровень, связанный со стандартным отклонением σ. Альтернативой стандартному отклонению может служить так называемая вероятная ошибка (ВО), которая определяется как такое отклонение, когда результат измерения с вероятностью 50% окажется внутри интервала XВО. Из рис. 3 можно увидеть, что вероятная ошибка равна ВО0,67.

    1. Критерий χ2 для распределений

Будем рассматривать вопрос о том, как решить, подчиняются ли результаты данного эксперимента ожидаемому предельному распределению. Предположим, что выполнен эксперимент, для которого, известно ожидаемое распределение результатов. Далее, эксперимент повторяют еще несколько раз и регистрируют результаты наблюдений. Как определить, согласуется ли наблюдаемое распределение с ожидаемым теоретическим распределением? На этот вопрос можно ответить, используя простую процедуру, называемую критерием χ2.

  1. Введение в критерий χ2

Предположим, что сделано 40 измерений x1,...,x40 длины траектории х пули, вылетающей из некоторого ружья. Результаты этих измерений распределены в соответствии с законом Гаусса fx,σ(x), со значениями X и σ Расчет наилучших оценок для этих величин по 40 результатам измерений:

(наилучшая оценка X)==,(18)

(наилучшая оценка σ)=. (19)

Чтобы выяснить, удовлетворяет ли фактическое распределение результатов x1, …, x40 сделанному выше предположению, необходимо рассчитать, как были бы распределены 40 результатов, если бы гипотеза была верна, и сравнить это ожидаемое распределение с фактически полученным распределением. Первая трудность заключается в том, что x есть непрерывная переменная, поэтому нельзя говорить об ожидаемом числе измерений для какого-то одного значения x. Вместо этого следует говорить об ожидаемом числе в некотором интервале a<x<b, т.е. необходимо поделить весь интервал возможных значений на бины. В случае 40 измерений границы бинов можно выбрать при X-σ, X и X+σ, определяя таким образом четыре бина.

ВероятностиP1, …, P4 того, что результаты попадут в каждый из четырех бинов (k=1, …, 4), равны соответствующим четырем площадям, показанным под функцией Гаусса:

Обозначим число результатов измерений, которые попадают в каждый бин k через Ok . (Для данных примера наблюдаемые числа О1, О2, О3, О4.) Далее, предполагая, что результаты измерений распределены нормально, можно рассчитать ожидаемое число Ek результатов измерений для каждого бина k. Затем необходимо решить, насколько хорошо наблюдаемые числа Ok согласуются с ожидаемыми числами Ek.

Вероятность того, что результат любого одного измерения попадает в интервал a<x<b, равен площади под функцией Гаусса между x=a и x=b. В примере вероятности P1, P2, P3, P4 попадания результата измерения в каждый из четырех бинов – это четыре площади, показанные на рисунке. Две равные площади P2 и P3 вместе дают хорошо известное значение 68%, так что вероятность попадания в один из двух центральных бинов составляет 34%, (P2=P3=0,34). Две внешние площади представляют оставшиеся 32%; (P1=P4=0,16). Чтобы найти ожидаемые числа Ek, нужно просто умножим эти вероятности на полное число измерений N=40. Эти ожидаемые числа приведены в табл.2.

Таблица 2. Ожидаемые числа Ekи наблюдаемые числа Okдля 40 измерений

Бин k

1

2

3

4

Вероятность Pk, %

16

34

34

16

Ожидаемое число Ek=N*Pk

6,4

13,6

13,6

6,4

Наблюдаемое число Ok

8

10

16

6

Необходимо решить насколько хорошо ожидаемые числа Ek согласуются с соответствующими наблюдаемыми числами Ok. Если гипотеза о том, что результаты измерений распределены нормально, правильно, то отклонения

(Ok - Ek ) (20)

будут малы.

Если представить, что вся серия из 40 измерений повторяется много раз, то числа Ok результатов измерений в любом одном бине k можно рассматривать как результат счетного эксперимента. Множество различных результатов для Ok должно иметь среднее значение Ek и флуктуировать относительно Ek со стандартным отклонением порядка . Таким образом, необходимо сравнить, два числа: отклонение (Ok-Ek) и ожидаемую величину его флуктуаций .

. (21)

Для некоторых бинов k это отношение будет положительным, для других – отрицательным; для малого числа бинов k оно может существенно превышать единицу, но для большинства бинов оно должно быть порядка единицы или меньше. Чтобы проверить гипотезу требуется число (21) возвести в квадрат для каждого k и затем просуммировать по всем бинам k=1,…,n (в данном случае n=4).

χ2=. (22)

Должно быть ясно, что число χ2 служит показателем того, насколько хорошо согласуются наблюдаемое и ожидаемое распределения. Если χ2=0, то согласие идеальное, т.е. Ok=Ek для всех бинов k. В общем отдельные члены в сумме (22) должны быть порядка единицы, а в сумме всего n членов,т.е.

χ2n, (23)

2 порядка n или меньше), то наблюдаемое и ожидаемое распределения согласуются настолько хорошо, насколько можно было бы ожидать.

  1. Общее определение χ2

Пусть измеряется какое-то число x и для которого есть основания ожидать некоторое определенное распределение результатов. Эксперимент повторяется много раз (N), и, поделив интервал возможных значений x на n бинов, k=1, …, n, можно подсчитать числа Ok наблюдений, когда результат попадает в каждый бин k. Предполагая, что результаты измерений действительно распределены в соответствии с ожидаемым распределением, вычисляются ожидаемые числа Ek измерений для k-того бина, и χ2 будет определяться следующим образом:

χ2=(24)

Если χ2n, то согласие между наблюдаемым и ожидаемым распределениями приемлемое, если χ2n, то имеется существенное расхождение.

Процедура выбора бинов для слагаемых, по которым вычисляется χ2, в некотором отношении зависит от характера эксперимента. В частности, она зависит от того, непрерывна или дискретна измеряемая величина x.

Измерения непрерывной переменной

Единственное предельное распределение, которое мы рассмотрели в случае непрерывной переменной, - это распределение Гаусса. В случае многих атомных и ядерных экспериментов ожидаемое распределение измеряемой переменной x (энергии) – это распределение Лоренца:

f(x)~, (25)

где X и γ – некоторые постоянные. Каким бы ни было ожидаемое распределение f(x), полная площадь под графиком f(x) всегда равна 1, и вероятность того, что результат измерения попадает между x=a и x=b, - это площадь под графиком между a и b:

P(a<x<b)=. (26)

Таким образом, если k-й бин имеет размеры от x=ak до x=ak+1, то ожидаемое число измерений в k-м бине (после выполнения всех N измерений) будет равно

Ek=. (27)

Ожидаемые числа Ek не должны быть слишком малы. Хотя и не существует определенной нижней границы, однако

Ek5. (28)

Следовательно, следует выбирать бины таким образом, чтобы k, определяемые (27), удовлетворяли этому условию. Нельзя использовать критерий χ2 в такого рода экспериментах, если полное число наблюдений меньше 20.

Изменение дискретной переменной

На практике наиболее часто встречающаяся дискретная переменная – целое число. Обозначим дискретную переменную через ν вместо x. В любом эксперименте с дискретной переменной бины можно выбирать так, чтобы каждый содержал только один результат при условии, что ожидаемое число реализаций в каждом бине составляет, по крайней мере, 5. В противном случае несколько различных результатов следует сгруппировать в один бин большего размера.

  1. Другие формы χ2

χ2=. (29)

χ2 – сумма квадратов, служит показателем согласия между наблюдаемыми и ожидаемыми значениями некоторой переменной. При хорошем согласии χ2 будет порядка n, при плохом χ2 будет много больше, чем n.

  1. Степени свободы и приведенное значение χ2

Однако более строгой процедурой было бы сравнение χ2 не с числом бинов n, а с числом степеней свободы d, в статических расчетах определяемым как число полученных данных за вычетом числа параметров, вычисленных по этим данным и используемых в расчетах.

Введём понятие приведенного значения χ2 (или χ2 на одну степень свободы), которое мы обозначим через и определим как

=. (30)

Поскольку ожидаемое значение χ2 равно d, получаем

(ожидаемое среднее значение)=1 . (31)

Таким образом, критерий можно сформулировать следующим образом: если значение порядка единицы или меньше, то нет оснований сомневаться в ожидаемом распределении; если значениемного большее, чем единица, то ожидаемое распределение не верно.

Соседние файлы в папке МНИ