Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1948

.pdf
Скачиваний:
0
Добавлен:
15.11.2022
Размер:
1.03 Mб
Скачать

Распределение 2 зависит от параметра r, называемого чис-

лом «степеней свободы» распределения. Число степеней свободы r равно числу разрядов k минус число независимых условий («связей»), наложенных на частоты pi*.

Для распределения 2 составлены специальные таблицы. Пользуясь ими можно для каждого значения 2 и числа

степеней свободы r

, найти вероятность того, что величина,

распределенная по закону

2 , превзойдет это значение.

Распределение

2

дает возможность оценить степень

согласованности теоретического и статистического распределений. Пусть величина Х действительно распределена по закону F(x). Тогда вероятность р, определенная по таблице, есть вероятность того, что за счет чисто случайных причин мера расхождения теоретического и статистического распределений

(9) будет не меньше, чем фактически наблюдаемое в данной серии опытов значение 2 . Если эта вероятность мала (на-

столько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе Н о том, что закон распределения величины Х есть F(x). Эту гипотезу следует отбросить как неправдоподобную. Однако, если вероятность р сравнительно велика, можно признать расхождения между теоретическим и практическим распределениями несущественными и отнести их за счет случайных причин. Гипотезу Н о том, что величина Х распределена по закону F(x), можно считать правдоподобной или, по крайней мере, не противоречащей опытным данным.

Итак, схема применения критерия 2 к оценке согласованности теоретического и статистического распределений:

1. Определяется мера расхождения 2 по формуле (9).

2. Определяется число степеней свободы r, как число разрядов k минус число наложенных связей s:

71

r= k- s.

3. По r и 2 с помощью таблицы определяется вероятность того, что величина, имеющая распределение 2 превзойдет данное значение 2 .

Если эта вероятность весьма мала, то гипотеза отбрасывается как неправдоподобная. Если же эта вероятность относительно велика, гипотезу можно признать не противоречащей опытным данным. На практике, если р оказывается меньшим, чем 0,1, рекомендуется проверить эксперимент, если возможно

– повторить его и в случае, если заметные расхождения появятся снова, пытаться искать более подходящий для описания статистических данных закон распределения.

Подчеркнем, что с помощью любого критерия согласия можно только в некоторых случаях опровергнуть выбранную гипотезу Н и отбросить ее как явно несогласную с опытными данными. Если же вероятность р велика, то этот факт сам по себе не считается доказательством справедливости гипотезы Н, а указывает только на то, что гипотеза не противоречит опытным данным.

6. Обработка опытов

Для того чтобы найти закон распределения, необходимо располагать обширным статистическим материалом, порядка нескольких сотен опытов. Однако на практике, в силу дороговизны постановки опытов, чаще приходится иметь дело с двумя – тремя десятками наблюдений, а этого не достаточно для того, чтобы найти заранее неизвестный закон распределения случайной величины. Но этот материал может быть обработан, и на его основе получены некоторые сведения о случайной величине, такие, как ее числовые характеристики: математическое ожидание, дисперсия.

С другой стороны, как часто бывает на практике, вид за-

72

кона распределения заранее известен, но необходимо найти некоторые параметры, от которых он зависит, скажем, то же математическое ожидание и среднее квадратическое отклонение (для нормального закона распределения).

Рассмотрим, как найти неизвестные параметры, от которых зависит закон распределения случайной величины, по ограниченному числу опытов.

Любое значение параметра, вычисленное на основе ограниченного числа опытов, всегда содержит элемент случайности. Такое приближенное, случайное значение называют оценкой параметра. Например, оценкой для математического ожидания может служить среднее арифметическое наблюдаемых значений случайной величины в n независимых опытах. При очень большом числе опытов среднее арифметическое будет с большой вероятностью весьма близко к математическому ожиданию. Если число опытов невелико, то замена математического ожидания средним арифметическим приводит к какой то ошибке, и эта ошибка тем больше, чем меньше число опытов. Так же и с оценками других параметров. Любая из оценок случайна, и при пользовании ею неизбежны ошибки. Необходимо выбрать такую оценку, чтобы эти ошибки были по возможности минимальными.

Пусть имеется случайная величина X, закон распределе-

ния которой содержит неизвестный параметр а. Требуется

~

найти подходящую оценку a для параметра а по результатам n независимых опытов, в каждом из которых величина X принимает определенное значение.

~

Предъявим к оценке a ряд требований, которым она должна удовлетворять, чтобы быть «доброкачественной» оценкой.

Потребуем следующее.

1) Чтобы при увеличении числа опытов оценка ~ при- a

ближалась к параметру а. Оценка, обладающая таким свойст-

73

вом, называется состоятельной.

2) Чтобы, при использовании величины ~ вместо а, не a

делалась систематическая ошибка в сторону завышения, или

~

занижения, то есть выполнялось условие M a a . Оценка, удовлетворяющая такому условию, называется несмещенной.

3) Чтобы выбранная несмещенная оценка обладала по сравнению с другими наименьшей дисперсией, то есть

~

D a min . Оценка, обладающая таким свойством, называется

эффективной.

На практике не всегда удается удовлетворить всем этим требованиям, поэтому прежде, чем выбрать ту или иную оценку, необходимо критически ее рассмотреть со всех вышеперечисленных точек зрения.

7. Оценки для математического ожидания и дисперсии

Пусть имеется случайная величина Х с математическим ожиданием m и дисперсией D. Оба параметра неизвестны. Над величиной Х произведено n независимых опытов, давших результаты x1 , x2 , , xn . Требуется найти состоятельные и не-

смещенные оценки для параметров m и D.

В качестве математического ожидания естественно предложить среднее арифметическое наблюдаемых значений m :

 

n

 

 

~

 

xi

i 1

 

.

m m

 

 

n

 

 

 

 

Эта оценка является состоятельной, так как при увеличе-

~ ~

нии n величина m сходится по вероятности к m. Оценка m является также и несмещенной, так как

74

 

n

 

 

m

 

~

i 1

m .

M m

 

n

 

 

Дисперсия этой оценки равна:

~

1

D .

D m

 

n

Эффективность или неэффективность оценки зависит от вида закона распределения величины Х. Если величина Х рас-

пределена по нормальному закону, то дисперсия будет мини-

~

мально возможной, то есть оценка m является эффективной. Для других законов распределения это может быть не так.

Для оценки дисперсии будем использовать так называемую «исправленную» статистическую дисперсию, которая является состоятельной и несмещенной.

 

 

 

n

~ 2

 

n

 

 

 

 

 

 

xi

 

2

 

 

 

 

~

 

m

 

xi

~ 2

n

 

 

i 1

 

 

i 1

 

D

 

 

 

=

 

m

 

.

 

 

n

1

n

n 1

Оценка

~

для дисперсии не является эффективной, од-

D

нако для нормального

закона

распределения она является

«асимптотически эффективной», то есть при увеличении n отношение дисперсии к минимально возможной неограниченно приближается к единице.

8. Доверительный интервал. Доверительная вероятность

Ранее был рассмотрен вопрос об оценке неизвестного параметра а одним числом. Такая оценка называется «точечной». Однако в ряде задач требуется не только найти для параметра а подходящее численное значение, но и оценить его

75

точность и надежность. Требуется знать, к каким ошибкам

~

может привести замена параметра а его точечной оценкой a и

с какой степенью уверенности можно ожидать, что эти ошибки не выйдут за известные пределы?

Такого рода задачи особенно актуальны при малом числе

~

наблюдений, когда точечная оценка a в значительной мере

~

случайна и приближенная замена а на a может привести к серьезным ошибкам.

Чтобы дать представление о точности и надежности

оценки ~ , в математической статистике пользуются так назы- a

ваемыми доверительными интервалами и доверительными вероятностями.

Пусть для параметра а получена из опыта несмещенная

~

 

оценка a . Необходимо оценить возможную при этом ошибку.

Назначим такую вероятность

( = 0,9; 0,95 или 0,99), с ко-

торой событие можно считать практически достоверным, и

найдем такое значение , для которого P

 

~

a

 

или

 

 

 

a

 

~

~

.

 

 

 

 

 

 

P a

a a

 

 

 

 

 

 

 

Тогда диапазон практически возможных значений ошиб-

ки, возникающей при замене а на

~

 

 

, а большие по

a , будет

величине ошибки будут появляться лишь с малой вероятно-

стью

1 , а неизвестное значение параметра а попадает в

интервал

 

 

 

 

 

I

~

~

.

 

a

; a

Величина рассматривается не как вероятность «попадания» точки в интервал I, а как вероятность того, что случайный интервал I накроет точку а (рис. 5).

76

I

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

а

~

а2

а

 

 

а1

a

 

 

 

 

 

 

 

 

Рис. 5

 

 

 

Вероятность

называют доверительной вероятностью,

а интервал I

- доверительным интервалом. Границы интер-

вала I : a1

~

и

~

называются доверительными

a

a2 a

границами.

Пусть произведено n независимых опытов над случайной величиной Х, характеристики которой – математическое ожидание m и дисперсия D – неизвестны. Для этих параметров получены оценки:

 

n

 

 

 

m

 

~

~

i 1

 

m

 

;

D

n

 

 

 

n

~ 2 xi m

i 1

 

.

 

 

 

n 1

Требуется построить доверительный интервал I, соот-

ветствующий доверительной вероятности

 

(заданной), для

математического ожидания m и дисперсии D величины Х.

~

~

распределены по

Исходим из того, что величины m и

D

нормальному закону. Характеристики этого закона – математическое ожидание и дисперсия – равны соответственно m и

 

D

. Предположим, что дисперсия D известна. Найдем такую

 

n

 

 

 

 

 

 

величину , для которой

 

 

 

 

P

 

~

 

.

 

 

 

 

 

 

 

m m

 

Используя формулу для вычисления вероятности задан-

77

ного отклонения, имеем

~

2Ф /

P m m

~ 2Ф t , m

где ~

m

D - среднее квадратическое отклонение оценки ~ , m

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

n /

 

D .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда

 

 

t D /

n , а, приняв во внимание, что веро-

ятность Р задана и равна

 

, то окончательно имеем

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P m t D / n m m t D / n 2Ф t

 

Таким образом, с вероятностью

 

 

 

(надежностью) можно

утверждать,

 

 

 

что

 

 

 

 

доверительный

интервал

I =

~

 

 

 

 

 

 

~

 

 

 

 

 

 

 

 

покрывает неизвестный па-

 

 

 

D /

 

 

 

D /

 

n

m t

 

n, m t

 

 

 

 

 

 

 

 

 

 

 

 

раметр m; точность оценки

 

 

t

 

D /

 

 

n . Число t определяет-

ся из равенства 2Ф t

или Ф t

 

. По таблице функции

2

Лапласа находят аргумент t, которому соответствует значение функции Лапласа, равное 2 .

Предположим теперь, что дисперсия D неизвестна.

Тогда доверительный интервал для математического ожидания находится

 

 

 

 

 

 

 

 

 

 

I

~

~

 

 

~

~

 

 

= m t D / n, m t D / n ,

где величина t определяется из условия

78

t

P T t 2 Sn 1 t dt

0

и находится из таблицы для t.

Здесь Sn 1 t плотность закона распределения Стьюдента с n-1 степенями свободы

 

 

Г

n

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

2

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sn 1 t

 

 

 

 

 

 

 

1

 

 

 

,

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

n

 

1

 

 

 

 

n 1 Г

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Г x- гамма –функция:

Г x u x 1e u du .

0

Доверительный интервал для дисперсии, накрывающий точку D с вероятностью , находится

 

~

 

~

 

I

D n 1

;

D n 1

,

2

2

 

 

 

 

1

 

2

 

где 2 распределение с r = n-1 степенями свободы.

79

Вопросы для самопроверки

1. Каковы основные задачи математической статистики?

2.Что называется выборкой? Повторные и бесповторные выборки.

3.Что называется статистическим распределением?

4.Что такое гистограмма частот?

5.Каковы числовые характеристики статистического распределения?

6.Что такое доверительный интервал? Как определить доверительный интервал для оценки математического ожидания нормального распределения?

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]