Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Гмурман.doc
Скачиваний:
9
Добавлен:
01.03.2025
Размер:
4.92 Mб
Скачать

§ 6. Эмпирические и выравнивающие (теоретические) частоты

А. Дискретное распределение. Рассмотрим дис­кретную случайную величину X, закон распределения которой неизвестен. Пусть произведено п испытаний, в которых величина X приняла пх раз значение а:,, п2 раз значение х2, ..., nk раз значение хк, причем 2^п{ = п.

Эмпирическими частотами называют фактически на­блюдаемые частоты п{.

Пусть имеются основания предположить, что изуча­емая величина X распределена по некоторому определен­ному закону. Чтобы ироверить, согласуется ли это пред; положение с данными наблюдений, вычисляют частоты Наблюдаемых значений, т. е. находят теоретически частоту n't каждого из наблюдаемых значений в предпо­ложении, что величина X распределена по предполагае­мому закону.

Выравнивающими (теоретическими) в отличие от фак-тически наблюдаемых эмпирических частот называют Частоты п\, найденные теоретически (вычислением). Вы-

245

равнивающие частоты находят с помощью равенства

где п — число испытаний; Р,- — вероятность наблюдаемого значения xh вычисленная при допущении, что X имеет предполагаемое распределение.

Итак, выравнивающая частота наблюдаемого значения Xj дискретного распределения равна произведению числа испытаний на вероятность этого наблюдаемого значения.

Пример. В результате эксперимента, состоящего из п = 520 исгты-таний, в каждом из которых регистрировалось число х/ появлений некоторого события, получено следующее эмпирическое распределение: набл. значения . . дс,- 0 1 2 3 4 5 6 7 эмп. частота . . щ 120 167 130 69 27 5 1 1 Найти выравнивающие частоты п'( в предположении, что случайная величина X (генеральная совокупность) распределена по закону Пуассона.

Решение. Известно, что параметр X, которым определяется распределение Пуассона, равен математическому ожиданию этого распределения. Поскольку в качестве оценки математического ожи­дания принимают выборочную среднюю (см. гл. XVI, § 5), то и в качестве оценки Я можно принять выборочную среднюю хп. Легко найти по условию, что выборочная средняя равна 1,5, следовательно, можно принять Я =1,5.

Таким образом, формула Пуассона

принимает вид

Пользуясь этой формулой, найдем вероятности Р5а0 (k) при k = 0, 1, 2, 3, 4, 5, 6, 7 (для простоты записи индекс 520 далее опущен): Р(0) = 0,22313, Р (1) = 0,33469, Р (2) = 0,251021, Р (3) = 0,125511, Р (4) = 0,047066, Р (5) = 0,014120, Р (6) = 0,003530, Р (7) =0,000755. Найдем выравнивающие частоты (результаты умножения округ­лены до единицы):

п[ = пР (0) = 520 • 0,22313 = 116, П2=иР(1) = 520-0,33469=174.

Аналогично находят и остальные выравнивающие частоты. В ито­ге получим:

эмп. частота . . 123 167 130 69 27 5 1 1 выр. частота . . 116 174 131 65 25 7 2 0

Сравнительно небольшое расхождение эмпирических и выравни­вающих частот подтверждает предположение, что рассматриваемое распределение подчинено закону Пуассона.

Заметим, что если подсчитать выборочную дисперсию по данному распределению, то окажется, что она равна выборочной еДне^ т.е. 1,5. Это служит еще одним пoдтвepждeниJm--<y^eлaннoгo ложения, поскольку для распределения Пуассона \ = М (X) =

246

Сравнения эмпирических и теоретических частот «на глаз», ко--чно, недостаточно. Чтобы сделать это более обоснованно, надо ^пользовать, например, критерий Пирсона (см. гл. XIX, § 23). Проверка гипотезы о распределении случайной величины по закону Пуассона изложена в книге: Гмурман В. Е. Руководство к реше­нию задач по теории вероятностей и математической статистике. ^ «Высшая школа», 1972 (см. гл. XIII, § 17).

Б. Непрерывное распределение. В случае непрерывного распределения, вероятности отдельных возможных значе­ний равны нулю (см. гл. X, § 2, следствие 2). Поэтому весь интервал возможных значений делят на k непересе­кающихся интервалов и вычисляют вероятности Р( попа­дания X в г-й частичный интервал, а затем, как и для дискретного распределения, умножают число испытаний на эти вероятности.

Итак, выравнивающие частоты непрерыв­ного распределения находят по равенству

n't = nPt,

где п — число испытаний; Р{ — вероятность попадания X в f-й частичный интервал, вычисленная при допущении, что X имеет предполагаемое распределение.

В частности, если имеются основания предположить, что случайная величина X (генеральная совокупность) распределена нормально, то выравнивающие частоты могут быть найдены по формуле

где п — число испытаний (объем выборки), h—длина час­тичного интервала, 0В—выборочное среднее квадрати-ческое отклонение, и, = (л:,-—хв)/ов (х,-—середина t-ro частичного интервала),

пример на применение формулы (*) приведен в § 7.

j. Пояснение. Поясним происхождение формулы (*).

Запишем плотность общего нормального распределения:

247

При а = 0 и а=1 получим плотность нормированного распределения:

и ли, изменив обозначение аргумента,

П оложив и~(ха)/о, имеем

ф (и) = ^

Сравнивая (**) и (***), заключаем, что

Если математическое ожидание а и среднее квадрати-ческое отклонение а неизвестны, то в качестве оценок этих параметров принимают соответственно выборочную среднюю хв и выборочное среднее квадратическое откло­нение о„ (см. гл. XVI, § 5,9). Тогда

где и = (х—в)/ов.

Пусть X/—середина 1-го интервала (на которые раз­бита совокупность всех наблюдаемых значений нормально распределенной случайной величины X) длиной h. Тогда вероятность попадания X в этот интервал приближенно равна произведению длины интервала на значение плот­ности распределения / (а:) в любой точке интервала и, в частности, при х = х{ (см. гл. XI, § 5):

Следовательно, выравнивающая частота

о

где и( = (х{хв)/ав. Мы получили формулу (*). 248