
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfданных вид функции распределения обычно вначале выбирается на основании учета общих положений, в частности соответствия принимаемого закона распределения граничным условиям измене ния рассматриваемой гидрологической характеристики. В после дующем производится широкая проверка (применительно к усло виям различных рек) соответствия принятого закона распределения вероятностей эмпирическому материалу. Эта проверка на на чальных этапах использования кривых распределения для расчета гидрологических характеристик выполнялась на основании непо средственного сопоставления эмпирических и аналитических кри вых обеспеченностей. В последующем были испытаны более объек тивные приемы оценок, например статистический критерий %2, кри
терий Колмогорова—Смирнова и др.
2. После выбора вида функции распределения возникает задача определения числовых значений параметров этой функции, которые рассчитываются по данным наблюдений за той или иной характе ристикой стока или какого-либо другого элемента гидрологического режима. Правильный выбор функции распределения и ее числовых параметров, определяемых по эмпирическим данным (среднее арифметическое значение, коэффициенты вариации и асимметрии),
обеспечивает наилучшее, с точки зрения, например, |
принципа наи |
||
меньших квадратов, сглаживание |
эмпирического |
распределения. |
|
3. Учитывая |
возможные погрешности определения параметров |
||
распределения, |
обусловленные |
ограниченностью |
используемых |
в расчете выборок, важно количественно оценить эти погрешности. Такая оценка осуществляется либо с использованием теоретиче ских формул, выведенных при некоторых ограничениях, либо с при менением метода статистических испытаний.
§ 2
дискретное биномиальное распределение
В практике гидрологических расчетов наибольшее распростра нение получила кривая Пирсона III типа, представляющая собой обобщение дискретного биномиального распределения для случая непрерывных случайных величин. Биномиальный закон распреде ления соответствует повторению при постоянных условиях одного и того же испытания, имеющего лишь два исхода: появление (веро ятность р) или непоявление (вероятность q —1— р) случайного со
бытия. Каждое значение случайной величины, распределенной по биномиальному закону, представляет собой число случаев (т) осу ществления некоторого случайного события из п возможных слу
чаев.
Изложение схемы биномиального распределения может быть осуществлено с учетом теорем сложения и умножения вероятно стей.
60
По теореме сложения вероятностей следует, что вероятность появления одного из несовместимых событий без указания, какого именно, равна сумме вероятностей этих событий, или иначе, если случайное событие А может появиться в нескольких видах — Ль Л2, А3, ..., А п, имеющих разные вероятности — pi, р2, ..., р„, то ве роятность появления величины Л в видах Ль Лг, Аз, ..., Ль (k<n)
будет равна сумме вероятностей событий Ль Л2, ..., Л&, т. е.
Р —Р\Л~Р2-\~ • ■■-\~Pk-
Эту теорему иногда записывают в виде
Р(А w В w . . . w К )= р (А )+ р (В) + . . . + / » (К),
где обозначение w соответствует слову «или», а события А, В, ..., К
несовместимы.
По теореме умножения вероятностей следует, что вероятность совпадения нескольких независимых случайных событий равна произведению их вероятностей.
Под независимыми случайными событиями будем понимать та кие, при которых исход того или иного испытания не зависит от пре дыдущих и, следовательно, следующее испытание не может быть предсказано на основании реализации предыдущих испытаний.
Теорема умножения вероятностей обычно записывается в виде
Р(АВ . . . К )= р{А )р(В ) . . . р(К).
При этом также предполагается, что события А, В, ..., К неза
висимы между собой.
В соответствии с указанным выше биномиальное распределение получается при решении следующей задачи.
Производится п независимых испытаний, в результате которых
событие может принимать положительные значения 0, 1, 2, |
..., п |
||||
с вероятностями ро, |
ри рг, ■■., |
рп. |
Вероятность |
появления |
собы |
тия Л одна и та же |
и равна р, |
а |
вероятность |
противоположного |
события В (непоявление Л) равна q. Требуется определить вероят ность Рт появления события Л т раз при п испытаниях.
В технических приложениях под событием Л часто понимают, например, количество годных изделий в некотором объеме совокуп ности, а противоположное событие показывает количество изделий с браком. Имеются попытки [58] рассматривать статистические совокупности величин стока с позиций биномиального закона рас пределения. В этом случае за событие Л принимались дождливые периоды, в течение которых может формироваться сток, а в каче стве противоположного события — бездождные периоды. При этом считалось, что наступление дождливого и бездождного периодов является событием независимым, и, следовательно, вероятность наступления дождливого периода (р) и вероятность наступления бездождного периода (q) остаются постоянными во всех испыта
ниях. В классических построениях теории вероятностей в качестве модели биномиального распределения обычно рассматривается схема извлечения (с последующим возвращением) шаров из урны,
61
содержащей р черных и q белых шаров. Очевидно, что все эти при
меры сводятся к единому математическому построению. В силу этого рассмотрим вывод биномиального закона распределения в об щей постановке задачи.
В случае если при осуществлении опыта должно появиться одно из двух событий А или В, имеющих вероятности р и q, то сумма их вероятностей p + q = \, так как достоверно известно, что либо А , либо В в каждом опыте осуществимы.
Рассмотрим последовательно случаи с 2, 3 и 4 испытаниями, которые затем обобщим на случай п испытаний. Если вероятность события при одном испытании равна р, то вероятности того, что при двух испытаниях событие А может произойти 0 раз (т. е. не произойдет ни разу событие А, а произойдет в обоих испытаниях событие В) или 1 и 2 раза, на основании теорем об умножении и
сложении вероятностей будут соответственно равны:
Po=qq\ Р\=РЯ + ЯР\ |
Рч=РР- |
Таким образом, вероятность Р (т) |
появления события т раз |
(0; 1; 2) в двух испытаниях (п = 2) имеет следующее распределе
ние:
т . . . 0 |
1 |
2 |
Р{т) . . . q2 2pq |
р2 |
Для трех испытаний (п = 3) аналогично получим
т . . . 0 |
1 |
2 |
3 |
Р(т) . . . q3 |
3pq2 |
3p2q |
р 3 |
Полученное распределение вероятностей соответствует распре делению членов бинома
{Р+ Я)2= Р 2+ ‘^РЯ~]гЯ2, (Р+ Я?=Рг+ Зр2я + Зря2Л-ръ-
Полезно заметить, что число случаев появления (и непоявле ния) величины А в каждом распределении равно п + 1. Получен
ную закономерность распределения вероятностей легко распростра нить на какое угодно число повторений опыта. Пусть опыт про изводится п раз. Не обращая внимания на порядок появления
случайных событий, можно ожидать осуществления одного из сле
дующих п+ 1 случаев: |
|
|
||
1) |
непоявление п раз события А ; |
раз события А; |
||
2) |
появление |
(п — 1) |
раз события В и 1 |
|
3) |
появление |
(п — 2) |
раз события В и 2 раза события А; |
|
(т + 1) появление (п — т) раз события |
В и т раз события Л |
|||
и т. д.; |
|
|
|
|
п) |
появление 1 раз события В и (п — 1) раз события Л; |
п + 1) появление п раз события Л.
62
Вероятность первого случая есть qn. Второй случай может про изойти в одном из следующих видов: или при появлении события А
в первом опыте, или во втором, или в третьем, и т. д. до последнего, причем во всех остальных появляется событие В\ вероятности каж дого из этих видов одинаковы и равны qn~ip, а так как количество
этих видов равно п, то вероятность второго случая будет
P2— nqn~ 1p.
В третьем случае вероятность каждого вида равна qn~2p, а чи
сло видов, в которых может осуществиться третий случай, очевидно, равно числу сочетаний из п элементов по 2, т. е.
Г1_п(п —1)
Следовательно, вероятность третьего случая равна
P3=Cnq р .
Подобным же образом найдем вероятности и всех остальных случаев.
В соответствии с изложенным биномиальное распределение, обобщенное на п членов, может быть записано в следующей форме:
|
(ЧЛ-Р)п= q n+ n q " - 'p + |
|
qn~2р 2+ |
|
|
, П(П — 1 ) ( п - 2 ) |
„ я —з„з | |
I П ( п — 1) . . ■ (л — т + 1) |
|||
“ Г |
з , |
Ч Р "т" • • • ~Т~ |
,п \ |
А |
|
|
X q n~mPm+ ■■■+ nqpn~'i-\-pn= \ . |
(2.1) |
|||
Сумма, очевидно, |
равна 1, так как q + р = 1. |
раз, а собы |
|||
Вероятность того, что событие В появится (п — т) |
|||||
тие А появится т раз, будет равна |
|
|
|
||
или |
|
Р{т)— Сп qn~ тр т, |
|
(2.2) |
|
|
|
|
|
|
|
|
Р (т )= п{п- 1) ■■т \П~ т+1) |
Чп~ тРт = . |
|||
|
|
п\ |
|
|
(2.3) |
|
|
т \ (п — т) |
! |
|
|
|
|
|
|
||
т. е. равна |
(п — т)-ному члену, или члену, |
содержащему величину |
рт в разложении бинома (q + p)m. Такое распределение называется
биномиальным.
Полученный вывод, как это непосредственно следует из схемы рассуждений, относится к оценке вероятности прерывных (дис кретных) случайных величин, обозначенных здесь через т.
Общий вид дискретного биномиального распределения при раз личных п и р представлен на рис. 2.1. При р = 0,5 биномиаль ное распределение симметрично. Оно стремится к симметричному
63
с увеличением п и при р ф 0,5, причем достигает этого предела тем быстрее, чем ближе р к значению 0,5. При р <0,5 биномиальное
распределение приобретает левостороннюю (положительную) асим метрию (скошенность), при р >0,5 — правостороннюю (отрицатель
ную) .
Математическое ожидание [Е (т)\ дискретной случайной вели чины т, распределенной по биномиальному закону, равно
т = Е(т) = пр. |
(2 .4) |
Рис. 2.1. Дискретные биномиальные распределения при различных пара |
|
метрах п и р . |
|
а — п — 10, р — 0,8; б — п = 10, р = 0,5; в п ~ 10, |
р — 0,2; г — п — 5, р = 0,2; д — я =20, р = 0,2; |
е — п = 15, |
р —0,2. |
Равенство |
(2.4) |
получается следующим образом. Используя |
||
формулу (2.2), а также выражение (1.3) |
и q = 1 — р, получаем |
|||
тп |
-Е (т) — ^ |
тРп( т ) = 2 |
тС™рт(1—/?)" |
|
|
|
т = 0 |
т = О |
|
|
= |
|
п ! |
|
|
т ! (п — т) ! ■рт(1 - р Т |
|||
При т —0 |
т = 0 |
|
|
|
первое слагаемое равно нулю. Поэтому суммирова |
||||
ние начнем с и = 1. |
Вынося пр за знак суммы, имеем |
|||
|
|
1—1 |
|
|
т = Е ( т ) = п р "V
т=
------ — ^ !------
1
(т — (п — т) Г
1)' ! v ' !
пт-1,
Р т ~ 1( \ - р у -
В последнем равенстве |
произведем замену: ■у = т — 1 и 2 = |
|
= п — 1 ; в результате получаем |
|
|
т — Е ( т )~ пр |
^ |
z ! |
у ! (2 - у ) ! ■р Ч* —р )Z - у |
||
|
у = 0 |
|
64
так как п-— m = z + 1 — (г/+ 1 ) = 2 — у. Вследствие |
того |
что сумма |
в полученном равенстве по соотношению (2 .1 ) |
равна |
единице, |
имеем т = пр.
Выведем формулу для дисперсии случайной дискретной вели чины, распределенной по биномиальному закону
^2 (*у%\ |
S {т — т)2 |
2 т2 + 2 гп2 — 2 2 тт |
__ |
т = °________ __ |
т = 0_____т —0_______ т = 0 |
||
^ ' |
п |
п |
|
п |
2 1П |
1 |
- - 2 |
т2-\-т2 —2т "г=)°— = |
2 пь2 — т2. |
т — 0 |
|
т = 0 |
Математическое ожидание т2равно
п |
п |
п |
Е(т2) = ^ т 2 = 2 |
|
т2Р(т)— 2 т (т — 1 )Я(/и)-{- |
п
2 тР(т),
т — 0 т = 0 m = 0 т = 0
где Р (т) — дискретное биномиальное распределение случайной ве личины т. Вторая сумма в полученном выражении равна матема
тическому ожиданию |
(1.3). |
Первое |
слагаемое можно представить |
|||||
в виде |
|
|
. П |
|
|
|
||
|
П |
|
|
|
|
|
||
|
2 т(т — \)Р{т) = ^ tn (т — 1) С™рт(1 — р)п~ т= |
|||||||
|
т — 0 |
|
|
т — 0 |
|
|
||
|
|
п |
|
|
|
|
|
|
|
= |
2 |
т(т — 1 ) — |
— r r P mi} —p f ~ m. |
||||
|
|
|
4 |
' |
т \ (п — т) { |
^ ' |
||
|
|
т = 0 |
|
|
|
|
|
|
Вынесем за знак суммы п |
(п — 1)р2 и изменим пределы сумми |
|||||||
рования |
|
|
|
|
П |
|
|
|
П |
|
|
|
|
|
|
|
|
^ т { т - \ ) Р { т ) = п { п ~ \ ) р 2 2 |
|
р т - щ - р у - т ш |
||||||
т = 0 |
|
|
|
|
|
т — 2 v |
’ ' ' |
' ' |
Введем новые обозначения: у = т — 2 и z = n — 2, тогда |
||||||||
Л |
|
|
|
|
|
Z |
|
|
2 |
т (т ~ 1 )^ (т )= п(п — \)р 2 ^ |
Су/?У(1 —Р)*~У= п (« — 1 )р 2. |
||||||
m = 0 |
|
|
|
|
|
у = 0 |
|
|
В исходное выражение для дисперсии подставляем полученные |
||||||||
слагаемые |
|
|
|
|
|
|
|
|
а2( т ) = 2 |
т2 —т2=-- 2 |
m (/д — 1)Р(т) + |
^ тР(т) — т2== |
|||||
|
т —0 |
|
|
m =0 |
|
|
|
т =0 |
|
= д (д — 1)р2+ д р —д2р2= д р [р(д —1)+1 — др] = |
|||||||
|
|
= |
я/> (лр —p - f 1 — пр)=пр (1 —P)— npq, |
|||||
5 |
З ак . № 88 |
|
|
|
|
|
|
65 |
|
|
|
|
|
|
|
|
так как
п
^тР(т) = т = пр,
т= О
/га2= л2/»2.
Таким образом, дисперсия случайной величины т, распределен
ной по биномиальному закону, равна
о2( т )= п р (\ —p)=npq. |
(2 .5 ) |
Третий центральный момент для дискретного биномиального распределения приведем без вывода, который можно найти, напри мер, в книге Митропольского [89],
ix3= n p q ( q - p ) . |
(2 .6 ) |
Выразим параметры рассматриваемого распределения через обычно применяемые в гидрологии величины — коэффициенты ва риации и асимметрии. Учитывая выражения (1.22), (1.27), (2.4) — (2 .6 ), получаем:
|
|
СV |
Ьп |
V прч |
|
r__ i / я |
|
(2.7) |
|
|
|
т |
пр |
|
V |
пр |
’ |
||
|
|
|
|
|
|||||
а |
пз |
npq (д — р) |
прд V ( пр)з |
прдп1*р12 |
|||||
|
|
Я |
|
V я3 |
|
|
Я>'< |
||
|
|
|
|
|
|
||||
|
|
|
пр |
|
|
|
|
|
|
|
|
|
=jL$r-=V- |
(пр) 5 |
|
(2.8) |
|||
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Биномиальная схема для дискретного |
распределения величин |
||||||||
может найти применение при решении некоторых |
гидрологических |
||||||||
задач. |
|
|
|
|
В результате наблюдений на |
||||
Рассмотрим следующий пример. |
|||||||||
некоторой |
реке установлено, |
что в течение |
20 |
лет наблюдалось |
|||||
4 случая |
пересыхания реки. |
Требуется |
определить вероятность |
того, что за 20 -летний период будет наблюдаться от 2 до 10 слу
чаев пересыхания.
Для применения биномиального закона в форме (2.2) необхо димо знать величину параметра Р, который в большинстве случнев
гидрологических приложений заранее не известен. Поэтому его определение осуществляется приближенно на основании экспери ментальных данных.
При решении подобных задач в качестве оценки Р используется
отношение
где т — число успешных исходов; п — число всех испытаний.
66
Используя формулу (2.9), имеем
Ошибка в определении Р, рассчитанной по формуле (2.9), тем
больше, чем меньше число испытаний. Пределы возможных коле баний случайной величины (например Р, определенной по случай
ной выборке) оцениваются в статистике с использованием понятия доверительных интервалов, показывающих те пределы, в рамках
которых может изменяться рассматриваемая величина с различной степенью вероятности. Доверительные пределы, обеспеченные на 95 и 99%, для величины Р в случае дискретного биномиального
распределения можно получить, используя зависимости, представ ленные на рис. 2.2 и 2.3. На этих рисунках видно, что для получен ного значения Р = 0,2 при п = 20 доверительные 99%-ные пределы Р
равны 0,02 и 0,39. Очевидно, что при возрастании периода наблю дений (п) доверительные пределы будут сближаться.
По выражению (2.2) рассчитаем вероятности того, что за 20-лет ний период будет последовательно 1 , 2 , ..., 10 случаев с пересыха
нием реки в летний период:
Р20(0)= С и • 0 ,2 ° • 0,82Э= 0 ,0 1 15,
Я20(1)= С ^0 • 0,2' • 0,819=0,0576,
Я20(2)= С 20 • 0 ,22 • 0,818=0,137,
Я20(3)=(^о • 0 ,23 • 0,817=0,2050
Я20(4)=Сго • 0,24 • 0,816=0,2180
Я20(5)= С з0 • 0 ,25 • 0,81S=0,1746
Я20(6 )= С !о • 0 ,26 • 0,814=0,1090,
Я20(7)=С1о • 0,27 • 0,813=0,0540
Я 20( 8 ) = С . 2 о • 0 ,2 8 • 0 ,8 12= 0 , 0 2 2 1
Я20(9)= С |) • 0,29 • 0,8" = 0.0074
Я20(10)=Си ■0,210 • 0,8 10=0,002
Я20(11)=См ■0,2й • 0,89=0,0005
Р20(12 )= С 22 • 0 ,2 12 • 0,88=0,000086.
Биномиальные коэффициенты С™ при малых п могут быть опре
делены достаточно просто из так называемого треугольника Пас каля.
5 * |
6 7 |
п |
|
|
|
Коэффициент С ™ |
|
|
|
||
0 |
|
|
|
|
1 |
1 |
|
|
|
1 |
|
|
|
1 |
1 |
|
|
|
|
2 |
|
|
|
2 |
1 |
1 |
|
|
|
3 |
|
|
1 |
1 |
3 |
3 |
|
|
|
4 |
|
|
4 |
6 |
4 |
1 |
1 |
|
|
5 |
|
1 |
1 |
5 |
10 |
10 |
5 |
|
|
6 |
|
6 |
15 |
20 |
15 |
6 |
7 |
|
|
7 |
1 |
1 |
7 |
21 |
35 |
35 |
21 |
1 |
|
8 |
8 |
28 |
56 |
70 |
56 |
28 |
|
1 |
Рис. 2.2. Доверительные 95%-ные пределы для эмпирической вероятности при биномиальном распределении (по данным, работы [140]).
68
Численные значения коэффициентов каждой последующей гори зонтальной строки в пределах треугольника Паскаля получаются
сложением двух чисел, расположенных |
в предыдущей строке |
справа и слева от этого коэффициента. |
р = 0,2 представлен на |
График распределения при п = 20 и |
рис. 2.1 д: среднее значение случайной величины т в соответствии с формулой (2.4) в рассматриваемом случае равно т = 20-0,2 = 4.
Действительно, при т —4 наблюдается наибольшая вероятность
того, что в 4 случаях из 20 лет будет отмечаться пересыхание реки
Рис. 2.3. Доверительные 99%-ные пределы для эмпирической вероятно- ■сти при биномиальном распределении (по данным работы [140]).
в летний период. Очевидно, что при значениях т меньше и больше
четырех эта вероятность должна быть меньше, что и подтвержда ется результатами расчета.
Рассчитаем параметры данного эмпирического распределения по формулам (2.5) — (2.8): о2= npq = 20 • 0,2 (1 — 0,2) = 3,2,
69