Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии

.pdf
Скачиваний:
66
Добавлен:
22.10.2023
Размер:
14.87 Mб
Скачать

данных вид функции распределения обычно вначале выбирается на основании учета общих положений, в частности соответствия принимаемого закона распределения граничным условиям измене­ ния рассматриваемой гидрологической характеристики. В после­ дующем производится широкая проверка (применительно к усло­ виям различных рек) соответствия принятого закона распределения вероятностей эмпирическому материалу. Эта проверка на на­ чальных этапах использования кривых распределения для расчета гидрологических характеристик выполнялась на основании непо­ средственного сопоставления эмпирических и аналитических кри­ вых обеспеченностей. В последующем были испытаны более объек­ тивные приемы оценок, например статистический критерий %2, кри­

терий Колмогорова—Смирнова и др.

2. После выбора вида функции распределения возникает задача определения числовых значений параметров этой функции, которые рассчитываются по данным наблюдений за той или иной характе­ ристикой стока или какого-либо другого элемента гидрологического режима. Правильный выбор функции распределения и ее числовых параметров, определяемых по эмпирическим данным (среднее арифметическое значение, коэффициенты вариации и асимметрии),

обеспечивает наилучшее, с точки зрения, например,

принципа наи­

меньших квадратов, сглаживание

эмпирического

распределения.

3. Учитывая

возможные погрешности определения параметров

распределения,

обусловленные

ограниченностью

используемых

в расчете выборок, важно количественно оценить эти погрешности. Такая оценка осуществляется либо с использованием теоретиче­ ских формул, выведенных при некоторых ограничениях, либо с при­ менением метода статистических испытаний.

§ 2

дискретное биномиальное распределение

В практике гидрологических расчетов наибольшее распростра­ нение получила кривая Пирсона III типа, представляющая собой обобщение дискретного биномиального распределения для случая непрерывных случайных величин. Биномиальный закон распреде­ ления соответствует повторению при постоянных условиях одного и того же испытания, имеющего лишь два исхода: появление (веро­ ятность р) или непоявление (вероятность q 1— р) случайного со­

бытия. Каждое значение случайной величины, распределенной по биномиальному закону, представляет собой число случаев (т) осу­ ществления некоторого случайного события из п возможных слу­

чаев.

Изложение схемы биномиального распределения может быть осуществлено с учетом теорем сложения и умножения вероятно­ стей.

60

По теореме сложения вероятностей следует, что вероятность появления одного из несовместимых событий без указания, какого именно, равна сумме вероятностей этих событий, или иначе, если случайное событие А может появиться в нескольких видах — Ль Л2, А3, ..., А п, имеющих разные вероятности — pi, р2, ..., р„, то ве­ роятность появления величины Л в видах Ль Лг, Аз, ..., Ль (k<n)

будет равна сумме вероятностей событий Ль Л2, ..., Л&, т. е.

Р —Р\Л~Р2-\~ • ■■-\~Pk-

Эту теорему иногда записывают в виде

Р(А w В w . . . w К )= р (А )+ р (В) + . . . + / » (К),

где обозначение w соответствует слову «или», а события А, В, ..., К

несовместимы.

По теореме умножения вероятностей следует, что вероятность совпадения нескольких независимых случайных событий равна произведению их вероятностей.

Под независимыми случайными событиями будем понимать та­ кие, при которых исход того или иного испытания не зависит от пре­ дыдущих и, следовательно, следующее испытание не может быть предсказано на основании реализации предыдущих испытаний.

Теорема умножения вероятностей обычно записывается в виде

Р(АВ . . . К )= р{А )р(В ) . . . р(К).

При этом также предполагается, что события А, В, ..., К неза­

висимы между собой.

В соответствии с указанным выше биномиальное распределение получается при решении следующей задачи.

Производится п независимых испытаний, в результате которых

событие может принимать положительные значения 0, 1, 2,

..., п

с вероятностями ро,

ри рг, ■■.,

рп.

Вероятность

появления

собы­

тия Л одна и та же

и равна р,

а

вероятность

противоположного

события В (непоявление Л) равна q. Требуется определить вероят­ ность Рт появления события Л т раз при п испытаниях.

В технических приложениях под событием Л часто понимают, например, количество годных изделий в некотором объеме совокуп­ ности, а противоположное событие показывает количество изделий с браком. Имеются попытки [58] рассматривать статистические совокупности величин стока с позиций биномиального закона рас­ пределения. В этом случае за событие Л принимались дождливые периоды, в течение которых может формироваться сток, а в каче­ стве противоположного события — бездождные периоды. При этом считалось, что наступление дождливого и бездождного периодов является событием независимым, и, следовательно, вероятность наступления дождливого периода (р) и вероятность наступления бездождного периода (q) остаются постоянными во всех испыта­

ниях. В классических построениях теории вероятностей в качестве модели биномиального распределения обычно рассматривается схема извлечения (с последующим возвращением) шаров из урны,

61

содержащей р черных и q белых шаров. Очевидно, что все эти при­

меры сводятся к единому математическому построению. В силу этого рассмотрим вывод биномиального закона распределения в об­ щей постановке задачи.

В случае если при осуществлении опыта должно появиться одно из двух событий А или В, имеющих вероятности р и q, то сумма их вероятностей p + q = \, так как достоверно известно, что либо А , либо В в каждом опыте осуществимы.

Рассмотрим последовательно случаи с 2, 3 и 4 испытаниями, которые затем обобщим на случай п испытаний. Если вероятность события при одном испытании равна р, то вероятности того, что при двух испытаниях событие А может произойти 0 раз (т. е. не произойдет ни разу событие А, а произойдет в обоих испытаниях событие В) или 1 и 2 раза, на основании теорем об умножении и

сложении вероятностей будут соответственно равны:

Po=qq\ Р\=РЯ + ЯР\

Рч=РР-

Таким образом, вероятность Р (т)

появления события т раз

(0; 1; 2) в двух испытаниях (п = 2) имеет следующее распределе­

ние:

т . . . 0

1

2

Р{т) . . . q2 2pq

р2

Для трех испытаний (п = 3) аналогично получим

т . . . 0

1

2

3

Р(т) . . . q3

3pq2

3p2q

р 3

Полученное распределение вероятностей соответствует распре­ делению членов бинома

{Р+ Я)2= Р 2+ ‘^РЯ~]гЯ2, (Р+ Я?=Рг+ Зр2я + Зря2Л-ръ-

Полезно заметить, что число случаев появления (и непоявле­ ния) величины А в каждом распределении равно п + 1. Получен­

ную закономерность распределения вероятностей легко распростра­ нить на какое угодно число повторений опыта. Пусть опыт про­ изводится п раз. Не обращая внимания на порядок появления

случайных событий, можно ожидать осуществления одного из сле­

дующих п+ 1 случаев:

 

 

1)

непоявление п раз события А ;

раз события А;

2)

появление

(п — 1)

раз события В и 1

3)

появление

(п — 2)

раз события В и 2 раза события А;

(т + 1) появление (п т) раз события

В и т раз события Л

и т. д.;

 

 

 

 

п)

появление 1 раз события В и (п — 1) раз события Л;

п + 1) появление п раз события Л.

62

Вероятность первого случая есть qn. Второй случай может про­ изойти в одном из следующих видов: или при появлении события А

в первом опыте, или во втором, или в третьем, и т. д. до последнего, причем во всех остальных появляется событие В\ вероятности каж­ дого из этих видов одинаковы и равны qn~ip, а так как количество

этих видов равно п, то вероятность второго случая будет

P2— nqn~ 1p.

В третьем случае вероятность каждого вида равна qn~2p, а чи­

сло видов, в которых может осуществиться третий случай, очевидно, равно числу сочетаний из п элементов по 2, т. е.

Г1_п(п —1)

Следовательно, вероятность третьего случая равна

P3=Cnq р .

Подобным же образом найдем вероятности и всех остальных случаев.

В соответствии с изложенным биномиальное распределение, обобщенное на п членов, может быть записано в следующей форме:

 

(ЧЛ-Р)п= q n+ n q " - 'p +

 

qn~2р 2+

 

, П(П — 1 ) ( п - 2 )

„ я —з„з |

I П ( п — 1) . . ■ (л — т + 1)

“ Г

з ,

Ч Р "т" • • • ~Т~

,п \

А

 

X q n~mPm+ ■■■+ nqpn~'i-\-pn= \ .

(2.1)

Сумма, очевидно,

равна 1, так как q + р = 1.

раз, а собы­

Вероятность того, что событие В появится (п т)

тие А появится т раз, будет равна

 

 

 

или

 

Р{т)— Сп qn~ тр т,

 

(2.2)

 

 

 

 

 

 

Р (т )= п{п- 1) ■■т \П~ т+1)

Чп~ тРт = .

 

 

п\

 

 

(2.3)

 

 

т \ (п т)

!

 

 

 

 

 

т. е. равна

(п — т)-ному члену, или члену,

содержащему величину

рт в разложении бинома (q + p)m. Такое распределение называется

биномиальным.

Полученный вывод, как это непосредственно следует из схемы рассуждений, относится к оценке вероятности прерывных (дис­ кретных) случайных величин, обозначенных здесь через т.

Общий вид дискретного биномиального распределения при раз­ личных п и р представлен на рис. 2.1. При р = 0,5 биномиаль­ ное распределение симметрично. Оно стремится к симметричному

63

с увеличением п и при р ф 0,5, причем достигает этого предела тем быстрее, чем ближе р к значению 0,5. При р <0,5 биномиальное

распределение приобретает левостороннюю (положительную) асим­ метрию (скошенность), при р >0,5 — правостороннюю (отрицатель­

ную) .

Математическое ожидание (т)\ дискретной случайной вели­ чины т, распределенной по биномиальному закону, равно

т = Е(т) = пр.

(2 .4)

Рис. 2.1. Дискретные биномиальные распределения при различных пара­

метрах п и р .

а п — 10, р — 0,8; б п = 10, р = 0,5; в п ~ 10,

р — 0,2; г п — 5, р = 0,2; д — я =20, р = 0,2;

е п = 15,

р —0,2.

Равенство

(2.4)

получается следующим образом. Используя

формулу (2.2), а также выражение (1.3)

и q = 1 — р, получаем

тп

-Е (т) — ^

тРп( т ) = 2

тС™рт(1—/?)"

 

 

т = 0

т = О

 

 

=

 

п !

 

 

т ! (п — т) ! ■рт(1 - р Т

При т 0

т = 0

 

 

первое слагаемое равно нулю. Поэтому суммирова­

ние начнем с и = 1.

Вынося пр за знак суммы, имеем

 

 

11

 

 

т = Е ( т ) = п р "V

т=

------ — ^ !------

1

(т — (п — т) Г

1)' ! v ' !

пт-1,

Р т ~ 1( \ - р у -

В последнем равенстве

произведем замену: ■у = т — 1 и 2 =

= п 1 ; в результате получаем

 

т — Е ( т )~ пр

^

z !

у ! (2 - у ) ! р Ч* р )Z - у

 

у = 0

 

64

так как п-m = z + 1 — (г/+ 1 ) = 2 у. Вследствие

того

что сумма

в полученном равенстве по соотношению (2 .1 )

равна

единице,

имеем т = пр.

Выведем формулу для дисперсии случайной дискретной вели­ чины, распределенной по биномиальному закону

^2 (*у%\

S {т — т)2

2 т2 + 2 гп2 — 2 2 тт

__

т = °________ __

т = 0_____т 0_______ т = 0

^ '

п

п

 

п

2

1

- - 2

т2-\-т2 —2т "г=)°— =

2 пь2 — т2.

т — 0

 

т = 0

Математическое ожидание т2равно

п

п

п

Е(т2) = ^ т 2 = 2

 

т2Р(т)— 2 т (т — 1 )Я(/и)-{-

п

2 тР(т),

т — 0 т = 0 m = 0 т = 0

где Р (т) — дискретное биномиальное распределение случайной ве­ личины т. Вторая сумма в полученном выражении равна матема­

тическому ожиданию

(1.3).

Первое

слагаемое можно представить

в виде

 

 

. П

 

 

 

 

П

 

 

 

 

 

 

2 т(т — \)Р{т) = ^ tn (т — 1) С™рт(1 — р)п~ т=

 

т — 0

 

 

т — 0

 

 

 

 

п

 

 

 

 

 

 

 

=

2

т(т — 1 ) —

r r P mi} —p f ~ m.

 

 

 

4

'

т \ (п — т) {

^ '

 

 

т = 0

 

 

 

 

 

Вынесем за знак суммы п

(п — 1)р2 и изменим пределы сумми­

рования

 

 

 

 

П

 

 

П

 

 

 

 

 

 

 

^ т { т - \ ) Р { т ) = п { п ~ \ ) р 2 2

 

р т - щ - р у - т ш

т = 0

 

 

 

 

 

т — 2 v

' '

' '

Введем новые обозначения: у = т — 2 и z = n — 2, тогда

Л

 

 

 

 

 

Z

 

 

2

т (т ~ 1 )^ (т )= п(п — \)р 2 ^

Су/?У(1 —Р)*~У= п (« — 1 )р 2.

m = 0

 

 

 

 

 

у = 0

 

 

В исходное выражение для дисперсии подставляем полученные

слагаемые

 

 

 

 

 

 

 

а2( т ) = 2

т2 —т2=-- 2

m (/д — 1)Р(т) +

^ тР(т) — т2==

 

т —0

 

 

m =0

 

 

 

т =0

 

= д (д — 1)р2+ д р —д2р2= д р [р(д —1)+1 — др] =

 

 

=

я/> (лр —p - f 1 — пр)=пр (1 —P)— npq,

5

З ак . № 88

 

 

 

 

 

 

65

 

 

 

 

 

 

 

 

так как

п

^тР(т) = т = пр,

т= О

/га2= л2/»2.

Таким образом, дисперсия случайной величины т, распределен­

ной по биномиальному закону, равна

о2( т )= п р (\ —p)=npq.

(2 .5 )

Третий центральный момент для дискретного биномиального распределения приведем без вывода, который можно найти, напри­ мер, в книге Митропольского [89],

ix3= n p q ( q - p ) .

(2 .6 )

Выразим параметры рассматриваемого распределения через обычно применяемые в гидрологии величины — коэффициенты ва­ риации и асимметрии. Учитывая выражения (1.22), (1.27), (2.4) — (2 .6 ), получаем:

 

 

СV

Ьп

V прч

 

r__ i / я

 

(2.7)

 

 

т

пр

 

V

пр

 

 

 

 

 

а

пз

npq (д р)

прд V ( пр

прдп1*р12

 

 

Я

 

V я3

 

 

Я>'<

 

 

 

 

 

 

 

 

 

пр

 

 

 

 

 

 

 

 

 

=jL$r-=V-

(пр) 5

 

(2.8)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Биномиальная схема для дискретного

распределения величин

может найти применение при решении некоторых

гидрологических

задач.

 

 

 

 

В результате наблюдений на

Рассмотрим следующий пример.

некоторой

реке установлено,

что в течение

20

лет наблюдалось

4 случая

пересыхания реки.

Требуется

определить вероятность

того, что за 20 -летний период будет наблюдаться от 2 до 10 слу­

чаев пересыхания.

Для применения биномиального закона в форме (2.2) необхо­ димо знать величину параметра Р, который в большинстве случнев

гидрологических приложений заранее не известен. Поэтому его определение осуществляется приближенно на основании экспери­ ментальных данных.

При решении подобных задач в качестве оценки Р используется

отношение

где т — число успешных исходов; п — число всех испытаний.

66

Используя формулу (2.9), имеем

Ошибка в определении Р, рассчитанной по формуле (2.9), тем

больше, чем меньше число испытаний. Пределы возможных коле­ баний случайной величины (например Р, определенной по случай­

ной выборке) оцениваются в статистике с использованием понятия доверительных интервалов, показывающих те пределы, в рамках

которых может изменяться рассматриваемая величина с различной степенью вероятности. Доверительные пределы, обеспеченные на 95 и 99%, для величины Р в случае дискретного биномиального

распределения можно получить, используя зависимости, представ­ ленные на рис. 2.2 и 2.3. На этих рисунках видно, что для получен­ ного значения Р = 0,2 при п = 20 доверительные 99%-ные пределы Р

равны 0,02 и 0,39. Очевидно, что при возрастании периода наблю­ дений (п) доверительные пределы будут сближаться.

По выражению (2.2) рассчитаем вероятности того, что за 20-лет­ ний период будет последовательно 1 , 2 , ..., 10 случаев с пересыха­

нием реки в летний период:

Р20(0)= С и • 0 ,2 ° • 0,82Э= 0 ,0 1 15,

Я20(1)= С ^0 • 0,2' • 0,819=0,0576,

Я20(2)= С 20 0 ,22 • 0,818=0,137,

Я20(3)=(^о • 0 ,23 • 0,817=0,2050

Я20(4)=Сго • 0,24 • 0,816=0,2180

Я20(5)= С з0 0 ,25 • 0,81S=0,1746

Я20(6 )= С !о 0 ,26 • 0,814=0,1090,

Я20(7)=С1о • 0,27 • 0,813=0,0540

Я 20( 8 ) = С . 2 о • 0 ,2 8 • 0 ,8 12= 0 , 0 2 2 1

Я20(9)= С |) • 0,29 • 0,8" = 0.0074

Я20(10)=Си ■0,210 • 0,8 10=0,002

Я20(11)=См ■0,2й • 0,89=0,0005

Р20(12 )= С 22 0 ,2 12 • 0,88=0,000086.

Биномиальные коэффициенты С™ при малых п могут быть опре­

делены достаточно просто из так называемого треугольника Пас­ каля.

5 *

6 7

п

 

 

 

Коэффициент С ™

 

 

 

0

 

 

 

 

1

1

 

 

 

1

 

 

 

1

1

 

 

 

2

 

 

 

2

1

1

 

 

3

 

 

1

1

3

3

 

 

4

 

 

4

6

4

1

1

 

5

 

1

1

5

10

10

5

 

6

 

6

15

20

15

6

7

 

7

1

1

7

21

35

35

21

1

8

8

28

56

70

56

28

 

1

Рис. 2.2. Доверительные 95%-ные пределы для эмпирической вероятности при биномиальном распределении (по данным, работы [140]).

68

Численные значения коэффициентов каждой последующей гори­ зонтальной строки в пределах треугольника Паскаля получаются

сложением двух чисел, расположенных

в предыдущей строке

справа и слева от этого коэффициента.

р = 0,2 представлен на

График распределения при п = 20 и

рис. 2.1 д: среднее значение случайной величины т в соответствии с формулой (2.4) в рассматриваемом случае равно т = 20-0,2 = 4.

Действительно, при т 4 наблюдается наибольшая вероятность

того, что в 4 случаях из 20 лет будет отмечаться пересыхание реки

Рис. 2.3. Доверительные 99%-ные пределы для эмпирической вероятно- ■сти при биномиальном распределении (по данным работы [140]).

в летний период. Очевидно, что при значениях т меньше и больше

четырех эта вероятность должна быть меньше, что и подтвержда­ ется результатами расчета.

Рассчитаем параметры данного эмпирического распределения по формулам (2.5) — (2.8): о2= npq = 20 • 0,2 (1 — 0,2) = 3,2,

69

Соседние файлы в папке книги из ГПНТБ