
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfа =]/"3,2 =1,789,
1,789
СVm. 4 =0,447,
\i.z= npq (q —/?)=20 • 0,2 • 0,8 (0,8 — 0,2)= 1,92,
С, |
Н-з |
092 |
=0,335. |
аЗ |
(1,789)3 |
В гидрологических расчетах часто требуется определять вероят ность появления не более г успешных исходов в п независимых
т
Рис. 2.4. Биномиальная кривая обеспеченности распреде ления числа случаев пересыхания реки. п = 20, р = 0,2.
/ —биномиальная непрерывная кривая обеспеченности, 2—диск
ретное биномиальное распределение (точки отнесены к середине интервала).
испытаниях. Эта вероятность определяется по интегральной функ ции биномиального дискретного распределения
Г
Я(М< г ) = 2 С У Г ” |
(2 .10) |
|
|
т = 0 |
|
Суммирование в данном |
случае осуществляется |
на значения |
т = 0, 1, 2, ..., г. При т ^ О |
Р ( т ^ г ) = 0; при m ^ r |
Р (m ^ r )^ l. |
Допустим, что необходимо определить вероятности того, что за 20 лет наблюдений за речным стоком произойдет не более 5 случаев пересыхания реки. Имеем: п = 20; р = 0,2; г = Ъ. Используя выраже ние (2 .10 ) и очевидное равенство р —1 — q, получаем
5
Р ( т < 5 ) = 2 См0,2т (1 - 0 , 2)20_ т = 0 ,012 + 0,058+0,140+
т =0
+0,205+0,218+0,175=0,808.
70
Обычно в гидрологических расчетах используется вероятность превышения заданного числа г. В этом случае имеем
Я [ т > ( г + 1 )] = 1 -Я (/ге < г ), |
(2 .1 1 ) |
|
поскольку |
|
|
Р(т г)-}-Р \т |
1 )] = 1 . |
|
Используя формулу (2.11), рассчитаем вероятность того, что за |
||
20-летний период произойдет более |
6 случаев |
пересыхания реки |
Р ( ю > 6)= 1 -0,808= 0,192 .
Интегральная функция распределения числа случаев превыше ния пересыхания реки при п = 20, р = 0,2 и г = 1 -М 0 изображена на
рис. 2.4.
Дискретное биномиальное распределение может найти примене ние в гидрологических расчетах и при решении других аналогичных задач. Наибольшее же применение в гидрологических расчетах по лучило биномиальное распределение непрерывных случайных вели чин, рассматриваемое в § 4 настоящей главы. При решении неко торых задач гидрологических расчетов используется закон распре деления Пуассона, описывающий также распределение дискретных случайных величин.
§ 3
закон распределения Пуассона
Распределение Пуассона вытекает из дискретного биномиаль ного распределения при п-*-оо и когда пр = К сохраняет постоян
ное конечное значение.
Можно отметить, что если в биномиальном дискретном распре делении вероятность Рт, определяемая по выражению (2.2), не
имеет значений, близких к 0 и 1, то в распределении Пуассона ве роятность Я-к 0.
Распределение Пуассона имеет вид
/("*> |
(2 .1 2 ) |
Следовательно, данное распределение имеет лишь |
один пара |
метр л, определяемый по экспериментальным данным.
Вывод закона распределения Пуассона осуществим, опираясь на биномиальное дискретное распределение.
В соответствии с выражением (2.3) биномиальное дискретное распределение имеет вид
/( т , п, р )= С тпр т( \ - р ) п- т =
п ( п - \ ) ( п - 2 ) . . ( п ~ т \ 1)
71
Умножим числитель и знаменатель на пт и произведем замену переменных по равенству пр = Х
/О », л, Р ) = |
п ( п — \ ) ( п — 2) . . . ( n - m - t - 1 ) |
Хт (1 |
—р)п~ т. |
||
птш! |
|
||||
Разделив числитель на пт, получим |
т —1 \ \т (1 ~ Р )П |
||||
f(m , п, р )= {\ |
- 4 " ) (l - 4 ) ■ • • ( ! - |
||||
п ) т ! |
(1 - Р ) т • |
(2.13)
Рассмотрим по частям предельные выражения полученного ра венства. Произведем преобразование
1■-пр 1'
(1 -/> )» = .(1-/>Г |
= |
.(1 - Р ) ~ Т . |
и перейдем к пределу при р ■ |
JJ-X |
|
|
-X |
|
lim О -/» ) |
р |
|
|
|
р -*■ О
Наконец, рассмотрим предел выражения при п->оо и р-*-0 /л — 1
lim = |
п |
= 1. |
|
(1 - р ) я |
|||
П -*■ СО |
|
Р - * о
Подставляя предельные значения в формулу (2.13), оконча тельно получим распределение Пуассона (2.12), представляющее собой предельную форму биномиального дискретного распределе ния с параметром К = пр при р ->-0 и м->- оо.
Выведем выражения для математического ожидания, диспер сии и третьего центрального момента случайной величины, рас пределенной по закону Пуассона. При этом используем фактори альные моменты. Факториальный момент г порядка случайной ве личины т от т = 1 до т = п представляет собой выражение
П
2т ( т — 1) . . . (tn — r - f-1).
т=1
Найдем факториальные моменты для закона распределения Пуассона
оо
Л = 2 4 т е~}' т ( т — \ ) ( т — 2) . . . ( т — r + 1).
т= 1
Представляя Хт — Хт~гХг и вынося за знак суммирования постоян ную ХТ, раскрывая факториал ml и произведя при этом необходи
мые сокращения, а также изменяя пределы суммирования, полу чаем
f |
V *т - г« -Л |
Хт. |
(2.14) |
|
Jr |
Л — |
(ш - г) ! |
||
|
m —г |
|
|
|
7 2
Учтем, что целая положительная степень любого числа может быть представлена в виде
Г
|
|
|
|
Cr= ^ A |
riC‘, |
|
|
(2.15) |
||
|
|
|
|
|
i = l |
|
|
|
|
|
где Ari — числа Стирлинга, |
определяемые |
по рекуррентной фор |
||||||||
муле |
|
|
|
|
|
|
|
|
|
|
|
|
|
A ri = i A T_ \t i-{-Ar_ii /_i |
|
(2.16) |
|||||
с начальными значениями А 1, i = |
l и Ait2= 0. |
Нам потребуются лишь |
||||||||
значения чисел Стирлинга, представленные в табл. 2.1. |
|
|
||||||||
Выразим |
начальные |
моменты |
|
Т а б л и ц а |
2.1 |
|
||||
распределения |
Пуассона, |
используя |
|
|
||||||
зависимости (2.14) |
и (2.15), |
|
|
|
Числа Стирлинга |
|
||||
|
|
|
Ari)J. (2.17) |
г |
|
i |
|
|||
|
|
|
|
|
|
|||||
|
( = 1 |
|
г = 1 |
|
|
|
|
2 |
3 |
|
|
|
|
|
|
|
|
||||
Учтя |
соотношения |
(2.16) |
и* |
|
|
|
||||
(2.17), получаем следующие выра |
1 |
1 |
|
|
||||||
жения для первых |
трех |
начальных |
2 |
1 |
1 |
|
||||
моментов |
распределения |
Пуассона: |
3 |
1 |
3 |
1 |
||||
при г= 1 |
|
|
|
г —1 |
|
|
|
|
|
|
|
|
|
|
.= |
|
|
|
|
|
|
|
|
|
/ |
V |
л ы>-‘= ^ |
|
|
|
||
|
|
|
1= |
2 |
|
|
|
/=1
при г —2
г=2
/2= Л 2гАг=А -|-^I2,
/=1
при г= 3
г = 3
/ з = 2 Л згА '= А + З А 2+ А 3.
I =1
Численные значения коэффициентов Ан взяты из табл. 2 .1 .
Моменты выше третьего порядка в гидрологических расчетах не используются и поэтому здесь не рассматриваются.
По формулам (1.38), выражающим центральные моменты р через начальные (fr), получим:
14=0,
р.2= А + ) 2 — А2= А ,
р3==А+ЗА2+А 3-3(А + А 2)А+2(А)3=А+ЗА 2+А 3-ЗА 2-ЗА 3-}-2А3=А.
Приведенный анализ показывает, что первый начальный момент,
или среднее арифметическое значение (т), второй центральный
73
момент, или дисперсия о2 , и третий центральный момент (рз)
в распределении Пуассона равны
m=Om=|x3=A. (2.18)
Переходя к обычным для гидрологов параметрам, получаем:
С, |
о |
2 |
т
С. |
2 |
|
А3/ |
||
|
или
Cs= C v= l 2 и т=1.
Следовательно, если ряд дискретной случайной величины т ха
рактеризуется равенством т ~ а 2 ~рз~Я , то это дает основание по
лагать, что случайная величина т распределена по закону Пуас
сона.
Полезно заметить, что приближенность равенства среднего арифметического (т), дисперсии (сг2т) и третьего центрального мо
мента (цз) указывает на возможность случайных колебаний выбо рочных значений этих параметров по отношению к величинам, свойственным генеральной совокупности.
Приведенное соотношение между указанными параметрами применительно к статистическим совокупностям гидрологических величин наблюдается сравнительно редко и поэтому рассматривае мое распределение не получило в гидрологии широкого примене ния. Тем не менее в некоторых, как, например, в приведенных ниже случаях использование его может оказаться целесообразным.
Предварительно рассмотрим в порядке сопоставления дискрет ное биномиальное распределение и распределение Пуассона.
Указанное сопоставление произведем при следующих значениях
параметров |
распределения |
Пуассона: |
1) |
Я= 5,0; |
2) Я=Л,0; |
||||
3) Я = 0,1. Соответственно |
(имея в виду, |
что |
Я= пр) |
для |
условия |
||||
Я = 5,0 примем следующие параметры |
дискретного биномиального |
||||||||
распределения: 1а) р = 0,20, |
п = 25; |
16) |
р = 0,1, л = 50. Для усло |
||||||
вия Я = 1,0: |
2а) р = 0,2, |
п = 5; |
26) |
р = 0,1, |
п= 10; |
2в) |
р = 0,05, |
||
л = 20; 2г) |
р = 0,02, л = 50; |
За) |
р = 0,020, |
л= 5; 36) р = 0,01, л=10; |
|||||
Зв) р = 0,005, л = 20. |
|
|
|
|
|
и представленные на |
|||
Результаты расчетов, сведенные в табл. 2.2 |
рис. 2.5, показывают, что с увеличением л и уменьшением р рас
пределение Пуассона приближается к биномиальному. Этот вы вод не является неожиданным, поскольку из общего анализа
74
Таблица 2.2
авнение интегрального биномиального закона распределения с законом Пуассона (вероятности превышения т
выражены в л/и)
|
Бином и альное |
Р а с п р е д е |
|
|
|
|
Р а с п р е д е |
|
|
|
|
Р ас п р е д е |
|
|
лен и е |
|
Бином и альное |
р асп р ед ел ен и е |
|
л ен и е |
Бином иальное |
расп ределен и е |
лени е |
||||
|
р ас п р ед ел ен и е |
|
|
||||||||||
|
П уассон а |
|
|
|
|
П у ассо н а |
|
|
|
|
П уассон а |
||
т |
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/;= 0 ,2 , |
/7 = 0,1, |
|
р —0,2, |
/7 = 0,1, |
/7 = 0,05, |
/7 = 0,02, |
|
/7 = 0,02, |
/7 = |
0,01, |
р = 0,005, |
X — 0,1 |
|
л = 25 |
л = 5 0 |
|
л = 5 |
л = 10 |
л = 20 |
л = 50 |
|
л = 5 |
л = 10 |
л = 20 |
||
|
|
|
|
||||||||||
О |
99,62 |
99,48 |
99,33 |
67,23 |
65,13 |
64,15 |
63,58 |
63,21 |
9,61 |
9,56 |
9,54 |
9,5 2 |
|
1 |
97,26 |
96,62 |
95,96 |
26,27 |
26,39 |
26,4 |
26,42 |
26,42 |
0,38 |
0,43 |
0,45 |
0 ,4 7 |
|
2 |
90,18 |
88,83 |
87,54 |
5,79 |
7,02 |
7,55 |
7,84 |
8,03 |
0,01 |
0,01 |
0,01 |
0,0 2 |
|
3 |
76,6 |
74,97 |
73,5 |
0,67 |
1,28 |
1,59 |
1,78 |
1,90 |
|
|
|
|
|
4 |
57,93 |
56,88 |
55,95 |
0,03 |
0,16 |
0,26 |
0,32 |
0,37 |
|
|
|
|
|
5 |
38,33 |
38,39 |
38,40 |
|
0,01 |
0,03 |
0,05 |
0,06 |
|
|
|
|
|
6 |
22,0 |
22,98 |
23,78 |
|
|
|
0,01 |
0,01 |
|
|
|
|
|
7 |
10,91 |
12,0 |
13,34 |
|
|
|
|
|
|
|
|
|
|
8 |
4,68 |
5,79 |
6,81 |
|
|
|
|
|
|
|
|
|
|
9 |
1,73 |
2,45 |
3,18 |
|
|
|
|
|
|
|
|
|
|
10 |
0,56 |
0,94 |
1,37 |
|
|
|
|
|
|
|
|
|
|
И |
0,15 |
0,32 |
0,55 |
|
|
|
|
|
|
|
|
|
|
12 |
0,04 |
0,1 0 |
0,21 |
|
|
|
|
|
|
|
|
|
|
13 |
0,01 |
0,03 |
0,08 |
|
|
|
|
|
|
|
|
|
|
14 |
|
0,01 |
0,03 |
|
|
|
|
|
|
|
|
|
|
распределения Пуассона следует, что оно представляет собой пре дельную форму биномиального закона при п —>- оо и р->- 0.
Выводы, полученные по данным табл. 2.2, более важны в том отношении, что они позволяют оценить объемы выборок, при кото рых различия в рассматриваемых схемах распределения случайных величин практически можно считать несущественными. Расчеты по казывают, что распределение Пуассона дает хорошее приближение к биномиальному даже при сравнительно малых объемах выборки ( п > 10 ), особенно с уменьшением параметра К.
т
Рис. 2.5. Сравнение биномиального интегрального закона распределения с законом Пуассона.
/ —биномиальное распределение р=0,2, п=25; 2—биномиальное распределение р—0,1, /2=50; 3—распределение Пуассона Л=5.
Указанный вывод важен с точки зрения возможности примене ния рассматриваемого закона распределения при решении гидроло гических задач, поскольку используемые в этом случае объемы со вокупностей обычно ограничены несколькими десятками членов.
Практический смысл использования закона Пуассона заключа ется в существенном упрощении расчетов по сравнению с дискрет ным биномиальным распределением. Кроме того, при некоторых значениях параметров п и р расчеты по биномиальному распреде лению оказываются затруднительными ввиду недостаточной точ ности пятизначных таблиц логарифмов. Из того условия, что закон Пуассона возникает при р-*~ 0, следует, что он применим для вы
равнивания наблюденных распределений, редких событий, напри мер, маловодных или многоводных периодов значительной продол жительности, гроз в зимний сезон и т. д. В силу указанного свой ства распределение Пуассона часто называют законом редких явлений.
76
Применение закона Пуассона рассмотрим на примере оценки повторяемости группировок маловодных и многоводных периодов некоторых рек СССР. Основные исходные данные приведены в табл. 2.3.
Т а б л и ц а 2.3
Сведения о наибольшей продолжительности маловодного периода и числе лет наблюдений на некоторых реках СССР
Река
Волга
Унжа
Белая
|
Пункт |
Наибольшая продолжи |
Число лет наблю |
|
тельность маловодного |
дений |
|
|
|
периода (лет) |
|
|
|
|
|
г. |
Ярославль |
и |
79 |
г. |
Макарьев |
15 |
68 |
г. |
Уфа |
11 |
85 |
Учитывая, что продолжительные периоды пониженной или по вышенной водности рек — явление очень редкое, и предполагая, что стохастической связи между величинами годового стока нет, можно воспользоваться законом распределения Пуассона в виде
= |
(2.19) |
для выяснения вероятности P(R = v) встретить число группиро
вок (v) пониженной или повышенной водности продолжитель ностью не менее k лет.
Параметр распределения К представляет |
собой в данном слу |
чае среднее значение числа маловодных или многоводных периодов |
|
продолжительностью не менее k лет в ряду, |
включающем наблюде |
ния за п лет.
Применительно к рассматриваемой задаче параметр распреде ления Пуассона может быть рассчитан по приближенной формуле
вывод которой основан на теории комбинаторики. Несколько по дробнее вопрос о группировках маловодных и многоводных лет рассмотрен в главе IV. Здесь же лишь отметим, что эта зависи мость с точностью, достаточной для решения практических задач, определяет среднее число группировок продолжительностью не ме нее k лет в выборках случайных независимых величин.
Используя выражения (2.19) и (2.20), легко можно подсчитать вероятность встретить в п наблюдениях число группировок (v) продолжительностью k лет и более. При этом имеется в виду, что k достаточно велико и, следовательно, наблюденная группировка,
допустим, маловодных лет — явление достаточно редкое, а соот ветственно вероятность появления такой группировки мала. Здесь, как и ранее, предполагается отсутствие связи в последовательности годовых объемов речного стока.
7 7
Определим, с какой вероятностью можно ожидать появление двух группировок маловодных периодов продолжительностью каж дого не менее 7 лет в выборке, включающей 85 лет наблюдений
(р. Белая — г. |
Уфа). Следовательно, имеем п —85, v = 2, k = 7; по |
||||
формуле (2.17) |
получаем |
|
|
|
|
|
X |
85 |
85 |
0,332. |
|
|
2 7 + 1 |
256 |
|||
|
|
|
|||
В этом случае искомая вероятность |
по формуле (2.19) равна |
||||
|
P ( R i = 2) |
0,3322 |
е |
- 0 , 3 3 2 |
0,04 « 4 % . |
|
2 ! |
|
Фактически по данным наблюдений за годовым стоком р. Белой у г. Уфы наблюдалась лишь одна группировка маловодных лет про должительностью 7 лет.
Подсчитаем, какова вероятность появления одной группировки маловодных периодов длительностью 7 лет и более в выборке объ ема 85 лет. По формуле (2.19) получаем
Д(Я7==1 ) = - ° ^ - <Г0-332 » 0,24 « 24°/0.
Как видим, вероятность этого события уже достаточно велика. Фактически за 85 лет наблюдалось две группировки маловодных лет продолжительностью 7 лет и более.
Техника вычислений значительно упростится, если использовать таблицы распределения Пуассона для X от 0,1 до 5,0 с интервалом 0,1, для X от 6 до 15 с интервалом 1,0 и, наконец, для X от 20 до 100
с интервалом 10,0 [89]. |
|
маловодных или |
Вероятность появления хотя бы одной серии |
||
многоводных периодов продолжительностью, |
не |
меньшей k лет, |
можно определить по формуле |
|
|
P(/?ft> l ) = l - P ( / ? ft= 0 ) = l -----^ < г х = |
1 - е |
(2.21) |
где 0 ! = 1 . |
|
|
Используя зависимость (2.21), рассчитаем теоретическую веро ятность появления указанных в табл. 2.3 группировок маловод ных лет.
Для маловодной группировки длительностью И лет для р. Волги у г. Ярославля имеем
_ |
79 |
P ( R u > \ ) = \ - е |
211 + 1 « 0 ,0 2 = 2До; |
для р. Унжи у г. Макарьева |
|
_ |
68 |
Я (Р ,5> 1 ) = 1 - е 213+1 ~0,012«1,2'7 о
78
и, наконец, для группировки стока маловодных лет для р. Белой у г. Уфы
_ 85
P ( R u > 1 )= 1 - < Г 211 + 1 я» 0,018 « 2 , 0°/о*
Заметим, что для решения рассматриваемой задачи можно при менить и формулы (2.19) и (2.20). Действительно, например, для р. Белой имеем я = 85, &= 11 и, следовательно,
85 |
|
— 2п+ 1 = = 0,021 |
|
P(Rn = \) = 0,0211,021 |
0, 02. |
Большой научный и практический интерес представляет опреде ление наибольшей продолжительности группировки маловодных или многоводных лет при заданном значении вероятности в вы борке объемом п лет. Эта задача может быть приближенно решена
также на основании закона Пуассона, если выражение (2.19) пред ставить в виде
— ---- X* g 2 ~ P) |
(2 .2 2 ) |
Здесь К — наибольшая длительность группировки маловодных или многоводных лет при вероятности ее наступления р в выборке объемом п лет.
Применительно к исходным данным, приведенным в табл. 2.3, рассчитаем наибольшую возможную продолжительность группи ровки с вероятностью повторения, равной 0,05, т. е. 5%.
Для р. Волги у г. Ярославля имеем
К= |
Igl° [ |
In (1 - 0,05) ] — 1 яг 9,6 |
года, |
|||
|
|
lg 2 |
|
|
|
|
для р. Унжи у г. Макарьева |
|
|
|
|||
|
igio |
68 |
|
|
|
|
К-- |
In (1 -0 ,0 5 ) |
— 1 |
я»9,4 |
года, |
||
|
||||||
|
lg2 |
|||||
и для р. Белой у г. Уфы |
|
|
|
|||
|
|
|
|
|||
,, |
lgI0[ ~ |
In (1 - 0 ,0 5 )'] |
1 я» 9,7 |
года. |
||
|
|
Ig2 |
||||
|
|
|
|
|
Сопоставление рассчитанных наибольших значений продолжи тельности маловодных периодов (2 .2 2 ) с наблюденными данными
(табл. 2.3) показывает, что осуществившиеся периоды низкой вод ности были большей длительности, чем расчетные. Из этого сле дует, что им свойственна меньшая вероятность повторения, чем это принято в расчете (5%).
79