
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfВ этом уравнении х0— среднее значение; у и b — параметры, свя
занные с коэффициентом изменчивости С„ и коэффициентом асим метрии Cs следующими уравнениями:
^ |
Г |
Г (-г) Г (Т + |
2Ъ) |
,1»/, |
|
(5.27) |
||
|
""“"l |
|
г2 ( 7 + Ь) |
Ч |
■ |
|||
|
|
|
||||||
Г2 (7) Г (Т + |
Щ |
, |
Г (7) Г (7 + |
26) , n |
|
|||
ТЧТ + Ь) |
|
|
ТЦч + b) |
(5.28) |
||||
|
Г |
Г (-г) Г (7 + |
26) |
,+ /* |
|
|||
|
I |
|
Г2(7 + |
6) |
‘J |
|
|
где Г (у), Г(у + Ь) и т. д .—-символы гамма-функции соответствую щих аргументов.
Как видно из уравнения (5.26), рассматриваемое распределе ние характеризуется тремя параметрами: средним значением Хо,
коэффициентом вариации С„ и коэффициентом асимметрии Cs. Для этих параметров и требуется установить оценки наибольшего прав
доподобия.
Образуем функцию правдоподобия (5.14), для чего предвари тельно найдем логарифмы величин Р, (х{, х0, у, Ь)
\пР{хь х 0, |
у, b)=(-cf— l) ln - g — |
г г (7 + г») |
XI 1*/* I |
|
L Г (Т) |
Хо \ |
I |
||
|
|
|
+ “Г 1п Г(Г ( У ) - ln I Ь | - 1п Г (т) - In х 0.
В таком случае функция правдоподобия (в логарифмической форме) примет вид
|
П |
п |
|
|
In |
In P(xi) |
|
|
|
|
1 |
|
|
|
|
4 + In |
- in I * I - 1" г |
In |
(5.29) |
Для последующего анализа удобнее иметь дело со средним гео метрическим значением плотности вероятностей рассматриваемой выборки, т. е. с величиной L' = (L)lln, где п — объем выборки. Это
преобразование функции правдоподобия не вносит принципиаль ного изменения в искомые оценки параметров. Учитывая указанно^ замечание, уравнение (5.29) можно записать в виде
+ 1 Г 1п Г Г ( У * — In 1Ь I ■- InГ (т) — 1п х0. |
(5.30) |
Для получения зависимостей, позволяющих определить по ме тоду наибольшего правдоподобия интересующие нас параметры (хо, у, Ь), продифференцируем выражение (5.30) последовательно
270
по л'о, y и Ь, т. е. найдем логарифмические |
производные функции |
|||
„ |
г/ д \ п ь ' |
a in l ' |
a in v |
„ |
правдоподобия |
L : — ----- , ---- г----- и — ^-----. Приравнивая нулю |
|||
|
охо |
оу |
Ои |
можно получить сле |
выражение логарифмических |
производных, |
|||
дующую систему уравнений: |
|
|
|
Г(7 + 6) 1
Г (7) J
72+1° |
Г(Т + ^) |
— b -jfj- InГ (т)=0, |
(5.31) |
|
г (7) |
||||
|
г (7 + Ъ) У / ь , |
ь = О, |
|
|
|
г (7) |
j : |
|
где
Решение системы |
(5.31) относительно Хо, у и b для |
данной вы |
||
борки Xi, Х 2, . . ., Х п , |
по которой ВЫЧИСЛЯЮТСЯ статистики Я.1, %2 и Хз, |
|||
дает наилучшие оценки этих параметров. |
оценки |
параметров |
||
Подставляя в зависимости (5.27) и (5.28) |
||||
у и Ь, вычисленные с использованием системы |
уравнений |
(5.31), |
||
получаем наилучшие оценки коэффициента вариации |
(Cv) |
и коэф |
фициента асимметрии (Cs). Ввиду того что рассмотренный прием оценки параметров Хо, Cv и Са хотя и является в принципиальном
отношении вполне строгим, однако приводит к технически трудно разрешаемым трансцендентным уравнениям (5.31), ограничимся приведенными сведениями по общей схеме решения, не вдаваясь в дальнейшие детали математических образований. Указанное тем более целесообразно, что Е. Г. Блохинов [22] разработал на прин ципе наибольшего правдоподобия упрощенные способы оценки па раметров трехпараметрического гамма-распределения. Точность оценок, получаемая упрощенным методом, мало отличается от оце
нок по полной схеме. |
Блохинов разработал |
в двух вариантах: |
|
Упрощенный способ |
|||
а) |
для независимого и одновременного |
определения всех трех |
|
параметров (х0, Cv, Cs) |
по некоторым статистикам, вычисляемым |
||
по ряду наблюдений; |
|
|
271
б) для оценки коэффициента изменчивости С„ при произволь ном фиксированном отношении Cs/Cv. При этом, конечно, устанав ливается и оценка хо.
В целях упрощения основной полной схемы Блохинов предло жил вместо указанных выше статистик Яь Я2 и Я3 использовать ста
тистики: |
|
|
___ . |
у __ |
i > - ^ L |
1 -У . |
||
V |
XI , |
Xj |
— |
- |
X |
1 |
X |
Использование первой из приведенных статистик означает, что в качестве оценки среднего х0 принимается среднее арифметиче
ское х, в то время как в соответствии со статистикой Ях в качестве измерителя выборочной оценки параметра Хо используется среднее
степенное. В § 2 показано, что такая оценка среднего является достаточно эффективной для многих законов распределения, включая и трехпараметрическое гамма-распределение. Вторая ста тистика Я2, как видно, полностью соответствует ее оценке, вытекаю щей из полной схемы применения метода наибольшего правдоподо бия для определения параметров трехпараметрического гамма-рас пределения. Третья статистика Я' в рассматриваемом варианте
упрощенного способа |
соответствует |
третьей |
статистике |
Яз |
полной |
схемы для случая 6 = |
1, или, что то же самое, |
CS = 2CV. |
связь ее |
||
Вследствие указанного свойства |
второй |
статистики |
|||
с коэффициентом изменчивости преемственно выразится |
вторым |
||||
уравнением системы |
(5.31), построенной для полной схемы, |
|
|||
Я2= |
6 - ^ - 1пГ (т)-Ш |
Г(гт(+ |
г,) |
|
(5.32) |
Для связи новой третьей статистики Я' с коэффициентом асим метрии Блохинов получил уравнение
^ з - 6 - j f Ь П т + б ) - ^ |
(5.33) |
Совместное рассмотрение уравнений (5.32) и (5.33) позволяет образовать систему:
. |
<J |
, п / \ . |
Г ( к -f 6) |
Х2=0, |
^ ~ d f |
п Г (?) ~ In |
У (Т) - |
||
|
1п Г (т + 6)- 1п Т^ -+)Ь) |
(5.34) |
||
b |
я3= о , |
272
которая дает возможность по известным |
значениям статистик Яг |
и Я' , вычисляемых по ряду наблюдений, |
найти значения парамет |
ров у и Ь. Зная величины у и Ь, по уравнениям (5.27) и (5.28) можно перейти к оценкам параметров Cv и Cs. Даже при указан
ном упрощении схемы использования метода наибольшего правдо подобия решение системы (5.34) для каждой выборки может быть получено лишь подбором и связано с громоздкими вычислениями. Поэтому, чтобы получить возможность практического использова ния рассмотренного приема, Блохинов построил номограммы. По оси абсцисс номограмм отложено значение л', по оси орди
нат— значение У. Точка пересечения значений Я2 и Я' определяет
величины искомых параметров Cv и Cs.
Номограммы построены для диапазона С„= 0,25ч-1,5. Однако учитывая, что оценки методом наибольшего правдоподобия и ме
тодом моментов для С„^0,5 практически |
не различаются, на |
рис. 5.1 воспроизводятся номограммы лишь |
для диапазона Cv— |
= 0,5-=-1,5 при Cs/Cv= 1-4-6.
Смысл применения рассмотренного упрощенного приема оценки параметров трехпараметрического гамма-распределения вытекает из следующего. Как видно в системе уравнений (5.31), статистики
Рис. 5.1. Номограмма для определения параметров С» и Cs трехпарамет рического гамма-распределения методом наибольшего правдоподобия.
18 Зак . № 88 |
273 |
|
|
п |
п |
%i—------------------------ |
п |
и Лз—---------------------------------- - связаны одно- |
|
п |
временно между собой и искомыми параметрами (х0, Cv и Cs) через промежуточный параметр Ь. Это резко усложняет решение
рассматриваемой системы, делая его малопригодным для практи ческого использования даже с использованием ЭВМ.
Использование статистик, близких по своей структуре к стати стикам, Применяемым в полном методе наибольшего правдоподо бия, но лишенным указанной внутренней связи, позволило Блохинову получить более простую систему (5.34), описываемую указан ными выше номограммами (рис. 5.1).
Второй вариант упрощенного метода основан на использовании не уравнения (5.27), связывающего величину коэффициента вариа-
-0 ,4 5
-0 , 4 0
-0,35
-0,30
-0,25
-0,20
-0,15
- 0,10
сэ
Cl
И* О*
C v = 0 , 7 0 - 1 , 0 0
|
|
|
|
|
|
I |
|
|
|
a t |
____г |
|
|
|
|
|
|
|
О; |
||
|
|
|
|
|
|
— |
|
|||
1 |
|
|
|
|
|
I |
Ул/ |
л |
СшW |
|
|
|
|
|
|
|
V. |
|
щ |
|
|
1---- |
|
|
|
|
|
щ |
|
щ |
i |
t |
|
|
|
.Jg |
J I1 |
|
|
|
|
||
|
|
|
|
|
г |
— — |
||||
|
|
|
с> |
|
щ |
щ |
|
С-0 |
|
|
|
|
|
оэ |
ш |
|
|
|
|||
|
£ |
__ л |
щ |
я |
а |
Ж |
|
|
|
|
с Г __ |
|
|
|
|
,Ст) |
|
I |
] |
||
ш |
я |
ш |
т |
|
ш |
|
|
|||
— и |
|
|
|
|
|
С-о |
|
|
|
|
< |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
,*о— |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
||
/ щ |
т |
|
|
|
|
|
|
|
|
|
'/ Я |
' ш |
е |
ш |
|
: |
|
|
|
|
|
|
|
|
|
|
|
тц |
н |
г |
W |
1 |
|
л |
|
|
-0,05 |
L |
0,20 0,22 Х'3 |
0,10 |
0,15 |
Рис. 5.1. Номограммы для определения параметров С„ и С„ трехпара
274
ции со статистикой Я2, а уравнения (5.32). Сущность этой замены состоит в том, что уравнение (5.27) связывает указанные величины для частного случая CS = 2C„, а уравнение (5.32) фиксирует эту связь для произвольного соотношения между параметрами Cv и Cs,
поскольку оно вытекает из' общего решения, поэтому имеем
|
» - £ - 1пГ(1 ) - 1п |
- h = 0 , |
(5.35) |
|
ZJln- |
|
|
где Я2= |
•статистика, |
вычисляемая |
по выборке у = |
С2 ’■
V
S3-$
- 1,00 |
с/ь— |
|
Cv -1,00 -1,50 |
-0,90
'0,80
-0,70
-0,60
-0,50
■0,40
~0,30
-0,20
-0,10
0,12
V/ку
|
|
• |
^ / |
|
|
1.20 |
|
|
|
|
|
|
|
fsVj |
|
|
О |
/*о |
|
|
ч- |
к/ % |
|
|
ъ-Г |
|
|
О |
§ |
yj |
|
N |
|
||
и |
|
|
|
|
i t |
0 |
|
с? |
|
||
|
|
||
|
|
|
|
|
/ м /f/У |
^Co |
|
|
|
/O f vO |
|
|
|
fl/U |
|
ЩЪх
* s ' 6Cv
0,20 |
0,30 |
0,40 Х'3 |
метрического гамма-распределения методом наибольшего правдоподобия.
18* |
275 |
|
|
|
|
Т а б л и ц а |
5.1 |
|
|
|
Расчет параметров Q, С„, С„ методом наибольшего правдоподобия ряда |
||||||
|
|
максимальных расходов воды р. Тисы у с. Делового |
|
||||
№ |
|
^макс |
^макс |
f t = ^ |
|
|
|
Год |
в убываю |
lg ft |
|
ft lg ft |
|||
п/п |
м3/с |
щем |
Q |
|
|||
|
|
|
порядке |
|
|
|
|
l |
1933 |
490 |
745 |
2,35 |
0,37107 |
|
0,872 |
2 |
1934 |
293 |
700 |
2,21 |
0,34439 |
|
0,760 |
3 |
1935 |
405 |
518 |
1,63 |
0,21219 |
|
0,346 |
4 |
1936 |
240 |
504 |
1,59 |
0,10140 |
|
0,320 |
5 |
1937 |
215 |
490 |
1,55 |
0,19033 |
|
0,295 |
6 |
1938 |
240 |
462 |
1,46 |
0,16435 |
|
0,240 |
7 |
1939 |
146 |
462 |
1,46 |
0,16435 |
|
0,240 |
8 |
1940 |
282 |
408 |
1,29 |
0,11059 |
|
0,143 |
9 |
1941 |
504 |
405 |
1,28 |
0,10721 |
|
0,137 |
10 |
1945 |
338 |
338 |
1,07 |
0,02938 |
|
0,031 |
11 |
1946 |
162 |
310 |
0,978 |
1,99034 |
-0,00966 |
-0,0094 |
12 |
1947 |
462 |
310 |
0,978 |
1,99034 |
-0,00966 |
-0,0094 |
13 |
1948 |
700 |
293 |
0,924 |
Г,96567 |
-0,03433 |
-0,0317 |
14 |
1949 |
462 |
293 |
'0,924 |
1,96567 |
—0,03433 |
-0,0317 |
15 |
1950 |
225 |
282 |
0,890 |
1,94939 |
-0,05061 |
-0,0450 |
16 |
1951 |
235 |
265 |
0,836 |
Т,92201 |
-0,07779 |
-0,0650 |
17 |
1952 |
518 |
252 |
0,795 |
1,90037 |
-0,09963 |
-0,0792 |
18 |
1953 |
171 |
240 |
0,757 |
1,87910 |
-0,12090 |
-0,0915 |
19 |
1954 |
220 |
240 |
0,757 |
1,87910 |
-0,12090 |
-0,0915 |
20 |
1955 |
293 |
240 |
0,757 |
1,87910 |
-0,12090 |
-0,0915 |
21 |
1956 |
265 |
235 |
0,741 |
1,86982 |
-0,13018 |
-0,0965 |
22 |
1957 |
228 |
228 |
0,719 |
1,85673 |
-0,14327 |
-0,103 |
23 |
1958 |
310 |
225 |
0,710 |
1,85126 |
-0,14874 |
-0,106 |
24 |
1959 |
408 |
220 |
0,694 |
1,84136 |
-0,15864 |
-0,110 |
25 |
1960 |
173 |
215 |
0,678 |
1,83123 |
-0,16877 |
-0,114 |
26 |
1961 |
159 |
173 |
0,546 |
Г,73719 |
-0,26281 |
—0.143' |
27 |
1962 |
252 |
171 |
0,539 |
1,73159 |
-0,26841 |
-0,145 |
28 |
1963 |
146 |
162 |
0,511 |
Т.70842 |
-0,29158 |
-0,149 |
29 |
1964 |
310 |
159 |
0,502 |
1,70070 |
-0,29930 |
-0,150 |
30 |
1965 |
240 |
146 |
0,461 |
1,66370 |
—0,33630 |
-0,155 |
31 |
1966 |
745 |
146 |
0,461 |
1,66370 |
-0,33630 |
-0,155 |
|
/1=31 |
год, Q = 317 |
мЗ/с, S l g A = - |
1,328, |
S £ l g 6 = 1,412, |
|
Х2 — |
S lg * |
1,328 |
,, |
|
1,412 |
0,047. |
1 |
30 |
■0,044, |
1 |
30 |
||
|
|
|
276
Зависимость |
(5.32) непосредственно относительно параметра |
С„ не решается, |
но может быть представлена в виде таблицы [22], |
построенной путем подбора применительно к условию, записанному в форме уравнения (5.35).
Рассмотрим порядок использования упрощенного способа оценки параметров трехпараметрического гамма-распределения. Расчет по методу наибольшего правдоподобия параметров ряда максимальных расходов воды р. Тисы у с. Делового (Д=1190 км2) представлен в табл. 5.1.
На основании статистик Я2 и А,з по номограмме (рис. 5.1) опре
деляем: С„= 0,51, CS = 5C„ = 2,55. По статистике Я2, используя дан ные табл. 5.1, можно определить величину Cv, если принять неко торое фиксированное отношение Cs/Cv. Имея в виду, что в данном
случае ведется расчет максимальных расходов дождевых паводков, принимаем Cs = iC v, в таком случае при Я2= —0,044 имеем Cv=
= 0,49.
§ 4
применение метода статистических испытаний для оценки параметров распределения
Метод статистических испытаний (метод Монте-Карло) находит все большее применение в гидрологических расчетах. Этому спо собствует реализация метода на электронных вычислительных ма шинах (ЭВМ). Впервые в советской гидрологической литературе основные принципиальные положения статистического моделирова ния были рассмотрены С. Н. Крицким и М. Ф. Менкелем, однако широкое применение этого метода в расчетах речного стока нача лось с исследований Г. Г. Сванидзе [123]. Исследование группиро вок маловодных и многоводных лет с использованием моделируе мых методом статистических испытаний гидрологических рядов предпринял В. Г. Андреянов и другие [1]. Впоследствии это напра вление было развито Д. Я. Ратковичем [95—97]. Е. Г. Блохинов [18, 20, 22] и А. Ш. Резниковский [37] использовали метод стати стических испытаний для получения распределения выборочных оценок стандартных параметров (среднего значения, коэффициен тов вариации и асимметрии).
В исследованиях Блохинова основное внимание уделяется сравнению распределений выборочных оценок, вычисленных мето дами моментов и наибольшего правдоподобия, а в работах Резниковского изучается влияние степени связанности гидрологических рядов на выборочные оценки их стандартных параметров. Блохи нов [20], кроме того, исследовал особенности распределений орди
нат кривых обеспеченностей трехпараметрического гамма-распре деления при выборочной оценке двух (х, С„ при фиксированном
отношении Cs/Cv) и трех (х , С„, Cs) параметров. При этом, как и
ранее, для выборочных оценок параметров Блохинов проводит
277
сравнение распределений выборочных оценок ординат кривых обе спеченности, полученных методами моментов и наибольшего прав доподобия. Для такой сравнительной оценки 100 выборок вполне достаточно. Однако для выяснения случайных ошибок ординат кри вых обеспеченностей не в форме сравнения двух методов их полу чения, а в виде абсолютных величин, указанное число выборок уже недостаточно. Такое суждение необходимо основывать на зна чительно большем числе выборок, чтобы получить допустимую слу чайную ошибку рассматриваемой варьирующей величины. Поэтому 3. Ф. Волкова [39] выполнила оценку случайных ошибок ординат гамма-распределения, доведя число выборок до 1000. Она исполь зовала выборки различного объема (« = 25,5 и 100); исследование проведено для соотношения CS = 2CV. Оценка параметров распре
деления осуществлялась методами моментов и наибольшего прав доподобия.
Исследования Блохинова, Резниковского и других, опираю щиеся на метод статистических испытаний, имели важное методи ческое и практическое значение, но рассматриваемую задачу вы яснения точности статистической оценки параметров законов рас пределения случайных величин решают лишь для некоторых частных случаев. Так, Блохинов исследовал совокупность внутрирядно не связанных величин. Резниковский внутрирядную корреля цию учитывал для частного случая г = 0,3 и 0,5 и только примени тельно к соотношению CS — 2CV. Учитывая, что внутрирядная кор
реляция оказывает существенное влияние на смещенность оценок параметров и особенно на величину случайных их колебаний, це лесообразно было осуществить более полное исследование влияния этого параметра (г,, г+i) на законы распределения гидрологических параметров.
Важным следствием наличия внутрирядной связанности явля ется систематическое преуменьшение (отрицательная смещенность) выборочных оценок некоторых параметров статистической совокуп ности. Влияние внутрирядной связанности на структуру модели руемых последовательностей иллюстрирует рис. 5.2. В качестве ис
ходных параметров при моделировании принято: д: == 1,0; С. = 0,3; Cs= 0,6; п, ,+1 = 0,0; 0,3; 0,6; 0,9. Общий объем совокупности N =
= 100, выборок п=10. Наличие корреляционной связи между смеж ными членами ряда понижает репрезентативность выборки задан ной численности и приводит к получению смещенных значений вы борочных параметров по сравнению с параметрами генеральной совокупности. Непосредственной причиной этих искажений явля ется то обстоятельство, что возрастание связи между членами ряда приводит к сглаживанию колебаний в пределах относительно мало численных выборок (коротких отрезков времени). Следствием этого является накопление отклонений одного и того же знака, входящих в случайную выборку ограниченной численности. В результате та кого накопления отклонений определение среднего значения ряда, обладающего внутрирядной связанностью, может быть выполнено
278
с меньшей точностью, чем по выборке независимых величин такой же численности. Кроме того, на распределение оценок некоторых параметров (коэффициента вариации и особенно коэффициента
Рис. 5.2. Моделируемые методом статистических испытаний последо вательности при различных коэффициентах корреляции между смеж ными членами ряда.
асимметрии) существенное влияние оказывает величина коэффици ента асимметрии или отношения Cs/Cv. Учет этого обстоятельства
также необходим при достаточно полном анализе точности стати стической оценки параметров распределения величин, изучаемых гидрологией. Поскольку аналитическое решение рассматриваемой
задачи возможно лишь в некоторых частных случаях |
(например, |
применительно к условиям биномиального закона при |
CS = 2C„), |
279
метод статистических испытаний выступает в качестве основного оперативного средства решения рассматриваемой задачи в общей ее постановке.
Статистическое моделирование случайной независимой совокуп ности, подчиняющейся определенному закону распределения, по схеме, принятой в гидрологических и водохозяйственных расчетах, осуществляется достаточно просто. Для этого совокупность равно мерно распределенных случайных чисел принимается за обеспечен-
X
Рис. 5.3. Схема, иллюстрирующая преобра зование равномерного закона распределения в любое заданное распределение.
пости, исходя из которых по заданной кривой обеспеченности опре деляются значения величин случайной последовательности с задан
ным законом распределения |
(рис. 5.3). Используя |
электронные |
|||||||
цифровые вычислительные машины, обычно |
применяют |
стандарт |
|||||||
ные программы, обеспечивающие получение равномерно распреде |
|||||||||
ленных случайных чисел. Закон |
распределения |
при |
выполнении |
||||||
операции моделирования обычно задается либо в аналитическом |
|||||||||
виде, либо в форме таблицы. |
|
|
|
случайных |
величин, |
||||
Для моделирования последовательностей |
|||||||||
обладающих корреляционной связью между |
смежными |
членами |
|||||||
ряда |
(простая цепь Маркова), |
в настоящее время в гидрологиче |
|||||||
ских исследованиях используется |
много предложений, |
к числу ко |
|||||||
торых относятся исследования Г. Г. Сванидзе |
[120], Н. А. Картве- |
||||||||
лишвили [61], |
Д. Я. Ратковича |
[95—97], |
Е. |
Г. |
Блохинова [25], |
||||
Г. А. |
Алексеева |
[9]. Из их числа отметим следующие. |
|
|
|||||
1. |
Исходная статистическая совокупность нормально распреде |
||||||||
ленных случайных величин с применением |
аппарата |
нормальной |
280