Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии

.pdf
Скачиваний:
68
Добавлен:
22.10.2023
Размер:
14.87 Mб
Скачать

Используя формулу (4.30) и таблицу нормального закона рас­ пределения, можно построить график, приведенный на рис. 4.6; здесь величина критических значений параметра 6 указана в зависимо­ сти от уровней значимости и числа лет наблюдений. Нанося на этот график значения параметров б, полученные для исследуемых стати­ стических совокупностей, легко установить, в какую сторону и на­ сколько значительно отклоняются они от среднего значения 6 = 1, при котором рассматриваемые ряды образуют статистически слу­ чайные совокупности.

Используем рассмотренный критерий и приведенный на рис. 4.6 график для оценки того, в какой мере ряды годового и максималь­ ного стока можно рассматривать как случайные совокупности.

Рис. 4.6. Зависимость

параметра 6

Рис. 4.7.

Зависимость

параметра 6

рядов годового стока и его критиче­

рядов максимального стока и его кри­

ских значений при различных уровнях

тических

значений

при

различных

значимости

от числа лет

наблюдений.

уровнях

значимости

от числа лет на­

 

 

 

 

 

 

 

блюдений.

 

 

 

Результаты расчетов параметров б для

рядов

годового

стока

приведены в табл. 4.16, а для максимального — в табл. 4.17.

 

Полученные

величины б нанесены

на

графики

 

(рис. 4.6 и

рис. 4.7). На рис. 4.6 видно,

что значения б,

полученные по эмпири­

ческим рядам, имеют отчетливую

тенденцию смещения в сторону

малых значений параметра

б, т. е.

в зону, характерную для стоха­

стически зависимых последовательностей.

 

 

 

 

 

рядов

Можно также

отметить,

что большинство исследуемых

при п >40

характеризуется

значениями

параметра

б,

попадаю­

щими в критическую

область менее 5%-ного уровня

значимости.

Это означает, что с более чем 95%-ной вероятностью можно утвер­ ждать, что в таких рядах имеется внутрирядная стохастическая связь.

В отличие от рассмотренного примера, рис. 4.7 показывает, что параметры рядов максимального стока располагаются достаточно

240

Т а б л и ц а 4.16

Величины параметра б рядов среднегодового стока

 

 

 

П лощ ад ь

П ер и о д

Ч исло

 

Р ек а

 

П ун кт

в о д о сб о р а,

5

 

наблю ден ий

л е т

 

 

 

км2

 

 

 

 

 

 

 

Кама

г.

Березняки

83 780

1881-1942

62

0,68

 

с.

Добрянская

118 200

1881-1935

55

0,84

Вишера

г.

Пермь

167 800

1881-1953

73

0,73

с.

Митраково

9 020

1929-1942

14

0,70

Колва

с.

Подбобыка

11 930

1928-1942

15

0,49

Чусовая

с.

Копчик

11 160

1882-1932

51

0,76

 

г.

Чусовские

23 900

1881-1942

62

0,66

Белая

с.

Городки

21 000

1919-1941

23

0,54

Бугоровка

 

г.

Уфа

100 500

1878-1941

64

0,63

Уфа

г.

Б ирек

121 300

1881-1941

61

0,60

с.

Шафеево

36 600

1913-1941

29

0,44

Тура

г.

Верхотурье

4 700

1895-1916

22

0.74

Ница

г.

Тюмень

55 250

1896-1957

62

0,50

г.

Ирбит

16 980

1892-1923

32

0,80

Пышма

с.

Богандин

18 360

1895-1916

22

0,94

Каргалка

с.

Приютово

751

1946-1958

13

0,40

Сакмара

с.

Новосергиевка

1 340

1936-1959

23

0,56

Бузулук

с.

Елшанка

22 500

1934-1955

22

0,36

с.

Байгоровка

1 810

1940-1955

16

0,44

Большой Кинель

г.

Бугуруслан

6140

1939-1955

17

0,60

Урал

г.

Оренбург

82300

1935-1960

26

0,59

Сакмара

г.

Кушум

180 000

1881-1960

80

0,82

с.

Сакмара

28 700

1881-1961

81

0,78

Волга

г.

Тетюши

1 179 000

1902-1917

16

0,69

 

г.

Куйбышев

1 210 000

1881-1935

55

0,64

Чаглинка

г.

Волгоград

1 350 000

1881-1935

55

0,59

с.

Павловка

1 750

1892-1960

69

0,82

Ишим

г.

Петропавловск

118 000

1893-1960

68

0,80

Нура

с.

Романовское

146 000

1916-1960

45

0,66

Иртыш

г.

Усть-Камено­

1903-1957

55

0,86

с.

горск

179000

1903-1957

55

0,87

Шульба

м

г.

Павлодар

240 000

1903-1957

55

0,85

Тобол

г.

Тобол

956 000

1892—1958

67

0,56

с.

Гришенка

13 400

1938-1957

20

0,61

,,

г.

Кустанай

44 800

1931-1957

27

0,52

 

г.

Курган

137 000

1892-1960

69

0,65

Обь

г.

Ялуторовск

210000

1892-1960

69

0,64

г.

Новосибирск

246000

1894-1959

6 6

0,60

Ока

г.

Муром

188 000

1882-1955

74

0,77

Северная Двина

г.

Усть-Пинега

350 100

1880-1958

79

0,66

Енисей

с.

Базаиха

29 900

1903-1952

50

0,77

Неман

г.

Смалининкай

81 200

1812—1958

147

0,78

Унжа

г.

Макарьев

18 500

1896-1960

65

0,58

Чирчик

г.

Ходжикент

10 600

1901-1959

59

0,72

16 З а к № 88

241

Т а б л и ц а 4.17

Величины параметра 6 рядов максимального стока

 

 

 

П лощ адь

П ер и о д

Ч исло

£

Р е к а

 

П ункт

водосбора,

наблю ден ий

лет

 

 

 

км2

 

 

 

 

 

 

 

Чусовая

г. Чусовские

23 900

1881-1942

62

1,05

 

 

Городкн

21 000

1919-1941

23

1,05

Белая

с.

Бугоровка

 

г.

Бирск

121 300

1881-1917

37

1,13

 

 

 

121 300

1919-1941

23

0,74

Тагил

с.

Трошково

7 380

1895-1917

23

0,71

Пышма

с.

Богандинское

18 360

1895-1916

22

1,18

Урал

г.

Кушум

179 500

1921-1941

21

0,80

Тавда

г.

Оренбург

82 300

1927-1960

34

0,76

г.

Тавда

82 680

1906-1939

34

0,60

Волга

г.

Волгоград

1 350 000

1881-1935

55

0,95

Самара

г.

Куйбышев

1 210 000

1881-1935

55

0,94

с.

Елшанка

22 500

1933-1955

23

0,49

Бузулук

с.

Новосергиевка

1 340

1936-1960

25

0,79

с.

Байгоровка

1 810

1933—1955

23

0,54

Большой Кинель

г.

Бугуруслан

6140

1933-1955

23

0,65

Кама

с.

Добрянская

118 200

1878-1921

44

1,15

 

г.

Березники

83 780

1881-1942

62

0,87

Сырдарья

г.

Пермь

167 800

1881-1942

62

0,95

г.

Беговат

340 200

1910-1953

44

0,68

Кама

с.

Муново

1884-1919

36

1,15

Вишера

с.

Сокольи Горы

504 400

1881-1918

38

1,30

с.

Митраково

9 020

1901— 1924

24

1,27

Чусовая

с.

Копчик

11 160

1881—1932

52

0,85

Белая

г.

Уфа

100 500

1878-1941

64

1,10

Tvpa

г.

Тюмень

55 250

1896-1941

46

0,80

Ница

г.

Ирбит

16 980

1892-1923

32

0,99

Уфа

с.

Шафеево

36 600

1912-1941

30

0,92

Tvpa

г.

Верхотурье

4 700

1894-1923

30

0,70

Сакмара

с.

Сакмара

28 700

1932-1960

29

1,07

Обь

г.

Новосибирск

246 000

1894-1959

66

0,77

Днепр

г.

Киев

188 000

1881-1955

75

0,98

Ока

г.

Муром

1882—1918

37

1,01

Енисей

с.

Базаиха

29 900

1903-1952

50

0,76

Неман

г.

Смалининкай

81 200

1812-1958

147

0,99

Унжа

г.

Макарьев

18 500

1896-1960

65

0,97

Чирчик

г.

Ходжикент

10 600

1901-1959

59

1,08

равномерно относительно среднего значения 6 = 1, что свидетельст­ вует в целом о стохастически случайном формировании рядов мак­ симального стока.

Таким образом, цикличность рядов максимального стока, если она и имеется, носит чисто случайный характер, так как колебания параметра 6 около его математического ожиданий при 6 = 1 обус­ ловлены ошибками в определении 6 с подчинением их нормальному закону распределения.

Что касается рядов годового стока, то они в пределах проведен­ ного исследования обладают внутрирядной скоррелированностью, обусловливающей циклические колебания неслучайного характера.

242

§3

анализ согласия эмпирических и аналитических функций распределения

Существующая практика расчетов речного стока основывается на определении расходов воды заданной вероятности ежегодного превышения. Для решения этой задачи используются различные теоретические кривые распределения, рассмотренные в главе II. Большое разнообразие теоретических схем распределения, исполь­ зуемых при описании гидрологических характеристик, свидетельст­ вует о том, что эмпирические данные гидрологических наблюдений в общем неплохо соответствуют применяемым аналитическим кри­ вым распределения.

В главе III указывалось, что это соответствие может быть уста­ новлено на основании визуальной оценки эмпирических и аналити­ ческих кривых распределения, выполненных на соответствующих клетчатках вероятности. При этом отмечалось, что такой прием оценки согласия эмпирических данных и используемой аналитиче­ ской функции распределения, обладая рядом достоинств, имеет и существенный недостаток, заключающийся в элементе субъекти­ визма и, следовательно, в неоднозначности полученного решения. В данной главе рассматриваются критерии согласия эмпирических и аналитических кривых распределения, лишенные этого недо­ статка.

Необходимо особо подчеркнуть, что с помощью критерия соот­ ветствия эмпирических данных аналитическим функциям распреде­ ления устанавливается их согласие лишь в пределах наблюденных данных. Поэтому экстраполяция теоретических функций распреде­ ления за пределы наблюденных данных должна осуществляться с особой осторожностью даже при установлении согласия между эмпирическими и аналитическими функциями распределения. Вме­ сте с тем в гидрологических расчетах, широко применяющихся в на­ стоящее время, наиболее часто используются аналитические функ­ ции распределения за пределами наблюденных данных. В этом от­ ношении критерии согласия эмпирических и аналитических функций распределения оказываются недостаточными применительно к опи­ санию многолетних колебаний различных гидрометеорологических характеристик.

Обратим внимание, кроме того, и на тот факт, что степень со­ гласия эмпирических и аналитических функций распределения за­ висит от числа свободно назначаемых параметров. Иначе говоря, используя теоретические функции распределения с большим числом параметров, определенных по экспериментальным данным огра­ ниченного объема, как правило, получим лучшее соответствие аналитических кривых фактическим данным по сравнению с ана­ литическими функциями, учитывающими меньшее число свободно назначаемых параметров.

16*

243

Из рассматриваемых далее критериев согласия отмеченное свойство теоретических функций распределения, включающих боль­ шое число параметров, учитывает критерий согласия %2, так как его теоретическое распределение зависит от числа параметров, опреде­ ляемых по выборочным данным. Критерии согласия Колмогорова и /гео2 не зависят от числа параметров теоретической функции рас­ пределения. Поэтому их использование предполагает, что теорети­ ческая функция распределения полностью задана, включая числен­ ное значение параметров, в нее входящих.

В практике гидрологических приложений параметры распреде­ ления почти всегда определяются по выборочным данным. Ввиду этого использование критериев Колмогорова и /г©2 в гидрологиче­ ских исследованиях ограничено.

В случаях же когда эти критерии применяются при вычислении параметров по выборочным данным, они дают избыточное согласие с нулевой гипотезой даже тогда, когда верна альтернативная гипо­ теза — гипотеза несоответствия данных наблюдений принятой тео­ ретической функции распределения; это обстоятельство в гидроло­ гических исследованиях обычно не учитывается при использовании критериев Колмогорова и па2. Поэтому в подобных работах, как

правило, отмечается хорошее соответствие эмпирических распреде­ лений теоретическим даже тогда, когда теоретические функции рас­ пределения заведомо не согласуются с выборочными данными, что объясняется некорректным использованием данных критериев.

Критерии согласия разработаны применительно к случайным по­ следовательностям, в которых отсутствует зависимость между их членами, в то время как многие гидрологические ряды наблюдений корреляционно связаны. В таких случаях доверительные границы критериев расширяются и они становятся менее чувствительными по отношению к альтернативной гипотезе, что опять-таки приводит к признанию нулевой гипотезы даже тогда, когда она не соответст­ вует выборочным данным.

При соответствии эмпирических данных нескольким теоретиче­ ским функциям распределения следует использовать более простые

схемы с меньшим

числом свободно

назначаемых параметров.

С. Н. Крицкий и М.

Ф. Менкель [83, 84]

приводят два условия, кото­

рым должна удовлетворять теоретическая функция распределения при описании многолетних колебаний речного стока:

1) простирание функции распределения должно заключаться

впределах от 0 до оо;

2)функция распределения должна определяться тремя свободно

назначаемыми параметрами.

Этим условиям из законов распределения случайных величин, рассмотренных в главе II, удовлетворяет лишь трехпараметрическое гамма-распределение Крицкого и Менкеля, так как все остальные типы кривых распределения при простирании их от 0 до оо являются двухпараметрическими. Вместе с тем в настоящее время можно счи­ тать установленным, что рядам гидрологических характеристик свойственна различная асимметрия. Поэтому двухпараметрические

244

распределения должны хуже соответствовать эмпирическим данным по сравнению с трехпараметрическими распределениями. Кроме того, различия в коэффициентах асимметрии гидрологических ря­ дов в большей мере сказываются на виде аналитической функции, чем различия, связанные с выбором различных схем распределения.

Таким образом, если исходить из приведенных выше условий, то в качестве теоретической функции может быть использовано рас­ пределение Крицкого и Менкеля. В этом случае применение крите­ риев согласия ограничивается, очевидно, испытанием только этого распределения.

Если же иметь в виду возможность применения двухпараметри­ ческих распределений для описания определенных классов гидро­

логических явлений (Q Cp, QuiaKCi Q mhh и др.), то тогда целесообразно

использовать

критерии согласия

гидрологических характеристик

к различным

двухпараметрическим распределениям. И

если при

этом окажется,

что некоторые из

этих распределений

находятся

в соответствии

с эмпирическими данными, то тогда, им целесооб­

разно отдать предпочтение как наиболее простым по сравнению с трехпараметрическими распределениями. Исследования в таком плане нельзя считать завершенными, несмотря на проделанную ра­ боту в этом направлении.

Наиболее обстоятельное исследование соответствия многолетних данных речного стока и осадков теоретическим функциям распре­ деления проведено Крицким и Менкелем [83] с помощью критерия согласия %2. В работе [83] устанавливается, что данные годового и

максимального стока рек, а также максимальные суточные осадки могут считаться согласующимися с используемыми при их обобще­ нии теоретическими функциями распределения.

Р. Д. Марковик [156] изучал соответствие аналитических функ­ ций распределения (нормальной, логарифмически-нормальной с 2 и 3 параметрами, гамма-распределения с 2 и 3 параметрами) дан­ ным о годовом стоке и годовых осадках и пришел к следующему выводу: «Все пять изученных вероятностных функций пригодны, н ни одна из них не является более приемлемой, чем другие, при ана­ лизе распределения величин среднегодовых осадков и стока». Этот вывод не является достаточно убедительным, по крайней мере для нормального закона распределения, так как в настоящее время общепризнана асимметричность рядов годового стока.

Л. Ш. Резниковский и другие [37] исследовали соответствие рас­ пределения Пирсона III типа и логарифмически-нормального эмпи­ рическим функциям распределения годового стока. При этом ис­ пользовались критерий согласия %2 и критерий Колмогорова.

В результате был сделан вывод о возможности использования рас­ сматриваемых законов распределения при описании годовых объ­ емов стока.

Таким образом, по Резниковскому, отдать предпочтение какомулибо закону распределения при описании годового стока не пред­ ставляется возможным. В подобных случаях решающим факто­ ром при выборе функции распределения должна быть принята во

245

внимание простота расчетной схемы и по возможности физическое обоснование с установлением соответствия пределов колебаний случайной переменной и теоретической функции распределения.

При использовании критериев согласия (так же как и критериев однородности и случайности) выдвигается нуль-гипотеза и альтер­ нативная гипотеза, назначается уровень значимости и область до­ верия и, наконец, принимается решение. В качестве нуль-гипотезы принимается условие соответствия теоретической функции распре­ деления эмпирической, а альтернативная гипотеза заключается 6 несогласии этих функций.

Для установления соответствия эмпирических данных принятой аналитической кривой распределения используются различные ста­ тистики, законы распределения которых известны, если справедлива нуль-гипотеза. В качестве таких статистик, например, может быть принята сумма расхождений между эмпирическими и аналитиче­ скими вероятностями или наибольшее расхождение между эмпири­ ческими и аналитическими обеспеченностями и др.

Далее решается вопрос, чем может быть объяснено расхождение (численное значение критерия) между эмпирическими данными и принятой аналитической функцией распределения. Если это расхо­ ждение объясняется случайными флуктуациями выборочных дан­ ных, в этом случае принимается соответствие эмпирической функ­ ции распределения аналитической; если это расхождение настолько велико, что нуль-гипотеза не может быть принята, то принимается альтернативная гипотеза, т. е. гипотеза несоответствия эмпириче­ ского распределения принятому теоретическому.

Окончательное суждение по этому вопросу устанавливается на основании расчета вероятности появления данной статистики в пред­ положении, что нуль-гипотеза верна. Если эта вероятность доста­ точно велика или, что то же самое, значение критерия попадает в область доверия при принятом уровне значимости, то признается нуль-гипотеза, в противном случае она опровергается. Более же точ­ ная формулировка заключается в том, что нуль-гипотеза не опро­ вергается, если значение критерия попадает в доверительную об­ ласть, в то время как альтернативная гипотеза может быть приз­ нана, если значение критерия попадает в критическую область.

Из числа критериев согласия, которые уже применяются в ги­ дрологических исследованиях и которые могут быть рекомендованы для дальнейшего использования, рассмотрим критерии согласия ./2, Колмогорова и «со2.

критерий х2

В качестве меры расхождения в данном критерии согласия используется сопоставление сгруппированных эмпирических вероят­ ностей с вероятностями принятого теоретического закона распреде­ ления. Поэтому применение критерия при малом объеме стати­ стической совокупности может привести к неправильным заключе­ ниям, так как группирование эмпирических данных при небольших

2 4 6

выборках осуществляется недостаточно точно. Ряды наблюдений за различными характеристиками гидрологического режима (QMnн>

Q-макс. Qcp и др.), как правило, не превышают нескольких десятков лет. Это ограничивает возможность использования рассматривае­ мого критерия для оценки согласия таких рядов с принятой теоре­ тической функцией распределения.

В случае выборок небольшого объема критерий х2 является не­ чувствительным, если нулевая гипотеза неверна, т. е. использование рассматриваемого критерия при малом объеме выборок может при­ вести к тому, что нулевая гипотеза может быть признана даже для нескольких распределений, существенно различных между собой. Для выборок же достаточно большого объема, наоборот, данный критерий почти всегда опровергает нулевую гипотезу, не позволяет принять ни одно распределение в качестве приемлемой модели для эмпирических данных. В какой-то мере этот недостаток может быть компенсирован назначением различного уровня значимости в зави­ симости от объема исходных выборок, т. е. с увеличением объема эмпирического материала необходимо уменьшать уровень значимо­ сти. Сопоставимые результаты с использованием критерия %2 могут быть получены при рядах одинаковой длительности.

Особенно полезно использовать критерий х2> когда на одном и том же материале проверяется несколько теоретических функций распределения. Главное преимущество критерия х2 заключается

в том, что он может использоваться для оценки согласия эмпириче­ ских данных с любым законом распределения.

Вкачестве меры расхождения между эмпирическими данными

итеоретической функцией распределения используется выражение

*( р ' р . ) *

i=i

Р-1

(4 -3 1 >

где Р* — эмпирические вероятности

в i-той

 

градации; Pi — теоре­

тические вероятности попадания случайной переменной в г'-тую гра­ дацию; N — объем совокупности; k — число градаций.

К. Пирсон показал, что закон распределения х2 не зависит от вида исходного распределения при достаточно большом N, а зави­ сит лишь от числа степеней свободы l= k г — 1, где г — число сво­

бодно назначаемых параметров.

Таблица распределения х2 приведена, например, в работе [89]. Критерий х2 представляет собой односторонний критерий, по­ скольку большие значения х2 позволяют признать альтернативную гипотезу, утверждающую несоответствие эмпирических данных при­ нимаемой теоретической функции распределения. Слишком же ма­ лые значения %2 указывают на необходимость дополнительного кри­ тического анализа исходных данных, обратив при этом особое вни­

мание на их случайность.

Оценим соответствие эмпирического распределения годового стока р. Невы у г. Петрокрепости трехпараметрическому гамма-рас­ пределению с использованием критерия х2-

247

На рис. 4.8 представлена интегральная кривая распределения (кривая обеспеченности) модульных коэффициентов годового стока в рассматриваемом створе и принятая теоретическая функция рас­

пределения. Параметры распределения (х = 9,12; = 0,171;

Cs =

= 0,16) определены методом моментов. Как видно на рис. 4.8,

отме­

чается вполне удовлетворительная сходимость эмпирической и ана­ литической кривых распределения.

При использовании критерия %2 необходимо представить стати­ стическую совокупность в сгруппированном виде. Причем, это груп­ пирование можно осуществить с равномерными и неравномерными интервалами так, чтобы и количество интервалов было бы не слиш­ ком мало, и число попадания случайной переменной в каждый ин­ тервал было бы достаточно велико. Рекомендации по выбору числа интервалов в зависимости от объема исходной совокупности при­

ведены в главе I.

х2при 5%-ном уровне значимости

При использовании критерия

в работе Е. С. Кипинга [137] рекомендуется назначать оптимальное число градаций около 20 при объеме выборок от 200 до 400 членов, около 30 при объеме выборок в 1000 членов и около 8—9 при объеме выборок в 50 членов. При этом отмечается, что объем выборок в по­ следнем случае слишком мал для обоснованного использования критерия х2-

При использовании данного критерия целесообразно выбирать неравномерные интервалы так, чтобы теоретическая вероятность попадания случайной переменной в каждый интервал была посто­ янная. Назначим число интервалов равным 10. Тогда границы ин­ тервалов легко определятся исходя из принятой теоретической кри­ вой обеспеченности. Для этой цели разбиваем весь интервал обес­ печенностей (100%) на десять равных частей (число интервалов). По кривой обеспеченности для вероятностей превышения 10%, 20%....... 90% получаем границы интервалов на оси модульных ко­ эффициентов. Так, для первого интервала (вероятность превыше­ ния от 0 до 10%) верхняя граница будет равна бесконечности, так как функция распределения не ограничена сверху, а нижняя гра­ ница равна 1,22, для второго интервала (вероятность превышения от 10 до 20%) верхняя граница равна нижней границе первого ин­ тервала, а нижняя равна 1,14 и т. д.

Если случайная переменная попадает на границу интервала, ее условно всегда относят к верхнему интервалу.

Расчет исходных данных для определения критерия согласия х2 дан в табл. 4.18; в графе 2 приведены границы интервалов, в графе 3 — эмпирическое число случаев попадания расходов воды в каж­ дый интервал, и, наконец, в графе 4 — квадраты эмпирических чи­ сел случаев попадания расходов воды в интервал. Теоретическое число случаев попадания расходов воды в каждый интервал опре­ деляется по выражению

N k

248

cv

Рис. 4.8. Кривая обеспеченности модульных коэффициентов годового стока р. Невы у г. Петрокрепости,

/ — э м п и р и ч е с к и е д а н н ы е : 2 — р а с п р е д е л е н и е К р и ц к о г о — М е н к е л я ,

Соседние файлы в папке книги из ГПНТБ