
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfанализа и опирается на более разработанный математический аппарат.
В дальнейших исследованиях при описании многолетних колеба ний речного стока широко используется теория случайных функ ций (теория вероятностных процессов). К числу наиболее капи тальных исследований этого направления следует отнести моно графии Н. А. Картвелишвили [61], Д. И. Казакевича [56] и Г. А. Алексеева [9].
В последнее время уделяется большое внимание исследованию пространственно-временных колебаний различных характеристик гидрологического режима. Эти исследования опираются на теорию однородных изотропных полей. Результаты анализа привлекаются для решения задачи интерполяции значений гидрологических вели чин по территории для разработки объективных критериев разме щения сети гидрологических станций и постов, для оценки точно сти определения гидрологических величин. В качестве статистиче ской основы в этих исследованиях используются пространственные корреляционные функции. Наиболее полное изложение этих вопро сов имеется в монографии Г. А. Алексеева [9].
глава I
начальные сведения
из теории вероятностей
и математической статистики
§ 1
исходные положения, лежащие в основе применения методов теории вероятностей и математической статистики в гидрологии
Методы теории вероятностей и математической статистики ис пользуются в различных областях гидрологии. Однако наиболее широкое применение они получили при расчетах и прогнозах ха рактеристик речного стока.
При разработке проектов регулирования стока, при проектиро вании и эксплуатации гидротехнических сооружений, оросительных систем, мостовых переходов и при осуществлении других инженер ных мероприятий, связанных с использованием водных ресурсов, требуется количественно оценивать параметры речного стока, из меняющиеся во времени и по территории. Имеется в виду необхо димость определения величин средних годовых, максимальных и минимальных расходов воды, распределения стока внутри года, величины стока наносов и т. д.
Принимаемые для проектных разработок величины должны ха рактеризовать гидрологический режим используемого водного объекта на будущее — на период эксплуатации водохозяйственной установки, исчисляемый десятками и сотнями лет.
■ Очевидно, что суждение о возможных значениях в будущем тех или иных параметров гидрологического режима можно получить, лишь опираясь на материалы уже проведенных гидрометрических измерений за достаточно длительный период. При этом принци пиально возможно использовать три направления.
21
Первое из них заключается в детерминированном определении интересующей нас величины, при этом используются связи стока с обусловливающими его факторами.
Второе направление основано на совместном использовании ге нетических и статистических закономерностей, свойственных реч ному стоку и определяющим его факторам.
Третий путь связывается с непосредственным использованием статистических закономерностей, проявляющихся в рядах гидроло гических величин.
Прогностические построения, основанные на использовании ге нетических связей (первое направление), при современном разви тии гидрологии позволяют устанавливать величины гидрологиче ских характеристик с заблаговременностью, не превышающей нескольких месяцев. Причем точность таких оценок резко умень шается с увеличением заблаговременности прогноза.
Возможность прогностических построений некоторые исследова тели пытались установить, рассматривая ряды гидрологических величин как периодическую функцию времени. Основой такого представления о стоке является в первую очередь внутригодовой цикл изменения водности, т. е. чередование различных фаз стока, повторяющееся каждый год в одинаковой последовательности и в относительно мало смещающиеся моменты времени. Однако на личием годового цикла явление изменчивости стока не исчерпыва ется, поэтому в качестве второй причины этих изменений привлека ется представление о циклических колебаниях солнечной активно сти и других геофизических процессов. Полученные к настоящему времени в этой области результаты свидетельствуют, что еще не достигнуто решение вопроса о том, в какой степени гидрологиче ские величины являются определенными функциями времени и каким образом вид последних может быть установлен на основании материалов наблюдений.
Таким образом, следует считаться с тем обстоятельством, что установление хронологического хода какой-либо гидрологической характеристики на период, исчисляемый десятилетиями, в настоя щее время является неразрешенной задачей. Тем не менее, прог нозы гидрологических характеристик с меньшей заблаговремен ностью являются весьма важными, поскольку процесс эксплуата ции водохозяйственных установок они позволяют увязывать с ожидаемыми конкретными условиями водного режима. Прогно стические рекомендации также широко используются при планиро вании многих других хозяйственных мероприятий.
Совместное использование генетических зависимостей, связы вающих величины речного стока с определяющими его факторами, и статистических оценок параметров и аргументов этих связей является принципиально наиболее перспективным путем решения рассматриваемой задачи. Однако вследствие малой надежности генетических уравнений связи и слабой разработанности метода статистической композиции использование этого направления огра ничено. Наиболее часто оно применяется для расчета характери
22
стик стока (в частности, максимальных и минимальных расходов воды различной обеспеченности) рек, не изученных в гидромет рическом отношении. При этом обеспеченность главного аргу мента связи и искомой величины принимается одинаковой, т. е. используется простейшая форма установления обеспеченности функции.
В современных условиях превалирующее значение приобрели приемы оценок расчетных значений гидрологических величин, опи рающиеся на статистические закономерности, свойственные рядам гидрологических величин. Возможность использования такого пути для получения расчетных значений параметров гидрологического режима опирается на гипотезу о том, что ряды рассматриваемых величин формируются как случайные совокупности.
Принятие гипотезы о подчинении колебаний гидрологических величин закономерностям колебаний, свойственным случайным числам, означает, что привязка ко времени появления той или иной величины (например, в наблюдаемой последовательности) оказывается несущественной, случайной. Для описания свойств совокупностей таких величин используется путь, связанный с изу чением существующих закономерностей в повторяемости различ ных значений этих величин в пределах достаточно большой сово купности.
Это положение о случайном характере формирования гидроло гических рядов не может быть полностью доказано теоретически, однако применительно к рядам речного стока (годового, макси мального) оно неоднократно подвергалось проверке путем оценки соответствия эмпирических кривых обеспеченностей стока теорети ческим схемам.
Результаты такого анализа, рассматриваемые в главе IV, сви детельствуют о правомерности использования статистического на правления в качестве основы многих приемов гидрологических расчетов.
Теоретическими положениями, привлекаемыми для обоснования возможности рассматривать ряды различных гидрологических вели чин как совокупности случайных событий, являются так называе мые предельные теоремы теории вероятностей.
Одно из фундаментальных положений этих |
теорем |
сводится |
к закону больших чисел, согласно которому при |
очень |
большом |
числе случайных однородных явлений средний их результат прак тически перестает быть случайным и может быть предсказан с большой степенью определенности.
Указанное свойство случайных явлений проявляется достаточно отчетливо и в рядах гидрологических величин в том смысле, что по мере увеличения числа членов совокупности кривая обеспечен ности получает устойчивое очертание. Конкретные примеры по этому вопросу приведены в главе V.
Второе положение сводится к так называемой центральной предельной теореме, согласно которой явления (события), возника
ющие под воздействием суммы или произведения большого числа
23
независимых (слабо зависимых) случайных факторов, образуют случайную совокупность, подчиняющуюся определенным статисти ческим законам.
Очевидно, что многие гидрологические явления могут рас сматриваться как удовлетворяющие этой схеме.
Действительно, рассматривая условия формирования какойлибо гидрологической характеристики, например максимального расхода воды весеннего половодья, можно легко установить, что возникновение этого явления происходит ежегодно в форме опре деленной детерминированной закономерности. Однако величина максимального расхода воды в данном конкретном году формиру ется под влиянием очень большого числа факторов, определяющих величину запасов воды в снеге, степень увлажненности водосбора, количество осадков, выпадающих в виде дождей в период форми рования максимального расхода воды, хода интенсивности снего таяния и т. д. Под воздействием указанных и иных причин прояв ление в данном конкретном году известной закономерности приобретает уже форму случайного события.
Опираясь на указанные статистические положения, следует иметь в виду, что они предполагают отсутствие односторонних из менений в условиях формирования рассматриваемого гидрологиче ского явления или сохранение относительной устойчивости средних значений рассматриваемой величины в пределах каждой достаточно большой совокупности (в частности, за каждое n-летие достаточ ной длительности). Если условия формирования меняются одно
значно, например под |
влиянием хозяйственной деятельности, |
|
в величины |
гидрологических характеристик, полученных после |
|
указанных |
воздействий, |
должны быть введены соответствующие |
коррективы. Очевидно, что указанные коррективы имеет смысл осу ществлять, если те или иные односторонние изменения в условиях формирования столь значительны, что сказываются на величинах рассматриваемых гидрологических параметров в размерах, выхо дящих за пределы точности расчета.
Считая положение среднего уровня неизменным, исходят из того, что выводы, получаемые на основе анализа имеющихся рядов гидрологических величин, относятся к современной геологической и климатической эпохе, поскольку изменения, связанные с геологи ческой историей земли (и соответствующие изменения климата), осуществляются в периоды, далеко превосходящие отрезки времени, рассматриваемые в инженерных расчетах. Поэтому имеющийся ряд фактических измерений рассматривается как некая выборка из генеральной совокупности, включающей теоретически бесконечно
большое число величин интересующей нас гидрологической харак теристики. При этом имеющаяся выборка должна быть репрезен тативной, т. е. достаточно представительной для всей генеральной совокупности. Иначе говоря, она должна достаточно полно осве щать многоводные, маловодные и средние по водности годы, если рассматривать характеристики речного стока. Аналогичным обра зом должны быть сформированы и ряды иных гидрологических
.24
величин, для оценки которых привлекаются методы теории вероят ностей.
Следующим важным условием применимости методов теории вероятностей в гидрологии является требование соблюдения одно родности включенных в одну совокупность гидрологических величин. В частности (применительно к характеристикам речного стока), это выражается прежде всего в отборе генетически одно родных величин стока (расходов воды), включенных в одну совокупность. Показателем такой однородности может служить принадлежность рассматриваемых величин стока к одной фазе внутригодового цикла изменения водности. В этом смысле иногда используется понятие о фазовооднородных расходах воды. Вслед ствие колебания по годам дат начала и окончания различных фаз внутригодового цикла выборка указанных фазовооднородных вели чин стока не может быть жестко связана с этими датами, а осуще ствляется, исходя из оценки их генетической однородности, по существу.
Так, к генетически однородным относят максимальные расходы воды весеннего половодья, дождевые паводки, объемы стока за одинаковые фазы года (весна, межень), годовые величины суммар ного стока и его различных частей (поверхностного, подземного) и т. д.
§ 2
простейшие способы обобщения статистических данных
Результаты гидрологических измерений и наблюдений могут быть представлены в табличном, графическом или аналитическом видах.
Многочисленные примеры можно найти в Гидрологических ежегодниках, в монографиях «Ресурсы поверхностных вод СССР» и других изданиях, в которых представлены данные об элементах гидрологического режима рек с различной степенью их обобщения. Сводки этих данных уже сами по себе являются примером описа тельной статистики. Часто основная исходная информация заклю чена в громоздких по объему таблицах. В этом случае использо
вание ее в чистом виде |
при |
исследовании |
многих гидрологиче |
|
ских вопросов оказывается |
затруднительным. Поэтому |
издавна |
||
применяются различные |
способы обобщения |
исходной |
цифровой |
информации (вычисление средних величин, сводка экстремальных значений по тому или иному элементу гидрологического режима
И др.).
Более полное и вместе с тем более компактное представление данных гидрологических наблюдений может быть осуществлено на основании использования методов математической статистики, ко торая является наукой количественного анализа массовых явлений, учитывающих одновременно и качественное их своеобразие.
25
Рассмотрим несколько примеров, иллюстрирующих приемы, используемые при статистической обработке гидрологических дан ных, и одновременно введем некоторые статистические понятия и определения.
Таблица 1.1
Среднегодовые расходы воды р. Днепра у пгт Лоцманской Каменки
Год |
Q |
Год |
Q |
Геи |
Q |
Год |
Q |
1818 |
1480 |
1855 |
1900 |
1891 |
1470 |
1927 |
1730 |
1819 |
1600 |
1856 |
1500 |
1892 |
1120 |
1928 |
1840 |
1820 |
2400 |
1857 |
1300 |
1893 |
1820 |
1929 |
1910 |
1821 |
1740 |
1858 |
1400 |
1894 |
1460 |
1930 |
1180 |
1822 |
1370 |
1859 |
1000 |
1895 |
2420 |
1931 |
2480 |
1823 |
1200 |
1860 |
1800 |
1896 |
1990 |
1932 |
2620 |
1824 |
1150 |
1861 |
2400 |
1897 |
1590 |
1933 |
2630 |
1825 |
1800 |
1862 |
1400 |
1898 |
1190 |
1934 |
1860 |
1826 |
1200 |
1863 |
900 |
1899 |
1220 |
1935 |
1620 |
1827 |
1300 |
1864 |
1000 |
1900 |
1670 |
1936 |
1560 |
1828 |
2080 |
1865 |
1700 |
1901 |
1320 |
1937 |
1620 |
1829 |
2500 |
1866 |
1600 |
1902 |
1690 |
1938 |
1490 |
1830 |
2100 |
1867 |
2000 |
1903 |
1620 |
1939 |
1080 |
1831 |
2060 |
1868 |
2000 |
1904 |
1080 |
1940 |
1680 |
1832 |
1550 |
1869 |
1200 |
1905 |
1740 |
1941 |
2300 |
1833 |
1340 |
1870 |
1400 |
1906 |
2060 |
1942 |
2470 |
1834 |
1750 |
1871 |
2000 |
1907 |
2100 |
1943 |
1010 |
1835 |
1000 |
1872 |
1780 |
1908 |
2220 |
1944 |
1380 |
1836 |
1030 |
1873 |
1100 |
1909 |
1700 |
1945 |
1480 |
1837 |
1680 |
1874 |
1520 |
1910 |
1160 |
1946 |
1310 |
1838 |
1940 |
1875 |
900 |
1911 |
1310 |
1947 |
1530 |
1839 |
1540 |
1876 |
2100 |
1912 |
1890 |
1948 |
1660 |
1840 |
1930 |
1877 |
3040 |
1913 |
1800 |
1949 |
1290 |
1841 |
1930 |
1878 |
1960 |
1914 |
1610 |
1950 |
1060 |
1842 |
870 |
1879 |
2450 |
1915 |
1820 |
1951 |
1480 |
1843 |
1100 |
1880 |
1640 |
1916 |
2050 |
1952 |
1240 |
1844 |
2000 |
1881 |
1670 |
1917 |
2400 |
1953 |
1970 |
1845 |
3000 |
1882 |
1060 |
1918 |
1300 |
1954 |
874 |
1846 |
1000 |
1883 |
2070 |
1919 |
1910 |
1955 |
1520 |
1847 |
1400 |
1884 |
1340 |
1920 |
1480 |
1956 |
1740 |
1848 |
1200 |
1885 |
1160 |
1921 |
717 |
1957 |
1500 |
1849 |
2400 |
1886 |
1550 |
1922 |
1730 |
1958 |
2420 |
1850 |
1800 |
1887 |
1330 |
1923 |
1710 |
1959 |
1320 |
1851 |
1740 |
1888 |
2060 |
1924 |
1820 |
1960 |
1250 |
1852 |
1650 |
1889 |
1940 |
1925 |
874 |
1961 |
„ 1330 |
1853 |
2100 |
1890 |
1250 |
1926 |
1890 |
1962 |
1510 |
1854 |
1800 |
|
|
|
|
|
|
В табл. 1.1 представлены результаты наблюдений за средне годовым стоком р. Днепра в створе у пгт Лоцманской Каменки с 1818 по 1962 г. Для лучшей обозримости результатов наблюде ний и для более удобного их представления при дальнейшей обра ботке исходные данные обычно сводятся в сгруппированные таблицы. Для этой цели из табл. 1.1 выбираются наибольшее
26
(QiviaKc) и наименьшее (Qmhh) значения расходов и вычисляется между ними разность (R), которая называется амплитудой, или
размахом варьирования,
R = С?макс — Qmhh= 3040 — 717=2323 м3/с.
Общую амплитуду колебания случайной величины можно раз делить на отдельные части, за границы между которыми прини маются некоторые характерные точки (величины) ряда. Так, деля ряд случайных величин, расположенных в убывающем порядке, на четыре части, выделяют квартили: верхнюю, или первую, представ
ляющую то значение переменной, ниже которой находится 3Д чи сла членов совокупности, вторую, занимающую положение по се редине ряда, и нижнюю, или третью, ниже которой находится iU
членов совокупности. Нередко осуществляют более дробное деление амплитуды на части, выделяя ее десятые доли. Значения случай
ных величин, располагающихся на этих границах, именуют деци-
лями.
В общем случае принимая статистическую совокупность как не прерывно распределенную в пределах всей амплитуды, имеется воз можность рассматривать любые участки этой совокупности, заклю ченные между произвольно назначенными границами. В этом слу чае любые (в том числе и вышеуказанные) значения переменной, принимаемые за определенные характерные (по условиям задачи) точки, именуют квантилями.
Полученную амплитуду можно разбить на интервалы, или гра дации, н подсчитать число попаданий варьирующего признака (рас ходы воды) в каждую градацию. Эти интервалы могут быть равные и неравные по величине. В гидрологии чаще используются равные по величине градации. Число градаций обычно назначается в зави симости от объема рассматриваемого материала так, чтобы отра зить типичные черты рассматриваемого ряда наблюдений. При этом с увеличением длины интервала число попаданий исследуемой пере менной в каждый интервал будет возрастать, что увеличивает ста тистическую надежность представляемого материала. Но при не большом объеме наблюдений и при большой длине интервала число градаций будет небольшое, и тем самым могут оказаться снивели рованными типичные черты того или иного ряда наблюдений. При уменьшении длины интервала число попаданий в них будет умень шаться и возникает опасность появления закономерностей, не свой ственных данному статистическому ряду. Для грубой оценки числа
интервалов иногда используют |
эмпирические |
формулы, |
напри |
мер tix^ b \g N , где пх — число |
интервалов; |
N — общий |
объем |
наблюдений.
Заметим, что подобные формулы не представляют общего пра вила и поэтому могут рассматриваться лишь в самом первом при ближении, когда никакой дополнительной информации, кроме ис следуемого ряда наблюдений, не имеется и когда объем исходных данных не слишком большой и не слишком малый. При малом объеме статистических данных группирование по интервалам
27
вообще становится невыполнимой задачей. А при очень большом числе наблюдений применение указанной формулы может привести к избыточно большому числу градаций, что увеличивает объем рас четов. Выбранные градации не должны перекрываться, чтобы одно и то же значение ряда наблюдений не могло попасть в две града ции. Если наблюденная величина попадает на границу градации, то ее условно относят к большей градации.
Применительно к рассматриваемому примеру назначим в соот ветствии с отмеченными выше общими соображениями 12 равных по величине градаций и подсчитаем число случаев попадания рас
хода |
воды в каждую градацию. |
Результаты |
расчетов |
сведем |
||||
в табл. 1.2, в головке которой даны градации, |
а в строке 1— число |
|||||||
|
|
Таблица |
1.2 |
|
|
|
|
|
Сгруппированные данные годового стока р. |
Днепра у пгт Лоцманской Каменки |
|||||||
№ |
|
|
|
И нтервал расходов, |
м 3/с |
|
|
|
Х ар актер и с ти к а |
|
|
|
|
|
|
|
|
п /п |
|
|
|
|
|
|
|
|
|
3099—2900 |
2899—2700 |
2699-2500 |
2499 -2300 |
2299—2100 |
2099— 1900 |
||
|
|
|||||||
1 |
Повторяемость |
2 |
0 |
3 |
10 |
|
5 |
20 |
|
(число случаев) |
|
||||||
2 |
п |
|
|
|
|
|
|
|
Повторяемость |
1,38 |
0 |
2,07 |
6,90 |
3,45 |
13,80 |
||
3 |
(%) |
|||||||
Обеспеченность |
2 |
2 |
5 |
15 |
|
20 |
40 |
|
4 |
(число случаев) |
|
||||||
Обеспеченность |
1,38 |
1,38 |
3,45 |
10,4 |
|
13,8 |
27,6 |
|
5 |
(%) |
|
||||||
Относительная |
0,007 |
0 |
0,010 |
0,034 |
0,017 |
0,069 |
||
.6 |
плотность |
|||||||
Абсолютная плот |
0,010 |
0 |
0,015 |
0,050 |
0,025 |
0,100 |
||
|
ность |
|||||||
№ |
|
|
И нтервал расходов, |
м 3/с |
|
|
||
Х ар актери сти к а |
|
|
|
|
|
|
|
|
П / П |
|
|
|
|
|
|
|
|
|
1899— 1700 |
1699—1500 |
1499-1300 |
1299-1100 |
1099-900 |
8 9 9 -7 0 0 |
||
|
|
|||||||
1 |
Повторяемость |
23 |
25 |
24 |
17 |
|
12 |
4 |
|
(число случаев) |
|
||||||
2 |
Повторяемость |
15,86 |
17,24 |
16,56 |
11,73 |
8,28 |
2,76 |
|
3 |
(%) |
|||||||
Обеспеченность |
63 |
88 |
112 |
129 |
|
141 |
145 |
|
4 |
(число случаев) |
|
||||||
Обеспеченность |
43,5 |
60,7 |
77,3 |
89,0 |
|
97,3 |
100' |
|
5 |
(%) |
|
||||||
Относительная |
0,079 |
0,086 |
0,083 |
0,059 |
0,041 |
0,014 |
||
6 |
плотность |
|||||||
Абсолютная |
0,115 |
0,125 |
0,120 |
0,085 |
0,060 |
0,020 |
||
|
плотность |
случаев попадания расхода воды в каждую градацию. Очевидно, что сумма случаев по всем градациям равна общему числу лет на блюдений. Составленная таким образом таблица называется табли цей эмпирического распределения, или таблицей абсолютных ча
стот. Выражая абсолютные частоты в процентах от общего числа случаев, получаем распределение относительных частот (строка 2 табл. 1.2), последовательно суммируя которые, получаем абсолют ные и относительные накопленные частоты (строки 3 и 4 табл. 1.2).
а м 3/с
Рис. |
1.1. Гистограмма распределения и кривая накопленных |
частот |
||
|
годового стока р. Днепра у пгт Лоцманской Каменки. |
|
||
Сумма |
относительных частот равна 100%, |
что может |
использо |
|
ваться |
при проверке правильности расчетов. |
Данные |
табл. 1.2 по |
|
казывают, что наиболее часто среднегодовые расходы |
воды р. Дне |
пра у пгт Лоцманской Каменки наблюдаются в диапазоне 1500— 1700 м3/с; с уменьшением и увеличением расходов воды число случаев закономерно уменьшается, не считая отдельных отклоне ний от этого правила, которые могут быть отнесены к случайным колебаниям (флуктуация).
Данные табл. 1.2 можно представить в виде графика (рис. 1.1), на котором по оси ординат отложены принятые градации расходов воды, а по оси абсцисс в виде прямоугольников — относительные частоты. Здесь же в форме плавной кривой показано нарастание от носительных частот. Нарастающая сумма частот относится к боль шему значению каждого интервала.
Полученный график относительных частот называется гисто граммой, а график относительных накопленных частот — огивой, или кумулятивной кривой. Табличное и графическое изображение частот называется- эмпирическим распределением, в данном случае
годового стока р. Днепра у пгт Лоцманской Каменки.
29