
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfдля значений обеспеченности р* = 100— р и при положительном значении коэффициента асимметрии С* = | Cs I. В соответствии с по
следним выражением ординаты биномиальной кривой обеспеченно сти вычисляются по формуле
x p= x —atp*. |
(3.31) |
Из условия совпадения кривой обеспеченности с тремя опорными точками эмпирической кривой обеспеченности хь, х50, *95 получаем
следующие три уравнения:
|
X |
5===-^5» |
|
(3.32) |
|
X |
Oj^so= Х5о, |
|
(3.33) |
|
X |
°jr^5===*^9o* |
|
(3.34) |
Решая эту систему, найдем соотношение между коэффициентами |
||||
скошенности и асимметрии |
|
|
|
|
£ * — . __ о |
2 х 53 — -Г5 — -*-'95 |
^ 5 ~ Ь ^ 9 5 ~ 2 ^ |50 |
(3.35) |
|
|
Х ь — * 9 5 |
'9 5 |
||
|
|
Далее находим формулы для определения среднего квадратиче ского отклонения и среднего значения:
* 5 — * 9 5 |
(3.36) |
|
tb— hb |
||
|
||
Л'—Хт~тах^'о0‘ |
(3.37) |
Установив указанным образом параметры статистической сово купности и используя таблицу биномиальной кривой обеспеченно сти, легко подсчитать величины различной обеспеченности.
Применительно к логарифмически-нормальному закону распре
деления графоаналитический способ определения параметров осно ван на следующих положениях.
Как показано в § 9 главы II, асимметричный закон распределе ния вероятностей xP = f(p) можно трансформировать в нормальный
закон распределения zv = F(p) путем |
логарифмического |
преобра |
зования функции величин исходного ряда по соотношению |
|
|
y = lg z, |
■ |
(3.38) |
где z —x — а. Для осуществления такого преобразования необхо
димо определить величину параметра а, использование которого позволит на клетчатке вероятностей нормального закона распреде ления представить асимметричное распределение в виде прямой.
В качестве простейшего элементарного приема для определения
180
величины а можно использовать способ подбора этого параметра,
исходя из условия спрямления эмпирической кривой обеспеченности
Р(хт- а ) = ;г~- °.3- • 100%, |
(3.39} |
на клетчатке вероятностей логарифмически-нормального распреде ления. Эта клетчатка, как показано ранее, имеет логарифмическую шкалу ординат у = lg (x — а) и шкалу нормального закона распре деления по оси абсцисс tp = f(p). Эта шкала соответствует таблице
нормированных отклонений от среднего значения
*р= |
'V/Vy У (при S |
= 0 )- |
(3-40) |
|
Здесь оу — среднее |
квадратическое |
отклонение |
наблюденных |
|
значений yi = \g(xi— a), |
(/2 = lg (х2 |
— а), |
..., yn= \g(xn — а) от их |
|
средней величины у, равной |
|
|
|
|
y = - ^ - 2 y = y 5 0 |
= l g ( * B 0 - a ) . |
(3-41> |
Величина у совпадает в данном случае с медианной величиной (/so, поскольку новая статистическая переменная у подчиняется нор
мальному закону распределения.
Из выражения (3.40) следует, что в координатах у Р и tp лога-
рифмически-нормальная кривая распределения выражается урав нением прямой
Ур—Уво+Зу^,. (3.42)
Очевидно, что уравнение (3.42) относительно исходной перемен
ной х запишется в виде |
|
lg С*р - а) = lg (*5о - а) -Н Л . |
(3.43) |
Приведенные распределения, и в частности уравнение (3.43), позволяют, не применяя способа подбора, однозначно решить за дачу о назначении параметра а с помощью трех опорных ординат А’г,%’ л’5о% А95%' снятых со сглаженной эмпирической кривой обес печенности xP — f(p). Для этого уравнение (3.43) запишем относи
тельно указанных опорных ординат:
lg(*8 —o )= lg (* so -« ) + |
VB* |
(3.44) |
lg (-*95 — а ) = lg (х30 —a) + |
а / дз. |
(3.45) |
Сложив левые и правые части приведенных уравнений и приняв во внимание, что ^5=1,64, t95= — 1,64, для нормального закона рас
пределения получим
lg (*s - a) f lg (х95 - a)= 2 lg (*„ - a)
181
или
а — |
* 5 * 9 5 - * 6 0 |
(3.46) |
|
+ * 9 5 — 2х50 |
|||
* 5 |
|
Для определения параметров статистического ряда переменной х можно воспользоваться однозначной функциональной зависи мостью между коэффициентом асимметрии CSx и коэффициентом
скошенности логарифмически-нормальной кривой распределения
у __ *5 + *95 ~ 2-*50 |
*5+*95-24‘ 50 |
*5 ~ *95 |
U - t ,95 |
где t'a, t'5Q, t' — нормированные отклонения от среднего значения
х ординат соответственно 5, 50 и 95%-ной обеспеченности при рас сматриваемом значении коэффициента асимметрии Csx для лога
рифмически-нормальной кривой. По известному коэффициенту ско шенности S, вычисленному по трем опорным ординатам Х 5, *5 0, *9 5.
по таблице, приведенной в работе [9], определяется коэффициент
асимметрии. Два других стандартных параметра ах и х определя
ются аналогично тому, как это изложено выше применительно к би номиальной кривой распределения, по формулам:
* 5 — * 9 5 |
(3.47) |
|
*5 — *95 |
||
|
||
X-- *50 |
|
Необходимо отметить, что функции преобразования вида (3.38) и соответственно выражение (3.46) пригодны только для кривых распределения с положительной асимметрией. Преобразование кри вой распределения xP = f(p) с отрицательной асимметрией в нор
мальную кривую распределения достигается с помощью функции преобразования
y = i g ( 4 — «)• |
(3+8) |
При этом значению хР заданной обеспеченности Р% соответст вует значение у*р —ут-р с обеспеченностью Р* = 100— Р, равной
дополнению до 100%, т. е.
ytoo-p=lg ( д ^ - °)>
и наоборот,
182
В таком случае параметры а и ау определяются по формулам
|
1 |
1 |
|
а = |
*5*95 |
'50 |
(3.49) |
|
|
||
* 5 |
* 9 5 |
* 5 0 |
|
|
|
1 |
|
|
---------а |
|
|
0=0,304 l g — ^ -------- |
(3.50) |
||
|
--------а |
|
|
|
|
* 5 |
|
Спрямленная эмпирическая кривая обеспеченности |
|||
Р(Ут) = ^ § Г • Ю 0% |
|
||
строится по ряду убывающих значений |
|
||
Ут=lg f—— -------- fl) |
(т= 1, 2, . . |
п) |
|
\ хп - т + 1 |
/ |
|
|
на клетчатке вероятностей с равномерной шкалой ординат для зна чений ут или с логарифмической шкалой ординат для значений
1
-------------- а. *п—т+1
глава IV
статистическая проверка исходной гидрометеорологической информации в отношении гипотез однородности,
случайности и согласия
Применение теоретических кривых распределения для описания статистических совокупностей, строго говоря, возможно в том слу чае, если эти совокупности сформированы из качественно однород ных и независимых элементов. В связи с этим выяснение статисти ческой однородности изучаемых совокупностей и случайности фор мирования выборок выступает в качестве важного элемента оценки достоверности статистических обобщений.
Кроме указанного, при использовании теоретических кривых распределения необходимо достаточно четко представлять, на сколько полно принятая теоретическая схема согласуется с эмпири ческим материалом.
Изложение статистических приемов, позволяющих решать ука занные задачи, и составляет содержание настоящей главы.
§ 1
анализ однородности рядов гидрологических величин
1. общие сведения
Ряды гидрологических величин не представляют собой генераль ных совокупностей, а являются некоторыми случайными выборками из них. Поэтому непосредственно судить по этим рядам о принад лежности их к определенной генеральной совокупности невозможно.
184
В теории вероятностей известно много критериев однородности, используя которые можно определить однородность выборочных значений параметров распределения, в частности средних значений и дисперсий, или непосредственно установить принадлежность не скольких выборок к одной и той же генеральной совокупности. Не которые из этих критериев, рассматриваемых ниже, уже нашли применение в практике гидрологического анализа.
Отметим, что оценка статистической однородности рядов гидро логических величин приобретает особую сложность в связи с тем, что эта операция применительно к рассматриваемым выборкам во многих случаях становится недостаточно определенной.
Действительно, вследствие многофакторности большинства па раметров гидрологического режима часто бывает трудно отделить причины, нарушающие состояние однородности ряда наблюдений, от факторов, формирующих гидрологический ряд как совокупность случайных переменных.
Например, наибольший в году расход воды формируется, как указывалось ранее, под действием большого числа факторов, к чи слу которых, в частности, относится снежный покров, определяю щий сток весеннего половодья, и жидкие осадки, формирующие до ждевые паводки. При этом возникает естественный вопрос, следует ли для исследуемой реки снежный покров и жидкие осадки отнести к числу многих других факторов, под действием которых и форми руется случайный характер многолетних колебаний максимального весеннего стока, или, наоборот, каждый из этих факторов оказы вает в различные годы настолько сильное самостоятельное действие на исследуемое явление, что вызывает неоднородность в его форми ровании.
Впервом случае наибольшие расходы воды, независимо от ус ловий их формирования (дождевые паводки и весеннее половодье), образуют единую статистическую совокупность, а во втором случае следует отдельно рассматривать дождевые паводки и весеннее по ловодье как две самостоятельные статистические совокупности. При этом возникает вопрос, как использовать суммарную информацию, заключенную в этих двух самостоятельных совокупностях, если при проектировании гидротехнического сооружения необходимо учесть наибольший расход воды заданной обеспеченности независимо от условий его формирования (дождевые паводки или весеннее поло водье). Один из возможных приемов статистического описания по добных совокупностей рассмотрен в этой главе.
Внекоторых случаях оценка однородности данных гидрологи ческих наблюдений приобретает вполне самостоятельное значение. Примером такого рода задач может служить выбор пункта-аналога,
когда устанавливается однородность физико-географических и кли матических факторов стока на основании их качественного анализа на двух водосборах.
В других случаях следует оценить внутрирядную однород ность величин стока реки, когда она нарушена различными естественными или искусственными причинами, к числу которых
185
можно отнести, например, изменение естественного стока благодаря регулированию его водохранилищем. В качестве естественной при чины, нарушающей однородность ряда наблюдений, назовем влия ние бессточных микро- и макропонижений местности в зоне недо статочного увлажнения. Существенно важно выяснять степень однородности рядов стока, относящихся к разным рекам, при объ единении их в единый пространственно-временной статистиче ский ряд.
Во всех отмеченных выше примерах необходимо оценить одно родность различных гидрологических характеристик. В равной мере сказанное относится к тем случаям, когда на однородность анали зируются факторы, определяющие различные гидрологические ха рактеристики (осадки, испарение, температура воздуха и пр.). Часто анализ однородности осуществляется лишь на основании качествен ных оценок без использования объективных количественных крите риев. В ряде случаев этого бывает достаточно. Действительно, едва ли вызовет сомнение неоднородность ряда максимального стока до и после создания водохранилища, осуществляющего сезонное регу лирование стока. Что же касается влияния, регулирующего сток водохранилища, на годовой сток, то оно бесспорно будет меньшим. Возможно, в некоторых случаях, с практической точки зрения, го довой сток реки до и после создания ГЭС окажется однородным.
Когда физического анализа однородности тех или иных гидро логических характеристик или факторов, их обусловливающих, оказывается недостаточно, целесообразно использовать статистиче ские методы, которые позволяют оценить однородность исследуе мых рядов наблюдений также и в количественном выражении. Больше того, часто возникает необходимость оценить однородность гидрологических рядов, когда никакой информации об источниках, нарушающих состояние однородности, не имеется. В таких случаях статистические приемы анализа однородности эмпирического мате риала являются единственными. Больше того, с их помощью можно определить область, в которой целесообразно искать физическую причину, нарушающую однородность рядов наблюдений, и тем са мым помочь исследователю найти эту причину.
Может возникнуть и такая ситуация, когда физическая причина, нарушающая состояние однородности, известна, но неизвестно, до каких пор, с практической точки зрения, эту причину можно не учи тывать. На подобные вопросы также могут дать ответ статистиче ские приемы.
Таким образом, уже на рассмотренных примерах видно, что фи зический анализ и статистические приемы исследования однород ности вскрывают различными способами одни и те же закономерно сти (физические, статистические), свойственные тем или иным рядам наблюдений. Больше того, наиболее эффективным оказывается со вместное использование статистических и физических приемов ана лиза эмпирических данных при оценке их однородности, поскольку эти приемы обычно взаимно дополняют и уточняют друг друга. При исследовании однородности рядов наблюдений с физической точки
186
зрения часто могут быть сформулированы лишь качественные вы воды без каких бы то ни было количественных характеристик; ста тистические методы исследования однородности позволяют эти ка чественные выводы дополнить количественными оценками.
В качестве примера рассмотрим распределение высоты снежного покрова в лесу и в поле. Исходя из чисто физических представлений о формировании снежного покрова, можно прийти к выводу о том, что в среднем высота снежного покрова в лесу должна быть больше, а ее изменчивость меньше, чем в поле при прочих равных условиях. Действительно, результаты наблюдений подтверждают это предпо ложение. Однако насколько существенны эти расхождения, можно определить, используя статистические приемы анализа однородно сти. Кроме того, статистическая структура снежного покрова на больших пространствах внутри поля (или леса) также претерпевает изменения под влиянием, например, климатических факторов. Ста тистические приемы и в данном случае могут оказаться полезными при выделении однородных характеристик снежного покрова уже внутри поля (или леса).
Прежде чем перейти к статистическим методам анализа одно родности результатов наблюдений, остановимся на некоторых осо бенностях и ограничениях использования статистических крите риев однородности при гидрологических расчетах.
Статистические критерии однородности разработаны для внутрирядно независимых случайных последовательностей. Гидрологи ческие же ряды наблюдений, как мы увидим в следующих главах, часто не удовлетворяют этому требованию. Использование же изве стных критериев однородности для гидрологических рядов, имею щих внутрирядную корреляционную связь, может привести к не правильным выводам. Действительно, внутрирядная корреляция уменьшает объем независимой информации, которая содержится в данных наблюдений. Это приводит к увеличению диапазона коле баний (рассеяний) выборочных значений параметров по сравнению с рассеянием значений параметров, определенных по статистиче ским совокупностям того же объема, но состоящим из статистиче ски независимых величин. Увеличение диапазона рассеяния приво дит соответственно к расширению доверительного интервала для критерия однородности.
Следовательно, использование того или иного критерия одно родности, разработанного для внутрирядно некоррелированных по следовательностей, применительно к коррелированным гидрологи ческим рядам наблюдений, приводит к тому, что заведомо одно родные данные наблюдений могут быть признаны неоднородными, т. е. критерии однородности в подобных случаях оказываются из лишне требовательными при оценке однородности.
Подобное неправильное применение критериев однородности иногда встречается в практике гидрологических расчетов и приво дит к излишне страхующим результатам оценки степени однород ности. Правильное применение критериев однородности для корре лированных случайных величин заключается в оценке объема
187
независимой информации, которая должна учитываться при расче тах однородности.
Оценка степени случайности гидрологических рядов будет рас смотрена в следующем параграфе настоящей главы. Здесь же лишь подчеркиваются те ограничения, которые необходимо иметь в виду при применении статистических критериев однородности.
Второе ограничение при использовании статистических крите риев однородности применительно к гидрологическим данным заключается в наличии корреляционной связи между рядами гид рологических наблюдений, которая уменьшает доверительный ин тервал критериев однородности. Применение же статистических критериев однородности без учета корреляционных связей между рядами гидрологических наблюдений приводит к тому, что заведомо неоднородные данные могут быть признаны однородными. Ошибки подобного рода довольно часты при оценке однородности гидроло гических наблюдений, так как гидрологические данные по многим явлениям гидрологического режима (годовой, максимальный сток, сток по сезонам и мн. др.) на близко расположенных реках, как правило, корреляционно связаны. Неучет этих связей может при вести к признанию заведомо неоднородных данных однородными.
Таким образом, если неучет внутрирядных корреляционных свя зей в наблюденных данных приводит к страхующим решениям од нородности (заведомо однородные данные могут быть отнесены к разряду неоднородных), то неучет корреляционных связей между рядами гидрологических наблюдений приводит, наоборот, к рас ширению понятия однородности (заведомо неоднородные данные могут быть отнесены к разряду однородных).
Кроме отмеченных ограничений, часто упускаемых при исполь зовании статистических критериев однородности, имеются и другие, которые обычно излагаются при описании этих критериев и поэтому принимаются во внимание при их использовании. К числу таких учитываемых ограничений, например, относится условие подчине ния исследуемых статистических совокупностей тому или иному тео ретическому закону распределения, чаще всего нормальному. Кри терии подобного рода (например, критерий однородности средних значений Стьюдента или критерий однородности дисперсий Фише ра) называют параметрическими в отличие от непараметрических критериев, которые не зависят от вида распределения исходных данных (например, критерий Вилькоксона). Заметим, что парамет рические критерии обычно более эффективны по сравнению с непа раметрическими за счет более полного использования исходной ин формации. Указанное деление критериев статистической оценки ги потез на параметрические и непараметрические относится в равной мере и к следующим разделам настоящей главы. Непараметриче ские критерии обычно более просты и не требуют дополнительного обоснования правомерности их применения в отношении типа ис ходного распределения. При использовании параметрических кри териев на однородность оцениваются параметры распределения (среднее значение, коэффициенты вариации и асимметрии).
188
Рассматриваемые ниже классические критерии оценки однород ности, за исключением обобщенного на случай нескольких совокуп ностей критерия Стьюдента и критерия Бартлета, пригодны для анализа однородности лишь двух эмпирических совокупностей. При наличии большого числа рядов, подлежащих оценке на однород ность, попарное сравнение их средних значений или дисперсий при водит к появлению ряда значений соответствующего критерия. Наличие такого ряда позволяет оценивать однородность рассмат риваемых рядов по степени соответствия теоретического распреде ления рассматриваемого критерия однородности эмпирическому. В случае достаточного соответствия указанных распределений ги потеза однородности подтверждается, в случае несоответствия этих
распределений — отвергается. Степень |
соответствия эмпирических |
и теоретических распределений может |
быть оценена критериями |
согласия, рассматриваемыми в § 3 настоящей главы.
2. основные этапы анализа однородности рядов наблюдений
Статистический анализ однородности рядов наблюдений вклю чает следующие основные этапы: формулировку нулевой и альтер нативных гипотез, определение уровня значимости, выбор критиче ской области, браковку или признание нулевой гипотезы. Так как эти этапы являются, как правило, неотъемлемой частью любого ста тистического исследования однородности рядов наблюдений, оста новимся кратко на них. Прежде всего условимся, что результаты наблюдений будем считать однородными тогда, когда они принад лежат к одной и той же генеральной совокупности. При этом все наблюдения будем считать независимыми как внутри рядов наблю дений (иными словами соблюдено условие случайности отбора), так и между исследуемыми рядами наблюдений.
Формулировка нулевой и альтернативных гипотез. Любое ста тистическое суждение об однородности тех или иных рядов наблю дений всегда имеет вероятностный характер. Статистический ана лиз однородности рядов наблюдений начинается с предположения отсутствия существенного различия между параметрами сравни ваемых рядов (нулевая гипотеза). При этом обычно предпола гается, что закон распределения сопоставляемых рядов наблюде ний один и тот же, что следует из физических соображений или накопленного предыдущего опыта, но могут иметь место лишь раз личия в параметрах распределения, к числу которых могут быть отнесены: среднее значение, коэффициент вариации и коэффициент асимметрии. Во многих случаях подлежат проверке на нулевую ги потезу все параметры распределения. Гипотезы, противоположные нулевой, называются альтернативными.
Предположим, что требуется оценить однородность средних зна чений запаса воды в снежном покрове, полученных по данным двух
снегомерных маршрутов. При этом хи хг — средние значения запаса
воды в снежном покрове на двух маршрутах. Нулевой гипотезой
189