
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfварианту биномиального распределения, которые достаточно ве лики по объему. При этом в первую очередь необходимо выяснить, каков должен быть минимальный объем выборки, позволяющий осуществлять замену дискретного биномиального распределения нормальным. Конечно, допустимое расхождение зависит от условий рассматриваемой задачи и потому не может оцениваться одно значно во всех случаях.
В качестве приближенного практического критерия иногда ис пользуют соотношение пр^25, при выполнении которого допуска ется замена биномиального распределения нормальным. Опираясь на указанное соотношение, можно оценить минимальный объем вы борки при различных р (табл. 2.11).
|
Т а б л и ц а |
2.11 |
|
|
|
|
Минимальный размер выборки, при которой возможна замена биномиального |
||||||
|
распределения нормальным |
|
|
|||
р ....................................... |
0,5 |
0,4 |
0,3 |
0,2 |
0,1 |
0,05 |
Минимальный размер |
50 |
63 |
84 |
125 |
250 |
500 |
выборки ................... |
||||||
При решении некоторых, в частности |
гидрологических, |
задач |
||||
можно использовать и менее жесткое условие (т. е. пр< 25), |
что по |
|||||
зволяет осуществлять аппроксимацию дискретного |
биномиального |
|||||
распределения нормальным |
и при |
меньшем, |
чем указано |
|||
в табл. 2.11, объеме выборки. |
|
|
|
|
пример, |
|
Для иллюстрации сказанного используем численный |
||||||
рассмотренный в § 2 настоящей главы. |
|
|
|
|||
В этом примере рассматривалась выборка объемом п = 20; эм |
||||||
пирическая вероятность пересыхания |
реки равна |
р = 0,2. |
Вероят |
ность пересыхания реки, равная или более шести раз, оцененная по формуле (2.2), равна 0,192.
Переход от дискретного биномиального распределения к непре рывному нормальному осуществляется по соотношению
где г' — нормированная случайная величина, распределенная по дискретному биномиальному закону; z — нормированная случайная
величина, распределенная по нормальному закону; Аг — интервал дискретности, выраженный в долях среднего квадратического от клонения (а).
Используя (2.4) и (2.5), определим математическое ожидание, среднее квадратическое отклонение и интервал дискретности слу чайной величины, распределенной по дискретному биномиальному распределению,
х = п р = 20 • 0,2= 4,
* x = V n p q = V 2 0 |
• 0,2 • 0,8=1,789, |
A z = — |
=0,559. |
1 2 0
На основании полученных значений имеем
2 |
X |
Аг |
6 - 4 |
0,559 |
1,12-0,28 = 0,84. |
|
2 |
1,789 |
2 |
||
|
|
|
|||
По таблице из работы |
[89] |
определяем вероятность попадания |
случайной величины в интервал от 2 = 0,84 до 2 = оо, равную 0,2005
и выраженную в долях от единицы. Вероятность рассматриваемого события (пересыхания реки), определенная непосредственно с ис пользованием дискретного биномиального распределения, была определена равной 0,192. Расхождение между оценкой этой вероят ности по первому и второму вариантам составляет 0,008, или 4%..
Таким образом, использование нормального закона распределе ния для аппроксимации дискретного биномиального закона даже' для случая лр = 4 оказалось практически приемлемым. Очевидно,, что условия, приведенные в табл. 2.11 (при р = 0,2; л=125), обеспе чили бы точность аппроксимации, значительно превосходящую точ ность оценки параметров кривой распределения по исходному ряду.
При использовании указанного приема аппроксимации следует
иметь в виду, что, чем меньше величина & г = \Ц npq, тем больше-
сходимость нормального и биномиального законов распределения. В случаях когда р достаточно мало, а пр сохраняет постоянное
значение, хорошее приближение к биномиальному закону распре деления, как указывалось выше, дает распределение Пуассона.
Учитывая широкое применение нормального закона распреде ления в практике и теории статистического анализа, часто возни кает необходимость преобразования случайной величины к нор мальному виду (см. § 9 данной главы).
§ 9
законы распределения функционально преобразованных случайных величин
При решении задач статистики и теории вероятностей закон рас пределения случайной переменной х иногда целесообразно преоб разовать в закон распределения случайной величины у, связанной с х функциональной зависимостью у=ц>(х). Примером такого пре
образования является рассмотренная в § 5 кривая трехпараметри ческого гамма-распределения С. Н. Крицкого и М. Ф. Менкеля.
Определенное развитие в практике расчетов речного стока по лучило направление, связанное с использованием нормальной кри вой распределения. Непосредственно нормальная кривая не приме нима к расчетам речного стока, так как она симметрична (в то время как ряды стока в большинстве случаев асимметричны) и охватывает интервал изменения переменной не в пределах 0 < х < < оо (характерных для существенно положительных величин), а в пределах —оо < х < оо.
1 2 1
Возможность использования нормальной кривой распределения для расчетов речного стока связывается с двумя направлениями:
I) преобразованием значений исходной переменной л: путем за мены ее новой варьирующей величиной у, подчиняющейся нормаль
ному закону распределения (нормализующие преобразования); |
|
II) преобразованием уравнения нормальной кривой распределе |
|
ния с целью получить новое распределение, обладающее |
асиммет |
рией и охватывающее диапазон изменения переменной |
величины |
в пределах от 0 до оо (например, лог-нормалыюе распределение). I. Использование первого направления возможно в двух вари
антах: аналитическом и графоаналитическом.
1. А н а л и т и ч е с к и й в а р и а н т основан на применении функции преобразования у = ср(х), позволяющей получить величину у, распределенную по нормальному закону, в отличие от исходной величины х, подчиненной иному (в частности асимметричному) за
кону распределения.
Очевидно, что использование |
простейшей |
линейной |
функции |
||||||
преобразования |
не приводит к желаемому результату, поскольку |
||||||||
в силу указанного выше |
свойства |
нормального |
распределения |
||||||
в этом случае нормальность |
закона |
распределения |
величины у |
||||||
означает, что и исходная |
величина х подчинена |
этому |
закону. |
||||||
В этих условиях, очевидно, |
утрачивается смысл |
преобразования. |
|||||||
В силу сказанного целесообразно |
испытать |
такую |
простейшую |
||||||
функцию преобразования: |
|
|
|
|
|
|
|
|
|
|
|
|
У = х п. |
|
|
|
|
(2.104) |
|
В частных случаях функция (2.104) может |
быть |
представлена |
|||||||
в виде у = У л:, или у = У х . |
|
|
в |
практике |
расчетов |
речного |
|||
Наибольшее |
распространение |
стока получило стандартное преобразование случайной переменной по зависимости y = \gx. Переходя от величины х к lgx, мы тем са
мым расширяем исходный интервал изменения переменной, заклю ченной в пределы от 0 до оо, на интервал от •—оо до оо, что соответ
ствует нормальному закону распределения.
В случае логарифмического преобразования исходной перемен
ной л: выборочные значения параметров — среднего lgx и среднего квадратического отклонения aig*— вычисляются по следующим формулам:
|
__ |
2 |
У; |
2 lS * i |
(2.105) |
|
y ==lg x = |
A |
^ _ = |
_L^l_-----/ |
|
|
(уI - у ? |
|
- |
ig*)2 |
|
c i g* — |
п - 1 |
|
|
п - 1 |
(2.106) |
|
|
|
где y = ]gx — варьирующая величина; п — число членов ряда.
122
Выражение для у можно представить в виде:
П
2 \gxt
y = l g * = |
i = 1 |
lg*l |
+ i g * 2 + |
• • • +1 |
|
|
П |
|
П |
||
|
|
|
|
П Xi |
1in |
= lg(-*l*2 |
. . . Xn)l'n = \g |
= \gx геом> |
|||
|
|
|
|
i = 1 |
|
где хгеом — среднее геометрическое.
Таким образом, логарифмическое преобразование выборки при оценке центра распределения ведет к переходу от среднего ариф метического к среднему геометрическому, которое, как доказыва ется в математической статистике, всегда меньше среднего арифме тического.
2. Г р а ф о а н а л и т и ч е с к и й в а р и а н т основан на преоб разовании закона распределения исходной величины х в другой за кон распределения (в частности, нормальный) путем трансформа ции величин исходного ряда через кривую обеспеченности этого но вого закона. При использовании этого приема, очевидно, отпадает необходимость отыскания функции преобразования в том виде, как это указано в п. 1.
Рассмотрим этот прием более детально.
Допустим, требуется трансформировать в нормальный закон ис ходный ряд величин среднегодовых расходов воды р. Дона у ст. Ка
занской с параметрами х = 3,18 л/с-км2, C\,= 0,30, CS= 2C„.
Для выполнения этой операции сделаем графическое построе ние, приведенное на рис. 2.17. В верхней части графика нанесены точки, соответствующие значениям величин исходного ряда и их эмпирическим обеспеченностям, вычисленным, например, по фор муле
т — 0,3 |
юо%, |
|
л + 0,4 |
|
|
где Рт— эмпирическая вероятность |
превышения, |
или обеспечен |
ность в %; т — порядковый (ранговый) номер |
ранжированных |
в убывающем порядке величин исходного ряда; п — объем совокуп
ности.
Для рассматриваемой совокупности построена биномиальная
кривая |
обеспеченности, |
отвечающая указанным |
выше |
значениям |
|
параметров. В нижней части графика |
представлена |
нормальная |
|||
кривая |
обеспеченности |
с параметрами |
х = 3,18 |
л/с-км2, Сг>= 0,3, |
Cs= 0. Шкала обеспеченностей является единой для верхней и ниж ней частей графика.
Нормализация исходного ряда может быть осуществлена двумя способами.
В первом способе каждую точку эмпирического ряда, в соответ ствии с ее эмпирической обеспеченностью (Рт), совмещаем
123
снаходящейся в нижней части графика кривой нормального закона,
азатем, переходя от этой кривой на ось ординат, получаем норма лизованное значение величины х, которое обозначим через t(x).
Повторяя такую операцию в отношении всех величин исходного
ряда, получаем новый ряд с параметрами: t{x) = 3,19 л/с • км2,
CVt= 0,29.
Рис. 2.17. |
Нормализация |
годового стока р. |
Дона — ст. Казанская. |
||||||
а — и с х о д н ы е |
э м п и р и ч е с к а я |
и |
б и н о м и а л ь н а я к р и вы е |
о б ес п еч е н н о ст и |
(Cv—0,3, |
||||
C8—2Cv, л:**3,18 л / с • к м 2, |
л = 5 8 ) ; |
б — н о р м а л ь н а я |
к р и в а я о б еспеченности , |
||||||
/ — н о р м а л и з о в а н н а я |
э м п и р и ч е с к а я |
к р и в а я о б ес п еч е н н о ст и |
по |
п е р в о м у |
способу ; |
||||
2 — н о р м а л и з о в а н н а я |
э м п и р и ч е с к а я |
к р и в а я о б ес п еч е н н о ст и |
по |
вто р о м у |
способу . |
Во втором способе нормализация осуществляется следующим образом. В соответствии с величиной эмпирической обеспеченно сти (Рт ) каждого члена эмпирического ряда устанавливаем точку
на аналитической кривой обеспеченности, принятой в качестве ап проксимирующей рассматриваемый ряд. Затем проектируем4 эту точку на нормальную кривую и далее, переходя на ось ординат, по лучаем нормализованные значения исходного ряда. При этом спо
собе параметры нормализованного ряда оказались равными: ы' = = 3,19 л/с • км2; C„u,=0,30.
Сопоставим указанные два приема нормализации.
При осуществлении нормализации по первому варианту не тре буется знать закон распределения преобразуемой случайной пере менной х, который в точном его выражении обычно и не известен.
Соответственно отпадает необходимость расчета параметров кри
124
вой распределения и ее построения. Это упрощает расчеты и сни мает некоторые дополнительные принципиальные затруднения, свя занные с выбором типа кривой распределения.
Однако этот вариант нормализации случайной переменной х
приводит к некоторому сглаживанию колебаний исходного ряда, к его некоторой генерализации и, следовательно, к большей стати стической устойчивости решений.
При выполнении нормализации по второму способу (т. е. через кривую обеспеченности, принятую в качестве аппроксимирующей эмпирический ряд) полностью сохраняются свойственные исход ному эмпирическому ряду флуктуации. Например, довольно часто величины эмпирического ряда в зоне малых обеспеченностей не со гласуются с общим направлением аналитической кривой обеспе ченности (так называемые иногда «отскакивающие точки»). Такое рассеяние, свойственное исходному ряду, сохраняется и при нор мализации по рассматриваемому второму способу.
Сохраняя в нормализованном ряду флуктуации исходной вы борки, можно использовать существующий математический аппа рат для оценки выборочных значений различных характеристик (параметров) статистического ряда.
В некоторых случаях может оказаться целесообразным преобра зовать заданное эмпирическое распределение к нормальному виду
с параметрами cr= 1 и х = 0; для осуществления такого преобразо вания в нижней части графика (рис. 2.17) необходимо использовать нормальную кривую распределения с этими параметрами.
Рассмотренный прием преобразования закона распределения исходной случайной переменной в нормальный закон может быть обобщен и на случай преобразования к любому закону распределе ния, для чего лишь необходимо в нижней части графика в качестве трансформационной функции использовать тот интегральный за кон распределения, к которому мы хотим преобразовать случайную переменную. Однако при решении гидрологических задач указан ное преобразование обычно осуществляется применительно к нор мальному закону распределения.
В том случае, когда закон распределения рассматриваемой ста тистической совокупности (кривая а на рис. 2.17) и закон распре
деления, к которому преобразуется случайная переменная (кри вая б на рис. 2.17), табулированы, преобразование может быть осу
ществлено, минуя графические построения и осуществляя переход от одной таблицы в другую в соответствии со значениями эмпириче ской обеспеченности членов исходной статистической совокуп ности. ■
Очевидно, что в том случае, когда преобразование исходного ряда осуществляется непосредственно через эмпирические обеспе ченности без использования интегрального закона, аппроксимирую щего эмпирический ряд (т. е. по первому варианту), достаточно использовать лишь таблицу того закона распределения, в который осуществляется преобразование исходного ряда.
125
При нормализации непрерывной случайной величины х
можно пользоваться любыми таблицами нормального закона распределения, осуществляя в случае необходимости дополнитель ные пересчеты, подобные тем, которые рассматривались при ана лизе табл. 2.10. Таблица нормального закона распределения
вформе, удобной для решения гидрологических задач, приведена
вработе [9].
Описанный прием нормализации исходного ряда непосредст венно через эмпирические обеспеченности использовал Г. А. Алек сеев [9] при исследовании корреляционных связей характеристик гидрометеорологического режима. В связи с этим он пересчитал таблицу нормального закона распределения в таблицу, позволяю щую определить по заданным величинам эмпирической обеспечен ности ординаты кривой нормального закона [9].
II. Преобразование нормального закона распределения в асим метричный закон, простирающийся от нуля до бесконечности, осно вывается на использовании общих соотношений, определяющих аналитическое преобразование одного закона распределения в дру гой. Задача ставится следующим образом. Задан закон распреде ления случайной величины у в виде Р (у); случайная величина х связана с у функциональной зависимостью x = f(y). Нужно опре делить закон распределения Р (х) случайной величины х.
Будем считать, что обратная функция у=<р{х) однозначна (рис. 2.18). Вероятность того, что случайная переменная у\ попадет
в интервал (у, y + dy), должна |
быть в точности равна |
(вследствие |
однозначной связи между х н у ) |
вероятности того, что значение xt |
|
заключено в соответствующем промежутке х, x + dx, т. |
е. |
|
P ( x < x l < x - { - d x ) = P ( y < y i < y + d y ) , |
|
|
или |
|
|
P (x)dx= P * (у) dy. |
(2.107) |
Аналогичным образом (в силу принятой однозначной связи между х и у) в интегральном выражении вероятность непревышения (или превышения) данного значения исходной переменной х и преобразованной у будет одинакова. В этом заключается важная
особенность рассматриваемого преобразования как равновероятно
стного.
Из равенства (2.107) следует, что
Р(х) = Р*[у(х) 1 |
(2.108) |
Причем, производную нужно брать по абсолютному значению, так как функция распределения всегда положительна.
Введя вместо у функцию у=ц> (х), получаем
(2.109)
126
Таким образом, выражение (2.109) определяет закон распреде ления случайной величины х по известному закону распределения непрерывной случайной переменной у в зависимости от вида функ
ции преобразования х = / (у).
Если функция у=кр(х) является двузначной (рис. 2.18), т. е. каждому значению х соответствует два значения у, формулу (2.109) нужно применить дважды — к каждой ветви кривой у =<pi (лг) и У = фг (х)
Я(х) = Я* (у) [^(х)] dx + Я*(У)ЫА>]
Рис. 2.18. Иллюстрация однозначной (я) и двузначной (б) функций.
Числовые характеристики (моменты) закона распределения случайной величины х можно определить, не устанавливая выра жение Р (у)\ это можно сделать проще. В самом деле, математиче
ское ожидание величины х равно
|
с о |
|
|
х = |
J х P(x)dx, |
|
|
|
— с о |
|
|
но для однозначной функции, как показано выше, |
|
||
Я (х) d x = Я* (у) dy, |
|
||
а * = / (У); следовательно, |
|
|
|
|
с о |
|
|
■*=jf ( y ) P * ( y ) d y . |
|
||
|
с о |
|
|
Аналогично для начальных (т) |
и центральных (ц) |
моментов |
|
в общем виде получим: |
|
|
|
СО |
|
СО |
(2.110) |
mk= jx kP ( x ) d x = |
j-■[ / {y)]kP* (y)dy, |
||
—co |
—oo |
|
|
oo |
|
co |
(2.111) |
H== J (x —x)* P ( x ) d x = |
j[f(y) —x]kP*{y)dy. |
127
В частности, для дисперсии имеем
со |
|
4 = j [ f ( y ) - x ] 2P*{y) dy. |
(2.112) |
Опираясь на полученные уравнения, покажем, что осуществлен |
|
ное в § 8 преобразование переменной по соотношению |
2 = --------- |
не приводит к нарушению нормального закона. Учтем, |
Ож |
что z явля |
ется однозначной функцией х, а пределы изменения как х, так и 2 от —оо до оо.
Выразим х через функцию преобразования, т. е. получим обрат
ную функцию
X = Z a x -\-Х ,
dx |
|
|
|
|
|
откуда —~ = a A-. |
|
|
|
|
|
Подставляя в (2.108) |
эти соотношения и уравнение (2.98), полу |
||||
чаем: |
|
|
|
|
|
|
( г а + ж - * ) |
_ _ f l |
|
|
|
7 |
s e~ |
2" |
’ |
• |
<2-|13) |
Уравнение (2.113) показывает, что |
выполненное |
преобразова |
|||
ние величины х, распределенной |
по нормальному закону, |
не изме |
няет нормальности распределения и для случая х = 0 и а^=1.
Подобным образом можно показать, что применение аналогич ного преобразования в отношении случайных величин, распределен ных по иным законам (например, по биномиальному), также не ме няет исходную схему распределения.
В практике расчетов гидрометеорологических характеристик иногда используется так называемое логарифмически-нормальное распределение, получаемое путем трансформации нормального за кона.
Исходное уравнение нормального закона для плотности вероят ности величины у, как известно, может быть записано в форме
|
(у - у )2 |
Р( У)= Су К2тс |
(2.114) |
Чтобы приспособить этот закон распределения для описания асимметричных статистических совокупностей переменных, изме няющихся в пределах от 0 до оо, преобразуем г/= 1пх; это равно сильно тому, что принята обратная функция x = f(y) в виде х = еу.
В таком случае
rfy__ 1 dx х
128
Учитывая это, распределение (2.114) преобразуем в логарифми- чески-нормальное распределение
|
( i n |
— I n Л1)2 |
|
Р(х) |
___ 1__ е |
2ч 2 |
(2.115) |
I n X |
|||
Таким образом, |
X V2n |
|
распределение |
логарифмически-нормальное |
описывает совокупность случайной переменной, логарифм которой распределен по нормальному закону. Распределение характеризу ется положительной асимметрией, возрастающей с увеличением а.
Поскольку отрицательные величины не имеют логарифмов, то лога рифмически-нормальное распределение описывает статистическую совокупность величин, изменяющихся в пределе от 0 до оо.
Логарифмически-нормальное распределение соответствует та кой статистической модели, в которой предполагается, что форми рование случайной величины происходит в результате умножения
большого числа влияющих на эту величину факторов, |
каждый |
|
из которых не выделяется по своему значению. |
возникает |
|
Уместно напомнить, что нормальное распределение |
||
в результате сложения равнозначно |
влияющих на рассматривае |
|
мую случайную величину факторов |
(или ошибок измерения). |
|
Рассмотрим зависимости, устанавливающиеся между |
парамет |
рами логарифмически-нормальной кривой распределения исходной величины х и нормальной кривой величины у = \пх. Для этого зави
симость (2.115) запишем в виде
|
1 |
|
(у-у)2 |
|
Р(х) |
е |
2°у |
(2.116) |
|
|
еу ау У 2к |
|
|
|
Применяя рассмотренный ранее метод моментов |
к логарифми- |
чески-нормальному закону распределения случайной переменной х,
записанной в виде (2.116), получаем для начальных моментов
о о |
о о |
|
aA= j |
x kP (х) dx = J ek-yP(x)dx, |
(2.117) |
о |
о |
|
или, имея в виду, что dx = ev dy, получаем
|
|
|
(2.118) |
Рассмотрим отдельно выражение показателя |
степени, |
выделяя |
|
в числителе полный квадрат |
|
|
|
2йуа2 — (у — у)2 |
(у — у)2 — 2£з2 (у — у) + |
26уа2 + |
k2^ |
ц
(2.119)
9 Зак . № 88 |
129 |