Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии

.pdf
Скачиваний:
69
Добавлен:
22.10.2023
Размер:
14.87 Mб
Скачать

варианту биномиального распределения, которые достаточно ве­ лики по объему. При этом в первую очередь необходимо выяснить, каков должен быть минимальный объем выборки, позволяющий осуществлять замену дискретного биномиального распределения нормальным. Конечно, допустимое расхождение зависит от условий рассматриваемой задачи и потому не может оцениваться одно­ значно во всех случаях.

В качестве приближенного практического критерия иногда ис­ пользуют соотношение пр^25, при выполнении которого допуска­ ется замена биномиального распределения нормальным. Опираясь на указанное соотношение, можно оценить минимальный объем вы­ борки при различных р (табл. 2.11).

 

Т а б л и ц а

2.11

 

 

 

Минимальный размер выборки, при которой возможна замена биномиального

 

распределения нормальным

 

 

р .......................................

0,5

0,4

0,3

0,2

0,1

0,05

Минимальный размер

50

63

84

125

250

500

выборки ...................

При решении некоторых, в частности

гидрологических,

задач

можно использовать и менее жесткое условие (т. е. пр< 25),

что по­

зволяет осуществлять аппроксимацию дискретного

биномиального

распределения нормальным

и при

меньшем,

чем указано

в табл. 2.11, объеме выборки.

 

 

 

 

пример,

Для иллюстрации сказанного используем численный

рассмотренный в § 2 настоящей главы.

 

 

 

В этом примере рассматривалась выборка объемом п = 20; эм­

пирическая вероятность пересыхания

реки равна

р = 0,2.

Вероят­

ность пересыхания реки, равная или более шести раз, оцененная по формуле (2.2), равна 0,192.

Переход от дискретного биномиального распределения к непре­ рывному нормальному осуществляется по соотношению

где г' — нормированная случайная величина, распределенная по дискретному биномиальному закону; z — нормированная случайная

величина, распределенная по нормальному закону; Аг — интервал дискретности, выраженный в долях среднего квадратического от­ клонения (а).

Используя (2.4) и (2.5), определим математическое ожидание, среднее квадратическое отклонение и интервал дискретности слу­ чайной величины, распределенной по дискретному биномиальному распределению,

х = п р = 20 • 0,2= 4,

* x = V n p q = V 2 0

• 0,2 • 0,8=1,789,

A z = —

=0,559.

1 2 0

На основании полученных значений имеем

2

X

Аг

6 - 4

0,559

1,12-0,28 = 0,84.

 

2

1,789

2

 

 

 

По таблице из работы

[89]

определяем вероятность попадания

случайной величины в интервал от 2 = 0,84 до 2 = оо, равную 0,2005

и выраженную в долях от единицы. Вероятность рассматриваемого события (пересыхания реки), определенная непосредственно с ис­ пользованием дискретного биномиального распределения, была определена равной 0,192. Расхождение между оценкой этой вероят­ ности по первому и второму вариантам составляет 0,008, или 4%..

Таким образом, использование нормального закона распределе­ ния для аппроксимации дискретного биномиального закона даже' для случая лр = 4 оказалось практически приемлемым. Очевидно,, что условия, приведенные в табл. 2.11 (при р = 0,2; л=125), обеспе­ чили бы точность аппроксимации, значительно превосходящую точ­ ность оценки параметров кривой распределения по исходному ряду.

При использовании указанного приема аппроксимации следует

иметь в виду, что, чем меньше величина & г = \Ц npq, тем больше-

сходимость нормального и биномиального законов распределения. В случаях когда р достаточно мало, а пр сохраняет постоянное

значение, хорошее приближение к биномиальному закону распре­ деления, как указывалось выше, дает распределение Пуассона.

Учитывая широкое применение нормального закона распреде­ ления в практике и теории статистического анализа, часто возни­ кает необходимость преобразования случайной величины к нор­ мальному виду (см. § 9 данной главы).

§ 9

законы распределения функционально преобразованных случайных величин

При решении задач статистики и теории вероятностей закон рас­ пределения случайной переменной х иногда целесообразно преоб­ разовать в закон распределения случайной величины у, связанной с х функциональной зависимостью у=ц>(х). Примером такого пре­

образования является рассмотренная в § 5 кривая трехпараметри­ ческого гамма-распределения С. Н. Крицкого и М. Ф. Менкеля.

Определенное развитие в практике расчетов речного стока по­ лучило направление, связанное с использованием нормальной кри­ вой распределения. Непосредственно нормальная кривая не приме­ нима к расчетам речного стока, так как она симметрична (в то время как ряды стока в большинстве случаев асимметричны) и охватывает интервал изменения переменной не в пределах 0 < х < < оо (характерных для существенно положительных величин), а в пределах —оо < х < оо.

1 2 1

Возможность использования нормальной кривой распределения для расчетов речного стока связывается с двумя направлениями:

I) преобразованием значений исходной переменной л: путем за­ мены ее новой варьирующей величиной у, подчиняющейся нормаль­

ному закону распределения (нормализующие преобразования);

II) преобразованием уравнения нормальной кривой распределе­

ния с целью получить новое распределение, обладающее

асиммет­

рией и охватывающее диапазон изменения переменной

величины

в пределах от 0 до оо (например, лог-нормалыюе распределение). I. Использование первого направления возможно в двух вари­

антах: аналитическом и графоаналитическом.

1. А н а л и т и ч е с к и й в а р и а н т основан на применении функции преобразования у = ср(х), позволяющей получить величину у, распределенную по нормальному закону, в отличие от исходной величины х, подчиненной иному (в частности асимметричному) за­

кону распределения.

Очевидно, что использование

простейшей

линейной

функции

преобразования

не приводит к желаемому результату, поскольку

в силу указанного выше

свойства

нормального

распределения

в этом случае нормальность

закона

распределения

величины у

означает, что и исходная

величина х подчинена

этому

закону.

В этих условиях, очевидно,

утрачивается смысл

преобразования.

В силу сказанного целесообразно

испытать

такую

простейшую

функцию преобразования:

 

 

 

 

 

 

 

 

 

 

 

У = х п.

 

 

 

 

(2.104)

В частных случаях функция (2.104) может

быть

представлена

в виде у = У л:, или у = У х .

 

 

в

практике

расчетов

речного

Наибольшее

распространение

стока получило стандартное преобразование случайной переменной по зависимости y = \gx. Переходя от величины х к lgx, мы тем са­

мым расширяем исходный интервал изменения переменной, заклю­ ченной в пределы от 0 до оо, на интервал от •—оо до оо, что соответ­

ствует нормальному закону распределения.

В случае логарифмического преобразования исходной перемен­

ной л: выборочные значения параметров — среднего lgx и среднего квадратического отклонения aig*— вычисляются по следующим формулам:

 

__

2

У;

2 lS * i

(2.105)

 

y ==lg x =

A

^ _ =

_L^l_-----/

 

(уI - у ?

 

-

ig*)2

c i g* —

п - 1

 

 

п - 1

(2.106)

 

 

 

где y = ]gx — варьирующая величина; п — число членов ряда.

122

Выражение для у можно представить в виде:

П

2 \gxt

y = l g * =

i = 1

lg*l

+ i g * 2 +

• • • +1

 

П

 

П

 

 

 

 

П Xi

1in

= lg(-*l*2

. . . Xn)l'n = \g

= \gx геом>

 

 

 

 

i = 1

 

где хгеом — среднее геометрическое.

Таким образом, логарифмическое преобразование выборки при оценке центра распределения ведет к переходу от среднего ариф­ метического к среднему геометрическому, которое, как доказыва­ ется в математической статистике, всегда меньше среднего арифме­ тического.

2. Г р а ф о а н а л и т и ч е с к и й в а р и а н т основан на преоб­ разовании закона распределения исходной величины х в другой за­ кон распределения (в частности, нормальный) путем трансформа­ ции величин исходного ряда через кривую обеспеченности этого но­ вого закона. При использовании этого приема, очевидно, отпадает необходимость отыскания функции преобразования в том виде, как это указано в п. 1.

Рассмотрим этот прием более детально.

Допустим, требуется трансформировать в нормальный закон ис­ ходный ряд величин среднегодовых расходов воды р. Дона у ст. Ка­

занской с параметрами х = 3,18 л/с-км2, C\,= 0,30, CS= 2C„.

Для выполнения этой операции сделаем графическое построе­ ние, приведенное на рис. 2.17. В верхней части графика нанесены точки, соответствующие значениям величин исходного ряда и их эмпирическим обеспеченностям, вычисленным, например, по фор­ муле

т — 0,3

юо%,

 

л + 0,4

 

где Рт— эмпирическая вероятность

превышения,

или обеспечен­

ность в %; т — порядковый (ранговый) номер

ранжированных

в убывающем порядке величин исходного ряда; п — объем совокуп­

ности.

Для рассматриваемой совокупности построена биномиальная

кривая

обеспеченности,

отвечающая указанным

выше

значениям

параметров. В нижней части графика

представлена

нормальная

кривая

обеспеченности

с параметрами

х = 3,18

л/с-км2, Сг>= 0,3,

Cs= 0. Шкала обеспеченностей является единой для верхней и ниж­ ней частей графика.

Нормализация исходного ряда может быть осуществлена двумя способами.

В первом способе каждую точку эмпирического ряда, в соответ­ ствии с ее эмпирической обеспеченностью (Рт), совмещаем

123

снаходящейся в нижней части графика кривой нормального закона,

азатем, переходя от этой кривой на ось ординат, получаем норма­ лизованное значение величины х, которое обозначим через t(x).

Повторяя такую операцию в отношении всех величин исходного

ряда, получаем новый ряд с параметрами: t{x) = 3,19 л/с • км2,

CVt= 0,29.

Рис. 2.17.

Нормализация

годового стока р.

Дона — ст. Казанская.

а — и с х о д н ы е

э м п и р и ч е с к а я

и

б и н о м и а л ь н а я к р и вы е

о б ес п еч е н н о ст и

(Cv—0,3,

C8—2Cv, л:**3,18 л / с • к м 2,

л = 5 8 ) ;

б — н о р м а л ь н а я

к р и в а я о б еспеченности ,

/ — н о р м а л и з о в а н н а я

э м п и р и ч е с к а я

к р и в а я о б ес п еч е н н о ст и

по

п е р в о м у

способу ;

2 — н о р м а л и з о в а н н а я

э м п и р и ч е с к а я

к р и в а я о б ес п еч е н н о ст и

по

вто р о м у

способу .

Во втором способе нормализация осуществляется следующим образом. В соответствии с величиной эмпирической обеспеченно­ сти (Рт ) каждого члена эмпирического ряда устанавливаем точку

на аналитической кривой обеспеченности, принятой в качестве ап­ проксимирующей рассматриваемый ряд. Затем проектируем4 эту точку на нормальную кривую и далее, переходя на ось ординат, по­ лучаем нормализованные значения исходного ряда. При этом спо­

собе параметры нормализованного ряда оказались равными: ы' = = 3,19 л/с • км2; C„u,=0,30.

Сопоставим указанные два приема нормализации.

При осуществлении нормализации по первому варианту не тре­ буется знать закон распределения преобразуемой случайной пере­ менной х, который в точном его выражении обычно и не известен.

Соответственно отпадает необходимость расчета параметров кри­

124

вой распределения и ее построения. Это упрощает расчеты и сни­ мает некоторые дополнительные принципиальные затруднения, свя­ занные с выбором типа кривой распределения.

Однако этот вариант нормализации случайной переменной х

приводит к некоторому сглаживанию колебаний исходного ряда, к его некоторой генерализации и, следовательно, к большей стати­ стической устойчивости решений.

При выполнении нормализации по второму способу (т. е. через кривую обеспеченности, принятую в качестве аппроксимирующей эмпирический ряд) полностью сохраняются свойственные исход­ ному эмпирическому ряду флуктуации. Например, довольно часто величины эмпирического ряда в зоне малых обеспеченностей не со­ гласуются с общим направлением аналитической кривой обеспе­ ченности (так называемые иногда «отскакивающие точки»). Такое рассеяние, свойственное исходному ряду, сохраняется и при нор­ мализации по рассматриваемому второму способу.

Сохраняя в нормализованном ряду флуктуации исходной вы­ борки, можно использовать существующий математический аппа­ рат для оценки выборочных значений различных характеристик (параметров) статистического ряда.

В некоторых случаях может оказаться целесообразным преобра­ зовать заданное эмпирическое распределение к нормальному виду

с параметрами cr= 1 и х = 0; для осуществления такого преобразо­ вания в нижней части графика (рис. 2.17) необходимо использовать нормальную кривую распределения с этими параметрами.

Рассмотренный прием преобразования закона распределения исходной случайной переменной в нормальный закон может быть обобщен и на случай преобразования к любому закону распределе­ ния, для чего лишь необходимо в нижней части графика в качестве трансформационной функции использовать тот интегральный за­ кон распределения, к которому мы хотим преобразовать случайную переменную. Однако при решении гидрологических задач указан­ ное преобразование обычно осуществляется применительно к нор­ мальному закону распределения.

В том случае, когда закон распределения рассматриваемой ста­ тистической совокупности (кривая а на рис. 2.17) и закон распре­

деления, к которому преобразуется случайная переменная (кри­ вая б на рис. 2.17), табулированы, преобразование может быть осу­

ществлено, минуя графические построения и осуществляя переход от одной таблицы в другую в соответствии со значениями эмпириче­ ской обеспеченности членов исходной статистической совокуп­ ности. ■

Очевидно, что в том случае, когда преобразование исходного ряда осуществляется непосредственно через эмпирические обеспе­ ченности без использования интегрального закона, аппроксимирую­ щего эмпирический ряд (т. е. по первому варианту), достаточно использовать лишь таблицу того закона распределения, в который осуществляется преобразование исходного ряда.

125

При нормализации непрерывной случайной величины х

можно пользоваться любыми таблицами нормального закона распределения, осуществляя в случае необходимости дополнитель­ ные пересчеты, подобные тем, которые рассматривались при ана­ лизе табл. 2.10. Таблица нормального закона распределения

вформе, удобной для решения гидрологических задач, приведена

вработе [9].

Описанный прием нормализации исходного ряда непосредст­ венно через эмпирические обеспеченности использовал Г. А. Алек­ сеев [9] при исследовании корреляционных связей характеристик гидрометеорологического режима. В связи с этим он пересчитал таблицу нормального закона распределения в таблицу, позволяю­ щую определить по заданным величинам эмпирической обеспечен­ ности ординаты кривой нормального закона [9].

II. Преобразование нормального закона распределения в асим­ метричный закон, простирающийся от нуля до бесконечности, осно­ вывается на использовании общих соотношений, определяющих аналитическое преобразование одного закона распределения в дру­ гой. Задача ставится следующим образом. Задан закон распреде­ ления случайной величины у в виде Р (у); случайная величина х связана с у функциональной зависимостью x = f(y). Нужно опре­ делить закон распределения Р (х) случайной величины х.

Будем считать, что обратная функция у=<р{х) однозначна (рис. 2.18). Вероятность того, что случайная переменная у\ попадет

в интервал (у, y + dy), должна

быть в точности равна

(вследствие

однозначной связи между х н у )

вероятности того, что значение xt

заключено в соответствующем промежутке х, x + dx, т.

е.

P ( x < x l < x - { - d x ) = P ( y < y i < y + d y ) ,

 

или

 

 

P (x)dx= P * (у) dy.

(2.107)

Аналогичным образом (в силу принятой однозначной связи между х и у) в интегральном выражении вероятность непревышения (или превышения) данного значения исходной переменной х и преобразованной у будет одинакова. В этом заключается важная

особенность рассматриваемого преобразования как равновероятно­

стного.

Из равенства (2.107) следует, что

Р(х) = Р*[у(х) 1

(2.108)

Причем, производную нужно брать по абсолютному значению, так как функция распределения всегда положительна.

Введя вместо у функцию у=ц> (х), получаем

(2.109)

126

Таким образом, выражение (2.109) определяет закон распреде­ ления случайной величины х по известному закону распределения непрерывной случайной переменной у в зависимости от вида функ­

ции преобразования х = / (у).

Если функция у=кр(х) является двузначной (рис. 2.18), т. е. каждому значению х соответствует два значения у, формулу (2.109) нужно применить дважды — к каждой ветви кривой у =<pi (лг) и У = фг (х)

Я(х) = Я* (у) [^(х)] dx + Я*(У)ЫА>]

Рис. 2.18. Иллюстрация однозначной (я) и двузначной (б) функций.

Числовые характеристики (моменты) закона распределения случайной величины х можно определить, не устанавливая выра­ жение Р (у)\ это можно сделать проще. В самом деле, математиче­

ское ожидание величины х равно

 

с о

 

 

х =

J х P(x)dx,

 

 

— с о

 

 

но для однозначной функции, как показано выше,

 

Я (х) d x = Я* (у) dy,

 

а * = / (У); следовательно,

 

 

 

 

с о

 

 

■*=jf ( y ) P * ( y ) d y .

 

 

с о

 

 

Аналогично для начальных (т)

и центральных (ц)

моментов

в общем виде получим:

 

 

 

СО

 

СО

(2.110)

mk= jx kP ( x ) d x =

j-■[ / {y)]kP* (y)dy,

—co

—oo

 

oo

 

co

(2.111)

H== J (x —x)* P ( x ) d x =

j[f(y) —x]kP*{y)dy.

127

В частности, для дисперсии имеем

со

 

4 = j [ f ( y ) - x ] 2P*{y) dy.

(2.112)

Опираясь на полученные уравнения, покажем, что осуществлен­

ное в § 8 преобразование переменной по соотношению

2 = ---------

не приводит к нарушению нормального закона. Учтем,

Ож

что z явля­

ется однозначной функцией х, а пределы изменения как х, так и 2 от —оо до оо.

Выразим х через функцию преобразования, т. е. получим обрат­

ную функцию

X = Z a x -\-Х ,

dx

 

 

 

 

 

откуда —~ = a A-.

 

 

 

 

 

Подставляя в (2.108)

эти соотношения и уравнение (2.98), полу­

чаем:

 

 

 

 

 

 

( г а + ж - * )

_ _ f l

 

 

7

s e~

2"

<2-|13)

Уравнение (2.113) показывает, что

выполненное

преобразова­

ние величины х, распределенной

по нормальному закону,

не изме­

няет нормальности распределения и для случая х = 0 и а^=1.

Подобным образом можно показать, что применение аналогич­ ного преобразования в отношении случайных величин, распределен­ ных по иным законам (например, по биномиальному), также не ме­ няет исходную схему распределения.

В практике расчетов гидрометеорологических характеристик иногда используется так называемое логарифмически-нормальное распределение, получаемое путем трансформации нормального за­ кона.

Исходное уравнение нормального закона для плотности вероят­ ности величины у, как известно, может быть записано в форме

 

(у - у )2

Р( У)= Су К2тс

(2.114)

Чтобы приспособить этот закон распределения для описания асимметричных статистических совокупностей переменных, изме­ няющихся в пределах от 0 до оо, преобразуем г/= 1пх; это равно­ сильно тому, что принята обратная функция x = f(y) в виде х = еу.

В таком случае

rfy__ 1 dx х

128

Учитывая это, распределение (2.114) преобразуем в логарифми- чески-нормальное распределение

 

( i n

— I n Л1)2

 

Р(х)

___ 1__ е

2

(2.115)

I n X

Таким образом,

X V2n

 

распределение

логарифмически-нормальное

описывает совокупность случайной переменной, логарифм которой распределен по нормальному закону. Распределение характеризу­ ется положительной асимметрией, возрастающей с увеличением а.

Поскольку отрицательные величины не имеют логарифмов, то лога­ рифмически-нормальное распределение описывает статистическую совокупность величин, изменяющихся в пределе от 0 до оо.

Логарифмически-нормальное распределение соответствует та­ кой статистической модели, в которой предполагается, что форми­ рование случайной величины происходит в результате умножения

большого числа влияющих на эту величину факторов,

каждый

из которых не выделяется по своему значению.

возникает

Уместно напомнить, что нормальное распределение

в результате сложения равнозначно

влияющих на рассматривае­

мую случайную величину факторов

(или ошибок измерения).

Рассмотрим зависимости, устанавливающиеся между

парамет­

рами логарифмически-нормальной кривой распределения исходной величины х и нормальной кривой величины у = \пх. Для этого зави­

симость (2.115) запишем в виде

 

1

 

(у-у)2

 

Р(х)

е

2°у

(2.116)

 

еу ау У 2к

 

 

 

Применяя рассмотренный ранее метод моментов

к логарифми-

чески-нормальному закону распределения случайной переменной х,

записанной в виде (2.116), получаем для начальных моментов

о о

о о

 

aA= j

x kP (х) dx = J ek-yP(x)dx,

(2.117)

о

о

 

или, имея в виду, что dx = ev dy, получаем

 

 

 

(2.118)

Рассмотрим отдельно выражение показателя

степени,

выделяя

в числителе полный квадрат

 

 

2йуа2 — (у — у)2

(у — у)2 — 2£з2 (у — у) +

26уа2 +

k2^

ц

(2.119)

9 Зак . № 88

129

Соседние файлы в папке книги из ГПНТБ