Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии

.pdf
Скачиваний:
77
Добавлен:
22.10.2023
Размер:
14.87 Mб
Скачать

Отметим, что про случайную величину (в данном случае а) говорят, что она сходится по вероятности к величине а, если при увеличении п выполняется равенство

(5.2)

П

где е — сколь угодно малая величина.

Оценки, удовлетворяющие требованию (5.1) и (5.2), называются

состоятельными.

Состоятельность статистической оценки обеспечивает ее практи­ ческую близость (по крайней мере, при больших значениях п) к ис­

комому параметру. Примером состоятельных оценок являются вы­ борочные оценки среднего значения и дисперсии. Из состоятельно­ сти оценки еще нельзя сделать полного вывода о ее пригодности для приближенного определения соответствующего параметра при малых п, так как в этих условиях состоятельная оценка может ук­

лоняться в ту или иную сторону от искомого значения параметра. Поэтому вторым условием, предъявляемым к статистическим оценкам, является условие несмещенности, т. е. отсутствие в ней си­ стематической погрешности при любом п. Для несмещенной оценки

ее математическое ожидание должно совпадать с параметром гене­ ральной совокупности

(5.3)

Здесь имеется в виду, что математическое ожидание оценки а определяется из множества выборок случайной переменной х объ­ емом N при любом конечном (в том числе и при малом) числе п членов в выборке (n<^N). Оценка называется положительно сме­

щенной, если М (а )> а , и отрицательно смещенной, если М (а)< а.

Требование несмещенности оценок особенно важно при малых объемах выборок (рядов наблюдений), с которыми обычно прихо­ дится иметь дело гидрологам. Выборочное среднее арифметическое значение является не только состоятельной, но и несмещенной оценкой математического ожидания

М (х)= р..

Это вытекает из следующих очевидных соотношений:

M(Xi) = [x,

и значит

п

п

£ ( X i X )2

Выборочное же значение дисперсии S2=

п

(5.4)

при ма-

260

лых п является отрицательно смещенной оценкой дисперсии гене­

ральной совокупности

М (52) =

(5.5)

Величина S2, исправленная на величину смещения и, следова­

тельно, являющаяся уже состоятельной несмещенной оценкой, мо­ жет быть определена, согласно формуле (5.5), по соотношению

 

 

 

 

52=

—-------,----

(5.6)

 

 

 

 

 

 

 

П1

 

 

Выражение (5.6) получается

из следующих преобразований:

5 2= -^ - 2

и - * ) 2=

4 г 2

[(-«i—i*)—(^ —

 

 

 

/ = 1

 

 

i — 1

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

^

 

[(^« —!А)2 —2 U —р.)(хг —р)+

(л: —а)2] =

 

 

1= 1

 

 

 

 

П

 

 

 

 

П

 

 

 

 

 

 

 

п

2

 

— В-)2 — 2 (■*—р)

2

(-*г —I1) + /*(■*—р)2] =

 

I

=1

 

 

 

 

 

i =1

 

 

 

"

 

 

_

 

 

2 j

б** — !*)

 

 

2d {xt — \>)2—2n (х — р)

- = 1- - ----------\-п(х- р)2

 

1=1

 

 

 

 

 

 

 

 

 

_

П

 

-1 р)2 2 л — р)2+ п (х — р)2] :

 

~

 

 

/ =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

V

 

(Xt р)2п (х — р)2= — 2

(•** ~ Р?

 

п

ih=1

 

 

 

 

 

i =1

 

 

 

 

 

4 -

 

2

ix t - v )

 

 

 

 

 

 

i=i

 

 

 

 

В случае отсутствия зависимости между членами исходной по­ следовательности можно записать

М {(JCi — р)(Xi+k— р)} = М (xt — p)M(xi+k — р )= 0 .

Поэтому, переходя к математическому ожиданию выборочных дисперсий, получаем

П

 

 

 

П

М {S2) = 4 - 2 м

 

^

- 2 М ((*<- н-)2) =

1=1

 

 

 

1=1

п

1

о

71 — 1

п

2

---------п

о2=

------------п

о2.

261

Полученное соотношение является основой зависимости (5.6), которая обычно и используется в руководствах по гидрологии для оценки выборочного значения дисперсии при п < 20. При п > 20 по­

правку на смещение вследствие ее незначительности не учитывают.

Рассмотренный способ устранения

смещенности выборочных

значений параметров путем введения

поправки

на смещенность

во многих случаях является более рациональным,

чем построение

некоторых сложных функций, обеспечивающих получение выбороч­ ных значений, лишенных эффекта смещенности. Способ устранения смещенности введением соответствующих поправок используется в дальнейшем при изложении метода статистических испытаний

для оценки выборочных значений параметров.

 

По определению, коэффициент

вариации представляет собой

отношение среднего

квадратического отклонения к среднему C„ =

= L^rr-.

Учитывая,

что среднее значение является

несмещенной

х

математического ожидания,

а смещенность

оценки сред­

оценкой

него квадратического отклонения может быть устранена по равен­ ству (5.6), можно было бы ожидать, что коэффициент вариации определяется без систематического смещения. Однако Е. Г. Блохи-

нов

[18] теоретическим анализом получил, что для случая CS = 2C„

коэффициент вариации, не имеющий систематического

смещения,

может быть определен из приближенной формулы

 

 

Ж(Св)= С „ - - ^ - ( 1 + ЗС“),

(5.7)

где п — число членов ряда; С„ — несмещенная оценка

коэффици­

ента

вариации; M(CV) — математическое ожидание

смещенной

оценки коэффициента вариации.

Указанный вывод, по мнению Блохинова, следует из того обсто­

ятельства, что несмещенность аргументов и сгж) не определяет несмещенности функции (Cv). Поправка на смещенность выбороч­

ной оценки С„, вытекающая из формулы (5.7) при п>20, состав­ ляет 2—5%, и поэтому обычно не учитывается. Полученная Блохиновым аналогичным образом поправка для устранения отрицатель­ ной смещенности выборочной оценки коэффициента асимметрии имеет вид

(п — 1) (я — 2) •

Однако эта поправка не обладает необходимой точностью и под­ лежит уточнению на основании метода статистических испытаний, излагаемого ниже.

Состоятельные несмещенные оценки, полученные различными методами, могут иметь различное рассеяние. Например, при нор­ мальном законе распределения вероятностей для оценки центра распределения (математического ожидания) можно использовать как среднее арифметическое значение, так и эмпирическую меди­

262

ану. Обе эти оценки состоятельны и несмещены, однако величина их рассеяния неодинакова. Поэтому возникает необходимость в оценке выборочных оценок параметров по их дисперсии. При этом

в качестве критерия эффективности двух каких-либо оценок оч

и а2 одного и того же выборочного значения параметра а принима­

ется отношение

е =

(5.9)

Da2

Если е < 1, то оценка at более эффективна, чем а% (и наоборот),

так как ей соответствует меньшее рассеяние. Та оценка оч, у кото­ рой дисперсия не превосходит некоторого теоретического возмож­ ного минимума, называется эффективной оценкой с минимально возможной дисперсией.

В качестве примера оценим эффективность применения крите­ рия для оценки математического ожидания нормальной генераль­ ной совокупности средней арифметической и медианы. Дисперсия случайных колебаний среднего арифметического значения для ряда случайных величин, включающих п членов, определяется по выра­ жению

D ( x ) =

(5.10)

где D (х) — дисперсия генеральной совокупности.

Действительно,

после определения дисперсии и среднего арифметического имеем:

D (х) = М [(эс-Хо)2],

 

JC=

Хи

 

где М — символ

математического ожидания;

х0— математическое

ожидание генеральной совокупности.

 

 

Вследствие независимости лч можно написать

D (х )— М

1

= 4 - 2 м

co)2i =

П2 1 х г ■х0

 

пР (х)

1

 

 

Р(х)

 

 

п2

 

 

так как D(x)— M [(л;,— х0)2].

Таким образом, среднее квадратическое отклонение (случайная ошибка) выборочной средней арифметической равно среднему квадратическому отклонению генеральной совокупности, уменьшен­

ному в У п раз,

0_

°х

(5.11)

Vn ■

X

 

263

Подставим в (5.11) ox= Cvxx, получим обычно использующуюся

в гидрологии зависимость

Сг,х х

о_ (5.12)

X Vn

Пользуясь зависимостью (5.12), можно установить необходимое число лет наблюдений п для получения нормы рассматриваемой

величины '(например, стока) с заданной случайной ошибкой при различных значениях величины коэффициента вариации. Для гене­ ральной совокупности, подчиняющейся нормальному закону рас­ пределения, дисперсия медиан, полученных из выборок объема п членов, определяется по формуле

D ( Ме) =<£ед=

а2

 

 

 

-

|

-

(5.13)

Используя зависимости (5.11) и (5.13), определим эффектив­ ность медианы по сравнению со средней арифметической

 

с2-

ах 1

Я

. 4 =

2

_

 

е(Ме) =

X

0,64.

а2

п 1

2

п

1Z

 

 

мед

 

 

 

 

 

 

Приведенное соотношение показывает, что для определения оценки центра по среднему арифметическому нужно использовать лишь 64% того числа наблюдений, которое требуется для решения этой задачи через оценку медианы.

Приведенные в настоящем разделе краткие сведения о способах оценки точности выборочных значений параметров, в частности, о способах устранения смещения, полученные путем теоретического анализа, имеют преимущественно иллюстративное значение, по­ скольку они относятся к нормально распределенным совокупностям или к гамма-распределению, ограниченному условием Cs= 2Ct!. Более полное исследование точности выборочных оценок парамет­ ров, выполненное на основании метода статистических испытаний, изложено в § 4 настоящей главы.

§ 3

методы определения оценок параметров распределения

При решении гидрологических задач используются следующие методы определения оценок параметров распределения:

1 ) метод моментов;

2 ) метод квантилей;

3 ) метод наибольшего правдоподобия.

Метод моментов получил наибольшее распространение в прак­ тике гидрологических расчетов. Сущность его заключается в том, что искомые параметры распределения выражаются через мо­

264

менты, в качестве оценок которых принимают значения моментов эмпирического распределения обычно с поправками на ликвидацию смещения. Число эмпирических моментов, определенных по мате­ риалам наблюдений, равно числу параметров рассматриваемого за­ кона распределения. Как уже отмечалось, достоверность эмпириче­ ской оценки моментов с возрастанием их степени при данном объ­ еме совокупности резко снижается. Поэтому в гидрологии обычно не применяются распределения, зависящие более чем от трех пара­ метров.

Параметры законов распределения через статистические мо­ менты выражаются формулами (1.1), (1.22) и (1.27). Оценки пара­ метров, полученные способом моментов, применительно к законам распределения, используемым в гидрологии, являются состоятель­ ными для случая внутрирядно несвязанных величин. Смещение оце­ нок невелико и может быть устранено с помощью простых по­ правок.

Метод квантилей основан на использовании связи величин вы­ борочных параметров со значениями соответствующих квантилей. В гидрологических расчетах получил распространение графоанали­ тический вариант метода квантилей, разработанный Г. А. Алексее­ вым [3, 5]. Технические приемы применения этого метода рассмот­ рены в главе III.

Сущность

метода наибольшего правдоподобия заключается

в следующем.

При независимых испытаниях вероятность совмест­

ного появления в выборке значений хх, х2, ..., хп в границах: для первого члена от х\ до Xi+ Axi

для

второго члена от х2 до х2+Ах2

для

л-го члена

от хп до хп+ Ахп

равна (для распределения с одним параметром а)

Р = Р 1(х[; а)Р2(х2; а) ..

. Рп(хп, а)АххАх2 . . . Ахп.

Здесь Pi (Х{, a)Axi — вероятности того, что любое, взятое на вы­ борку значение х* попадет в некоторый интервал (х,-— Xj+i). Эти

вероятности при достаточно малых интервалах могут приближенно считаться пропорциональными ординатам кривой плотности веро­ ятностей (Р') функции распределения, используемой для описания

рассматриваемой совокупности.

Поскольку выборочные значения хь ..., хп случайной величины

фактически наблюдались в процессе опыта, то наиболее вероятно такое значение параметра а, или нескольких параметров, при кото­

ром эта вероятность максимальна, т. е. при которой достигает мак­ симума произведение вероятностей (или, что то же, сумма логариф­ мов вероятностей) наблюденных величин

L(XU х 2, . . ., х п\ а )= р [( х и а)Р2(х2, а) . . . Р'„(хп, а). (5.14)

Выражение (5.14) называется функцией правдоподобия.

265

Таким образом, в качестве оценки для неизвестного параметра а принимается его значение, получаемое из уравнения

 

 

-

Ж

-

0 -

(5-15)

Учитывая, что In L достигает

максимума при том же значении

а, что и L, вместо уравнения (5.15)

можно использовать более про­

стое уравнение правдоподобия

 

 

 

 

1

dL _

rf In L

V

d l n P (x i. a)

(5.16)

L

da

da

* *

da

 

 

 

 

l

 

 

Непосредственно из выражения

(5.16) следует, что метод наи­

большего правдоподобия придает

больший вес тем

выборочным

значениям случайной величины,

которым соответствуют большие

значения вероятностей. Это свойство метода наибольшего правдо­ подобия в большей мере проявляется в асимметричных распределе­ ниях. В методе же статистических моментов, наоборот, придается больший вес крайним членам выборки и меньший — средним. Поэтому метод наибольшего правдоподобия приводит к более устойчивым оценкам параметров, чем метод моментов. Метод наи­ большего правдоподобия приводит к состоятельным оценкам, рас­ пределенным асимптотически нормально, имеющим наименьшую возможную дисперсию по сравнению с другими, также асимптоти­ чески нормальными оценками, и наилучшим образом использующим всю информацию о неизвестном параметре, содержащуюся в вы­ борке. Оценки по методу наибольшего правдоподобия могут быть смещены. Это смещение, в общем незначительное, может быть уст­ ранено введением соответствующих поправок.

Применительно к закону нормального распределения оценки, получаемые методом наибольшего правдоподобия, совпадают с моментными оценками. Для других распределений эти методы дают, как правило, различные результаты.

Метод наибольшего правдоподобия в практику гидрологических

расчетов введен С. Н. Крицким и М. Ф. Менкелем

[6 8]. До практи­

ческого использования этот метод

доведен Е.

Г.

Блохиновым

[ 20, 22].

оценку методом

наибольшего

В качестве примера рассмотрим

правдоподобия параметров нормального распределения.

Как известно, нормальный закон распределения применительно

к выборке объема п может быть записан в виде

 

Р(хг, х 0;

о)=

-2? (■*!-*о)2

(5.17)

У 2т.

 

 

 

Образуем функцию правдоподобия (5.14), для чего предвари­ тельно найдем логарифмы величин Р (xit х0, о)

In P(Xj\ Хо, а )= —In а — ~2~!п --- 2^Г~ — -^о)2-

(5.18)

266

Суммируя величины 1пР для всех наблюденных значений хи по­ лучим функцию правдоподобия

11

 

п

 

п

 

 

п

Z . = 2 ln / 3(jc/;

а\ o)=

- 2 l n o — § " 2 1п21Г —

—-^о)2-

1

 

i

 

l

l

 

 

Далее, находим уравнение

правдоподобия

dL

=0 примени-

dxо

тельно к оценке параметра х0

 

 

 

 

 

 

(1L _____

1

П

 

 

 

 

 

V

(JC! — лг0)=

0 ,

 

 

 

dxо

 

 

 

 

 

 

откуда, учитывая,

что 2Цх0 = пх0, получаем

 

 

 

 

1

 

 

 

 

 

 

 

 

 

2

*i

 

 

 

 

 

х 0=- 1

 

 

 

 

Таким образом, статистической оценкой параметра xq (матема­

тического ожидания) в данном случае является величина среднего арифметического значения ряда величин Xi.

Для получения методом наибольшего правдоподобия выраже­ ния статистической оценки параметра о образуем уравнение прав­

доподобия —- - = 0

 

 

do

 

 

dL

2 ^ г + ^ г 2

(-*<-*о)2,

dv

или

i

 

 

 

dL

^ 2 (-*1 --*о)2 - - д г = о .

da

Откуда получим

 

 

 

П

 

 

2 (*1 -

хо)2

 

1

 

п

(5.19)

 

т. е. выражение среднего квадратического отклонения.

Из приведенного анализа следует, что применительно к нор­ мальному закону распределения оценки параметров, полученные методом наибольшего правдоподобия, совпадают с моментными оценками. Для других кривых распределения такое полное совпа­ дение не является обязательным.

В качестве второго примера рассмотрим, согласно анализу, вы­ полненному С. Н. Крицким и М. Ф. Менкелем [68], примене­

ние метода наибольшего правдоподобия для оценки параметров

267

биномиальной кривой при CS = 2CV. Как показано в главе I, урав­

нение этой кривой имеет вид

Р (хг, а; т) = - ± - •

е

^

Х‘ х[~ х-

 

 

(5.20)

Следуя изложенному выше порядку, имеем

 

 

 

 

In P{Xi\ а ; 7) = —т In &+Т In 7 — In Г (7) —

J- .xy-f- 7 1пл:г — Inx h (5.21)

В таком случае функция правдоподобия

(5.18)

будет иметь вид

п

 

 

п

 

п

 

 

п

 

 

 

Л = 2 1п(л:ь а > 7 ) = - 2 7 1 п а + 2 т 1 п т - 2 > Г ( Т) -

 

 

1

 

1

 

1

 

 

 

 

 

Соответственно

уравнение

правдоподобия

 

применительно

к оценке параметра а запишем в виде

 

 

 

 

 

 

 

 

d.L

-7 2

4

V

7

Xi

п

 

 

 

 

 

da

' jLi

а2

U‘

 

 

 

 

И, следовательно,

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

1

у

1п

 

 

 

 

 

 

 

 

1

а2

x i—

а ’

 

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 V Л'; =

П ,

 

 

 

 

 

(5.22)

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(5.23)

Из (5.23) следует, что наиболее

эффективным

измерителем

для оценки параметра а биномиальной кривой при

CS — 2CV явля­

ется среднее арифметическое значение статистического ряда.

Для оценки

параметра у уравнение

правдоподобия

запишем

в виде

 

 

 

 

 

 

 

 

 

 

 

dL

 

 

 

 

 

 

2

a

2

*

In x t= 0 ,

2 l n « + 2 ( In7 + 1) - 2 ^ b 1^

jmmi

 

1

1

1

 

 

1

 

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

-гс1па+/г(1пт+ 1 ) - л

 

 

2 In*,.

 

 

 

 

1

 

1

 

 

1

 

 

268

Учитывая равенство (5.22), получаем

4Г(у)

2

{axi

■In а.

(5.24)

In у=

п

dy

1

 

 

Выражение, стоящее в правой части равенства (5.24), можно представить в виде

П

 

П

 

 

 

2 in*,

 

1

2 1па

2

1п——

1

1па=

1

1

а

п

 

п

 

 

 

 

 

 

Таким образом, окончательно имеем

- й - 2 1 п - Т - = - ^ - 1 п Г ( т ) - 1 п Т.

(5.25)

Из (5.25) следует, что наиболее эффективным измерителем для оценки параметра у биномиальной кривой при Ca = 2Cv является

выборочная оценка среднего значения логарифмов ряда модульных коэффициентов рассматриваемой величины.П

Между величиной измерителя Х= —

и коэффициен-

1

х

том вариации С„ существует функциональная связь, определяемая

уравнением (5.25), поскольку параметр у = - ^ - .

 

 

Значения

величины

 

 

ОV

в зависимости

коэффициента вариации

 

 

П

 

 

 

 

от измерителя1 Я=—- ^ l g ——, отвечающие уравнению

(5.25),

 

 

 

*

 

 

[2 2], ко­

представлены в той части таблицы, приведенной в работе

торая соответствует условию CS = 2CV.

методом

наибольшего

В соответствии со схемой

построения

правдоподобия

оценок

параметров, изложенной

применительно

к нормальному и биномиальному (при CS=2C„) законам распреде­

ления, рассмотрим (следуя

разработкам

Е. Г. Блохинова [22])

прием построения таких оценок для условий трехпараметрического

гамма-распределения. Плотность

вероятностей этого распределе­

ния записывается так:

 

 

„7/6-1 X

 

Р(х, х 0, у,

Ь)= Г (т + 6)

Т/6

1

 

 

 

 

 

 

г (у)

 

1Ь | г (у) х у ь

 

 

Х ехр ( —

г (у + Ь)

■ У 11/ 6)

(5.26)

 

 

Г (у)

*0 J Г

 

 

 

 

1 При практическом

использовании

измерителя I

применяются десятичные

логарифмы.

 

 

 

 

 

2 6 9

Соседние файлы в папке книги из ГПНТБ