
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfОтметим, что про случайную величину (в данном случае а) говорят, что она сходится по вероятности к величине а, если при увеличении п выполняется равенство
(5.2)
П
где е — сколь угодно малая величина.
Оценки, удовлетворяющие требованию (5.1) и (5.2), называются
состоятельными.
Состоятельность статистической оценки обеспечивает ее практи ческую близость (по крайней мере, при больших значениях п) к ис
комому параметру. Примером состоятельных оценок являются вы борочные оценки среднего значения и дисперсии. Из состоятельно сти оценки еще нельзя сделать полного вывода о ее пригодности для приближенного определения соответствующего параметра при малых п, так как в этих условиях состоятельная оценка может ук
лоняться в ту или иную сторону от искомого значения параметра. Поэтому вторым условием, предъявляемым к статистическим оценкам, является условие несмещенности, т. е. отсутствие в ней си стематической погрешности при любом п. Для несмещенной оценки
ее математическое ожидание должно совпадать с параметром гене ральной совокупности
(5.3)
Здесь имеется в виду, что математическое ожидание оценки а определяется из множества выборок случайной переменной х объ емом N при любом конечном (в том числе и при малом) числе п членов в выборке (n<^N). Оценка называется положительно сме
щенной, если М (а )> а , и отрицательно смещенной, если М (а)< а.
Требование несмещенности оценок особенно важно при малых объемах выборок (рядов наблюдений), с которыми обычно прихо дится иметь дело гидрологам. Выборочное среднее арифметическое значение является не только состоятельной, но и несмещенной оценкой математического ожидания
М (х)= р..
Это вытекает из следующих очевидных соотношений:
M(Xi) = [x,
и значит
п
п
£ ( X i — X )2
Выборочное же значение дисперсии S2=
п
(5.4)
при ма-
260
лых п является отрицательно смещенной оценкой дисперсии гене
ральной совокупности
М (52) = |
(5.5) |
Величина S2, исправленная на величину смещения и, следова
тельно, являющаяся уже состоятельной несмещенной оценкой, мо жет быть определена, согласно формуле (5.5), по соотношению
|
|
|
|
52= |
—-------,---- |
(5.6) |
||||
|
|
|
|
|
|
|
П— 1 |
|
|
|
Выражение (5.6) получается |
из следующих преобразований: |
|||||||||
5 2= -^ - 2 |
и - * ) 2= |
4 г 2 |
[(-«i—i*)—(^ — |
|||||||
|
|
|
/ = 1 |
|
|
i — 1 |
|
|
||
|
|
п |
|
|
|
|
|
|
|
|
|
|
^ |
|
[(^« —!А)2 —2 U —р.)(хг —р)+ |
(л: —а)2] = |
|||||
|
|
1= 1 |
|
|
|
|
П |
|
|
|
|
|
П |
|
|
|
|
|
|
|
|
п |
2 |
|
— В-)2 — 2 (■*—р) |
2 |
(-*г —I1) + /*(■*—р)2] = |
|||||
|
I |
=1 |
|
|
|
|
|
i =1 |
|
|
|
" |
|
|
_ |
|
|
2 j |
б** — !*) |
|
|
|
2d {xt — \>)2—2n (х — р) |
- = 1- - ----------\-п(х- р)2 |
||||||||
|
1=1 |
|
|
|
|
|
|
|
|
|
|
_ |
П |
|
{х-1 — р)2 — 2 л (х — р)2+ п (х — р)2] : |
||||||
|
~ |
|
||||||||
|
/ =1 |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
||
|
J |
V |
|
(Xt — р)2— п (х — р)2= — 2 |
(•** ~ Р? |
|||||
|
п |
ih=1 |
|
|
|
|
|
i =1 |
|
|
|
|
|
|
4 - |
|
2 |
ix t - v ) |
|
||
|
|
|
|
|
i=i |
|
|
|
|
В случае отсутствия зависимости между членами исходной по следовательности можно записать
М {(JCi — р)(Xi+k— р)} = М (xt — p)M(xi+k — р )= 0 .
Поэтому, переходя к математическому ожиданию выборочных дисперсий, получаем
П |
|
|
|
П |
М {S2) = 4 - 2 м |
|
^ |
- -ж 2 М ((*<- н-)2) = |
|
1=1 |
|
|
|
1=1 |
п |
1 |
о |
71 — 1 |
п |
=а2 |
---------п |
о2= |
------------п |
о2. |
261
Полученное соотношение является основой зависимости (5.6), которая обычно и используется в руководствах по гидрологии для оценки выборочного значения дисперсии при п < 20. При п > 20 по
правку на смещение вследствие ее незначительности не учитывают.
Рассмотренный способ устранения |
смещенности выборочных |
|
значений параметров путем введения |
поправки |
на смещенность |
во многих случаях является более рациональным, |
чем построение |
некоторых сложных функций, обеспечивающих получение выбороч ных значений, лишенных эффекта смещенности. Способ устранения смещенности введением соответствующих поправок используется в дальнейшем при изложении метода статистических испытаний
для оценки выборочных значений параметров. |
|
|||
По определению, коэффициент |
вариации представляет собой |
|||
отношение среднего |
квадратического отклонения к среднему C„ = |
|||
= L^rr-. |
Учитывая, |
что среднее значение является |
несмещенной |
|
х |
математического ожидания, |
а смещенность |
оценки сред |
|
оценкой |
него квадратического отклонения может быть устранена по равен ству (5.6), можно было бы ожидать, что коэффициент вариации определяется без систематического смещения. Однако Е. Г. Блохи-
нов |
[18] теоретическим анализом получил, что для случая CS = 2C„ |
|
коэффициент вариации, не имеющий систематического |
смещения, |
|
может быть определен из приближенной формулы |
|
|
|
Ж(Св)= С „ - - ^ - ( 1 + ЗС“), |
(5.7) |
где п — число членов ряда; С„ — несмещенная оценка |
коэффици |
|
ента |
вариации; M(CV) — математическое ожидание |
смещенной |
оценки коэффициента вариации.
Указанный вывод, по мнению Блохинова, следует из того обсто
ятельства, что несмещенность аргументов (х и сгж) не определяет несмещенности функции (Cv). Поправка на смещенность выбороч
ной оценки С„, вытекающая из формулы (5.7) при п>20, состав ляет 2—5%, и поэтому обычно не учитывается. Полученная Блохиновым аналогичным образом поправка для устранения отрицатель ной смещенности выборочной оценки коэффициента асимметрии имеет вид
(п — 1) (я — 2) •
Однако эта поправка не обладает необходимой точностью и под лежит уточнению на основании метода статистических испытаний, излагаемого ниже.
Состоятельные несмещенные оценки, полученные различными методами, могут иметь различное рассеяние. Например, при нор мальном законе распределения вероятностей для оценки центра распределения (математического ожидания) можно использовать как среднее арифметическое значение, так и эмпирическую меди
262
ану. Обе эти оценки состоятельны и несмещены, однако величина их рассеяния неодинакова. Поэтому возникает необходимость в оценке выборочных оценок параметров по их дисперсии. При этом
в качестве критерия эффективности двух каких-либо оценок оч
и а2 одного и того же выборочного значения параметра а принима
ется отношение
е = |
(5.9) |
Da2
Если е < 1, то оценка at более эффективна, чем а% (и наоборот),
так как ей соответствует меньшее рассеяние. Та оценка оч, у кото рой дисперсия не превосходит некоторого теоретического возмож ного минимума, называется эффективной оценкой с минимально возможной дисперсией.
В качестве примера оценим эффективность применения крите рия для оценки математического ожидания нормальной генераль ной совокупности средней арифметической и медианы. Дисперсия случайных колебаний среднего арифметического значения для ряда случайных величин, включающих п членов, определяется по выра жению
D ( x ) = |
(5.10) |
где D (х) — дисперсия генеральной совокупности. |
Действительно, |
после определения дисперсии и среднего арифметического имеем:
D (х) = М [(эс-Хо)2],
|
JC= |
Хи |
|
где М — символ |
математического ожидания; |
х0— математическое |
|
ожидание генеральной совокупности. |
|
|
|
Вследствие независимости лч можно написать |
|||
D (х )— М |
1 |
= 4 - 2 м |
co)2i = |
П2 1 х г ■х0 |
|||
|
пР (х) |
1 |
|
|
Р(х) |
|
|
|
п2 |
|
|
так как D(x)— M [(л;,— х0)2].
Таким образом, среднее квадратическое отклонение (случайная ошибка) выборочной средней арифметической равно среднему квадратическому отклонению генеральной совокупности, уменьшен
ному в У п раз,
0_ |
°х |
(5.11) |
|
Vn ■ |
|||
X |
|
263
