Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии

.pdf
Скачиваний:
68
Добавлен:
22.10.2023
Размер:
14.87 Mб
Скачать

членов ряда. Так, медиана ряда среднегодовых расходов воды р. Днепра в створе у пгт Лоцманской Каменки после расположения этого ряда в убывающем порядке равна 1620 м3/с.

В случае сгруппированных данных наблюдений медиана может

быть рассчитана по следующей приближенной формуле:

 

Me=vV1

(1.9)

где N1 — конец медианного интервала; h — размер интервала; п

число членов ряда; S — накопленная частота до значения АД, т — число случаев в медианном интервале.

Расчеты медианы по данной формуле будут тем точнее, чем рав­ номернее распределение данных наблюдений внутри медианного интервала. Медиана для ряда годового стока р. Днепра, рассчитан­ ная по формуле (1.9), равна

200 (—4^-----

63'j

Me = 1699 -------- ---------------

=1623 м3/с.

Произведем расчет медианы сгруппированных приведенных выше данных о рельефе болота: jVt =16, h = 2; п = 903; S = 422; m = 144. Подставляя эти значения в формулу (1.9), получаем

М е=16

144

15,6 см.

 

 

Из произведенных расчетов видно, что значение медианы опре­ деляется только величиной срединного или двух срединных значе­ ний ряда, расположенного в убывающем порядке, и не зависит, в отличие от средней арифметической, от остальных членов ряда.

Иначе говоря, медиана не изменяется, если любые значения ар­ гумента, меньшие медианы, изменяются как угодно, оставаясь лишь при этих изменениях меньше Me, а любые значения рассмат­ риваемого ряда, большие Me, изменяются как угодно, оставаясь больше Me. Подобные изменения, очевидно, очень сказываются на значении средней арифметической. Это свойство медианы делает использование ее более целесообразным, чем использование сред­ ней, в тех случаях, когда конечные члены ряда неточны и нена­ дежны. Но медиана по сравнению со средней арифметической имеет тот недостаток, что не поддается так же легко, как средняя арифметическая, аналитическим операциям; например, для нее не применима теорема сложения.

Таким образом, соединив два ряда с известными медианами, ни­ чего нельзя сказать о медиане полученной совокупности, не вычис­ лив ее независимо от известных медиан составляющих рядов.

Перпендикуляр, восстановленный в точке, соответствующей зна­ чению медианы, к оси варьирующего признака, делит площадь ги­ стограммы на две равные части.

40

Отметим без доказательства основное свойство медианы, кото­ рое заключается в том, что сумма абсолютных отклонений значений членов статистического ряда от медианы минимальна по сравне­ нию с аналогичной суммой, образованной из отклонений от любой другой величины, отличной от Me.

§ 6

мода

Модой называется наиболее вероятная (наиболее часто встре­ чающаяся) в данном статистическом ряду величина. Или иначе, мода представляет собой наибольшую ординату кривой распреде­ ления в случае одновершинного распределения. В общем случае кривая распределения может иметь несколько вершин и соответст­ венно она будет иметь несколько мод.

Определение моды через наибольшие значения кривой распре­ деления— задача довольно сложная, а при небольших рядах на­ блюдений вообще практически невыполнимая. В качестве прибли­ женного значения моды можно взять середину интервала с наи­ большей частотой в сгруппированных данных наблюдений. Так, для ряда среднегодовых расходов воды р. Днепра у пгт Лоцманской Каменки Мо=1600 м3/с, а для поверхности микроландшафта Мо = = 19,5 см.

Для не очень асимметричных и одновершинных распределений мода может быть рассчитана по приближенному равенству, уста­ новленному К. Пирсоном,

М о = л :+ 3 (М е -л ).

(1.10)

Значение моды, рассчитанное по этой формуле для среднегодо­ вых расходов воды, равно 1576 м3/с, а для поверхности болотного микроландшафта — 26,3 см.

Использование моды, так же как и медианы, целесообразно при анализе резко асимметричных распределений, когда среднее ариф­ метическое уже не является достаточно представительным парамет­ ром распределения и его целесообразно дополнить модой и ме­ дианой.

§ 7

средняя геометрическая и средняя гармоническая

Иногда в целях получения лучшего соответствия закона распре­ деления эмпирического ряда некоторым статистическим (теорети­ ческим) схемам осуществляют преобразование величин эмпириче­ ской совокупности. В качестве такого преобразования часто приме­ няют логарифмирование величин исходного ряда. В этом случае вместо исходных величин xi, Xz, Хз, ..., хп. образуется ряд,

41

состоящий из lg'A'i,

lgX2, lg лгз, . . lg Xn-

Среднее арифметическое

значение этого нового ряда, очевидно, равно

 

lg G = 4

- (lg ^ 1+ lg x 2+ lg x 3+

. . . + lg д:л).

(M l)

Соотношение (2.11) получается путем логарифмирования исход­

ного выражения следующего вида:

 

п-------------------

(1.12)

G = у х 1х 2х 3. . . х п,

которое представляет собой среднее геометрическое значение аргу­ мента х, принимающего положительные значения хи х2, Хз, ..., хп.

Из соотношений (1.11) и (1.12) следует, что логарифм средней геометрической (G) равен средней арифметической из логарифмов значений величин рассматриваемого статистического ряда.

Как доказывается в математической статистике [111], среднее геометрическое всегда меньше среднего арифметического.

В качестве одной из форм трансформации величин исходного ряда статистической совокупности используют преобразование со-

1

вокупности положительных величин х±, хг, Хз, ..., хп в ряд вида — ,

,у . .

Хо Хз Хп

Среднее арифметическое значение трансформированного ука­

занным образом ряда равно

 

 

отсюда

 

 

 

H = j _

j _ J _

----------•

(1ЛЗ)

х х + х 2 + х 3 +

+ х п

 

Величина Я, обратное значение которой равно средней арифме­ тической из обратных значений переменной х, называется средней гармонической величины х.

Некоторые примеры логарифмического преобразования исход­ ного ряда и использования средней гармонической в гидрологиче­ ских расчетах рассмотрены в главе II.

Таким образом, средние значения (среднее арифметическое зна­ чение, медиана, мода и др.) являются характеристиками, вокруг которых осуществляется группирование вариационных рядов, или, как говорят, центрами группирования. Средние значения описы­

вают некоторые важные свойства статистических совокупностей, но не являются исчерпывающими их характеристиками. Действи­ тельно, можно себе представить два ряда величин, средние значе­ ния которых равны между собой, а характер рассеивания относи­ тельно средних будет различный. Например, среднее арифметиче­ ское значение уровня воды в замкнутом водоеме при слабом

42

и сильном волнении будет одно и то же. Однако характер колеба­ ний уровня воды при многократном измерении, очевидно, будет различным. Следовательно, для описания подобных совокупностей необходимо учитывать характеристики мер рассеивания, к рассмот­ рению которых перейдем в следующих параграфах.

§8

простейшие меры рассеивания

Наиболее простой мерой рассеивания, или изменчивости, стати­ стического ряда является амплитуда, или размах варьирования, ра­ нее введенный при группировании данных наблюдений

Л=л:„

(1.14)

Как следует из этой формулы, для вычисления амплитуды необ­

ходимо знать лишь наибольшее и наименьшее значения ряда

на­

блюдений. Так, амплитуда колебаний годового стока

р. Днепра

у пгт Лоцманской Каменки равна А =3040 — 717 = 2323

м3/с, а ам­

плитуда колебаний поверхности рассматриваемого болота

А =

=32— 1=31 см.

Сувеличением продолжительности ряда наблюдений амплитуда колебаний может лишь увеличиваться, что вносит некоторую неоп­

ределенность в использование амплитуды как характеристики рас­ сеивания. Введение поправок на число членов ряда при расчете амплитуды во многих случаях полностью не устраняет этого недо­ статка. Кроме того, амплитуда имеет большие случайные колебания от выборки к выборке, что также затрудняет ее использование. Не­ смотря на эти недостатки, амплитуда применяется в некоторых слу­ чаях в гидрологических расчетах. Например, при оценке оправды­ ваемое™ гидрологических прогнозов наряду с другими более совер­ шенными методами иногда используется 20% амплитуды. Если разность между прогнозируемой и фактической величиной меньше Vs А, то прогноз считается удовлетворительным, а в противном слу­

чае — неудовлетворительным.

В качестве другой характеристики меры рассеивания исполь­ зуется среднее абсолютное отклонение, которое рассчитывается по формуле

S l( * £ - * ) l

d = ^ — n--------

,

(1.15)

где п — число членов ряда xt, от t'=l до i = n\ х — среднее арифме­

тическое значение.

Наиболее существенный недостаток среднего абсолютного от­ клонения заключается в том, что при его расчете не учитывается

знак разности (х{ х), что затрудняет усовершенствование схемы

43

его подсчета. Вклад малых и больших отклонений Xi от х учиты­

вается одинаково, что несколько снижает ценность этого параметра как меры изменчивости.

Величина средних абсолютных отклонений для годового стока р. Днепра у пгт Лоцманской Каменки оказалась равной 360 м3/с, а для поверхности болотного микроландшафта — 3,6 см.

§ 9

среднее квадратическое отклонение (стандарт), дисперсия, коэффициент вариации

Наиболее часто используемой мерой рассеивания статистиче­ ского ряда относительно средней арифметической его величины яв­ ляется среднее квадратическое отклонение ох ., или стандарт,

/ »------------

(1.16)

Среднее квадратическое отклонение сохраняет размерность ис­ ходного ряда наблюдений.

В случае использования таблицы сгруппированных данных сред­ нее квадратическое отклонение может быть рассчитано по формуле

2

«г (xi -

x f

^

п---------

- 0-17)

где щ — абсолютная частота статистического ряда в t-том интер­

вале.

Квадрат среднего квадратического отклонения называется дис­ персией.

В некоторых случаях может оказаться полезным вычисление среднего квадратического отклонения, основанного на способе, по­ следовательных разностей,

п —1

2 (xi - xi-n)2

а»= i=?±2Tn - 1)-----

*

0-18)

Расчеты по этой формуле не требуют предварительного вычисле­ ния среднего арифметического значения. Необходимо отметить, что мощность среднего квадратического отклонения, вычисленного по формуле (1.18), составляет приблизительно 2/з от вычисленного по выражению (1.16). Поэтому формула (1.18) для определения о

редко используется. Однако она может оказаться полезной, когда

44

в исходном ряду имеют месте циклические или направленные ко­ лебания среднего значения. В подобных случаях в среднем квадра­ тическом отклонении, вычисленном по выражению (1.18), будут ис­ ключены колебания среднего значения, в то время как в среднее квадратическое отклонение, определенное по формуле (1.16), эти колебания среднего войдут.

Рассмотрим общие свойства дисперсии.

1. Если сумму квадратов отклонений ряда наблюдений xt около величины а назвать дисперсией Xi около а

П

то дисперсия а2 достигает наименьшего значения, когда а=х. Это

свойство дисперсии было рассмотрено при описании свойств сред­ ней арифметической.

2.Если некоторая величина yt связана с х» уравнением вида yi =

= axi + b, где а к b — постоянные величины,то а2у = ах2а2,или иначе

П

2 (x, — b f — (x — b)2.

Это равенство часто используется при вычислении дисперсии. При этом постоянные выбираются таким образом, чтобы разности (Xi b) были наименьшими, т. е. удобными для вычислений;

3. Рассмотрим очень важное свойство сложения дисперсий, ко­

торое находит применение в гидрологических расчетах и при раз­ работке различных теоретических вопросов статистики.

Общая дисперсия суммы k рядов наблюдений случайной вели­ чины х равна средней арифметической частных дисперсий, сложен­

ной с дисперсией частных средних около общей средней

 

k

 

k

 

 

h = 1_____■

h—1

 

(1.19)

 

k

'

 

k

 

 

 

где

 

 

 

 

 

X\i

X \2

• •

X\i . . . X \n,

 

X21

X22 . . .

X21 . .

. Х 2пг

 

X/ti

Xh2 . . . Xhi ..

. x hnh

 

Xfi\

Xy2 •

• •

Xfci . . . Xknk

 

45

— исходные ряды наблюдений;

 

 

 

п,

Пг

 

V Х\1

V *21

 

2 X ki

х 2 =

! = 1

Xk-

i =1

Щ

Л2

 

«fc

средние арифметические частных совокупностей;

aj : i—1

Л1

i—1

2 i= l

— средние квадратические отклонения частных совокупностей; пи п-2 , . . tih — объемы частных совокупностей; х — общая средняя всех

 

Z (X) х)2

наблюдений; сг=

3=1

--------- ------------- общая дисперсия всех наблюде­

ний, где / пробегает значения от /= 1 до i = rih и от h 1 до h = k\ об- k

щий объем всех данных равен п= 2 пи- h=1

Свойство сложения дисперсий находит практическое примене­ ние, когда несколько распределений соединяются в одно, или на­ оборот, когда одна большая совокупность разделяется на ряд част­

ных, для которых отдельно вычисляются Xh и a2h. Например, в ги­

дрологических расчетах иногда объединяется в одно распределение та или иная гидрологическая характеристика, полученная по от­ дельным рекам (параметры максимального или годового стока). В таком случае общая дисперсия суммарного ряда может быть вы­ числена по известным дисперсиям и средним индивидуальных ря­ дов с использованием приведенного свойства сложения дисперсий.

Некоторые дополнительные свойства выборочной дисперсии бу­ дут рассматриваться в главе V. Здесь лишь укажем без доказатель­ ства, что выборочная дисперсия сколь угодно мало отличается от дисперсии генеральной совокупности, если число членов наблюде­ ний будет достаточно велико. В практических расчетах дисперсии по ряду наблюдений следует пользоваться формулой

з2= ------

.

(1.20)

которая здесь также приводится без доказательства и которая дает наилучшее приближение выборочной дисперсии к дисперсии гене­ ральной совокупности без систематической ошибки. Заметим, что

46

при л > 30 поправка на постоянное смещение ст2 (вместо п в знаме­ нателе используется п — 1) несущественна. Однако, учитывая не­

сложность введения поправки на смещение а2, предпочтительней всегда пользоваться формулой (1.20) вместо (1.16) — (1.18).

В гидрологических расчетах часто возникает необходимость сравнения изменчивости рядов, образованных из существенно раз­ личающихся по величине гидрологических характеристик. В этом случае средние квадратические отклонения рассматриваемых рядов оказываются несопоставимыми. Например, среднее квадратическое отклонение рядов максимальных в году расходов воды р. Днепра У г. Киева и, допустим, р. Сож у г. Славгорода будет существенно отличаться хотя бы потому, что абсолютные величины этих рядов существенно различаются. Сопоставление изменчивости подобных рядов осуществляется с помощью коэффициента вариации (Cv),

представляющего собой отношение среднего квадратического от­ клонения к среднему значению ряда

( 1-21)

Коэффициент вариации является безразмерной характеристикой изменчивости статистического ряда. Иногда коэффициент вариации

выражается в процентах от средней величины Cv

Ох

= - = - • 100%.

*

х

В гидрологических расчетах коэффициент вариации наиболее

часто определяется по формуле

 

 

 

 

 

 

 

(£,-1)2

 

 

1 22

 

V X

 

 

 

 

 

С

П— 1

 

 

( . )

 

 

 

 

 

где k = Xilx — модульный коэффициент.

 

 

 

 

Выражение (1.22)

легко получается из следующих элементарных

преобразований:

 

 

 

 

 

 

 

 

 

 

 

 

- \ о

 

(X I - х )

 

. /

 

2

Xi — X '

п __°дг

 

 

 

1

 

\

^

 

 

- ~ /

 

 

Л - 1

X

(л — 1) х

 

 

 

 

 

 

 

/

п

 

 

■ У Ш ^ - V

2 ( k i - I)2

 

л - 1

В случае сгруппированных данных наблюдений выражение (1.22)

имеет вид

 

 

 

 

 

 

СV X

Щ(h — I)2

 

 

Л -

1

 

 

(1.23)

 

 

 

 

 

где m — абсолютная частота /-той градации.

47

Между средним абсолютным

(d) и средним квадратическим

(а) отклонениями в случае, если

статистический ряд подчиняется

закону нормального распределения, имеет место следующее равен­ ство:

0,8а. (1.24)

Это соотношение может использоваться для приближенной оценки а при известном среднем абсолютном отклонении. Однако

ошибка такой оценки может быть существенной, если рассматри­ ваемый статистический ряд значительно уклоняется от нормаль­ ного.

Важной, хотя и менее употребительной (чем дисперсия и стан­ дарт) характеристикой меры рассеяния статистического ряда отно­ сительно его среднего значения является вероятное отклонение

(Д), определяемое по равенству

А = *25~ * 75 .

(1.25)

Здесь Х25 и *75 — первая и третья квартили.

Очевидно, что между Х75 и х2ь заключается половина членов ста­

тистической совокупности. Иначе говоря, величина А, отложенная

вобе стороны от медианы распределения, определяет те границы,

впределах которых заключена половина всех членов статистиче­ ского ряда. Поэтому для случайно взятого члена статистической со­ вокупности одинаково вероятно оказаться в этом интервале или

вне его. Ясно, что чем ближе к медиане располагаются указанные границы, тем меньше рассеяние статистического ряда. Поэтому Д принимается за меру рассеяния аргумента распределения. Для ус­ ловий нормального распределения Д связано с о постоянным соот­

ношением

Д = 0 ,6 7 4 а .

§ 10

асимметрия и эксцесс

Средние, определяющие центры группирования статистических совокупностей, а также различные меры рассеяния, рассмотренные в предыдущих разделах, еще не полностью описывают основные свойства статистических рядов.

В частности, важной отличительной чертой■распределения яв­ ляется их асимметрия, т. е. различное рассеяние членов ряда отно­ сительно средней или моды. Дело в том, что среди статистических совокупностей можно обнаружить такие, которые имеют одинако­ вые средние арифметические значения и дисперсии, однако группи­

48

рование относительно центра распределения величин, составляю­ щих эти совокупности, может быть либо симметричным, либо асим­ метричным.

В качестве характеристики симметричности (асимметричности) статистического ряда принимается среднее значение кубов откло­ нений членов ряда от его среднего арифметического значения

П

 

 

 

 

 

 

(v = -)r

2

U - * ) 3-

 

 

.

о -26)

 

 

 

 

 

 

 

/= 1

 

 

 

 

 

Когда члены ряда располагаются симметрично относительно

среднего

значения, разные по величине положительные и отрица­

тельные

отклонения

от среднего

повторяются

одинаково

часто.

В другом

случае

положи­

 

р(х)

 

 

 

 

тельные отклонения (много­

 

 

 

 

 

 

водные годы) могут повто­

 

 

 

 

 

 

ряться реже,

чем

отрица­

 

 

 

 

 

 

тельные,

и наиболее

часто

 

 

 

 

 

 

наблюдающиеся

значения

 

 

 

 

 

 

переменной (мода) оказы­

 

 

 

 

 

 

ваются

меньше

средней.

 

 

 

 

 

X

Это

случай

положительной

 

 

 

 

 

 

 

 

 

 

 

асимметрии

(рис.

1.4,

кри­

 

 

 

 

 

 

вая

/).

В

 

противополож­

Рис. 1.4. Кривые распределения вероятно­

ном случае наблюдается от­

стей с положительной (1) и

отрицатель­

рицательная

асимметрия

 

ной

(2) асимметрией.

 

Для кривой (/)

характерно, что наиболее часто

(рис.

1.4,

кривая 2).

 

 

встречающиеся величины меньше

среднего, для

Если

ряд

симметричен,

кривой (2) характерно обратное соотношение.

то третьи

степени

отклоне­

 

 

 

взаимно

уравнове­

ний, которые получаются с разными знаками,

сятся и сумма их будет равна нулю.

 

включать

сравни­

При положительной асимметрии ряд будет

тельно немногочисленные, но большие по величине положительные отклонения и более многочисленные, но менее значительные по ве­ личине отрицательные отклонения. При возведении в третью сте­ пень положительные отклонения возрастут больше, чем отрицатель­ ные, и сумма кубов отклонений окажется положительной.

При отрицательной асимметрии результат будет иметь отрица­ тельный знак.

Чтобы получить безразмерное выражение для характеристики асимметрии ряда, среднее значение кубов отклонений делят на куб среднего квадратического отклонения. Это отношение называется

коэффициентом асимметрии

2 ( * 1 - з 8

 

c . = J = i - S 5------- •

(>.27)

4 Зак. № 88

49

Соседние файлы в папке книги из ГПНТБ