
книги из ГПНТБ / Рождественский, А. В. Статистические методы в гидрологии
.pdfчленов ряда. Так, медиана ряда среднегодовых расходов воды р. Днепра в створе у пгт Лоцманской Каменки после расположения этого ряда в убывающем порядке равна 1620 м3/с.
В случае сгруппированных данных наблюдений медиана может
быть рассчитана по следующей приближенной формуле: |
|
Me=vV1 |
(1.9) |
где N1 — конец медианного интервала; h — размер интервала; п —
число членов ряда; S — накопленная частота до значения АД, т — число случаев в медианном интервале.
Расчеты медианы по данной формуле будут тем точнее, чем рав номернее распределение данных наблюдений внутри медианного интервала. Медиана для ряда годового стока р. Днепра, рассчитан ная по формуле (1.9), равна
200 (—4^----- |
63'j |
Me = 1699 -------- --------------- |
=1623 м3/с. |
Произведем расчет медианы сгруппированных приведенных выше данных о рельефе болота: jVt =16, h = 2; п = 903; S = 422; m = 144. Подставляя эти значения в формулу (1.9), получаем
М е=16 |
144 |
15,6 см. |
|
|
Из произведенных расчетов видно, что значение медианы опре деляется только величиной срединного или двух срединных значе ний ряда, расположенного в убывающем порядке, и не зависит, в отличие от средней арифметической, от остальных членов ряда.
Иначе говоря, медиана не изменяется, если любые значения ар гумента, меньшие медианы, изменяются как угодно, оставаясь лишь при этих изменениях меньше Me, а любые значения рассмат риваемого ряда, большие Me, изменяются как угодно, оставаясь больше Me. Подобные изменения, очевидно, очень сказываются на значении средней арифметической. Это свойство медианы делает использование ее более целесообразным, чем использование сред ней, в тех случаях, когда конечные члены ряда неточны и нена дежны. Но медиана по сравнению со средней арифметической имеет тот недостаток, что не поддается так же легко, как средняя арифметическая, аналитическим операциям; например, для нее не применима теорема сложения.
Таким образом, соединив два ряда с известными медианами, ни чего нельзя сказать о медиане полученной совокупности, не вычис лив ее независимо от известных медиан составляющих рядов.
Перпендикуляр, восстановленный в точке, соответствующей зна чению медианы, к оси варьирующего признака, делит площадь ги стограммы на две равные части.
40
Отметим без доказательства основное свойство медианы, кото рое заключается в том, что сумма абсолютных отклонений значений членов статистического ряда от медианы минимальна по сравне нию с аналогичной суммой, образованной из отклонений от любой другой величины, отличной от Me.
§ 6
мода
Модой называется наиболее вероятная (наиболее часто встре чающаяся) в данном статистическом ряду величина. Или иначе, мода представляет собой наибольшую ординату кривой распреде ления в случае одновершинного распределения. В общем случае кривая распределения может иметь несколько вершин и соответст венно она будет иметь несколько мод.
Определение моды через наибольшие значения кривой распре деления— задача довольно сложная, а при небольших рядах на блюдений вообще практически невыполнимая. В качестве прибли женного значения моды можно взять середину интервала с наи большей частотой в сгруппированных данных наблюдений. Так, для ряда среднегодовых расходов воды р. Днепра у пгт Лоцманской Каменки Мо=1600 м3/с, а для поверхности микроландшафта Мо = = 19,5 см.
Для не очень асимметричных и одновершинных распределений мода может быть рассчитана по приближенному равенству, уста новленному К. Пирсоном,
М о = л :+ 3 (М е -л ). |
(1.10) |
Значение моды, рассчитанное по этой формуле для среднегодо вых расходов воды, равно 1576 м3/с, а для поверхности болотного микроландшафта — 26,3 см.
Использование моды, так же как и медианы, целесообразно при анализе резко асимметричных распределений, когда среднее ариф метическое уже не является достаточно представительным парамет ром распределения и его целесообразно дополнить модой и ме дианой.
§ 7
средняя геометрическая и средняя гармоническая
Иногда в целях получения лучшего соответствия закона распре деления эмпирического ряда некоторым статистическим (теорети ческим) схемам осуществляют преобразование величин эмпириче ской совокупности. В качестве такого преобразования часто приме няют логарифмирование величин исходного ряда. В этом случае вместо исходных величин xi, Xz, Хз, ..., хп. образуется ряд,
41
состоящий из lg'A'i, |
lgX2, lg лгз, . . lg Xn- |
Среднее арифметическое |
|
значение этого нового ряда, очевидно, равно |
|
||
lg G = 4 |
- (lg ^ 1+ lg x 2+ lg x 3+ |
. . . + lg д:л). |
(M l) |
Соотношение (2.11) получается путем логарифмирования исход
ного выражения следующего вида: |
|
п------------------- |
(1.12) |
G = у х 1х 2х 3. . . х п, |
которое представляет собой среднее геометрическое значение аргу мента х, принимающего положительные значения хи х2, Хз, ..., хп.
Из соотношений (1.11) и (1.12) следует, что логарифм средней геометрической (G) равен средней арифметической из логарифмов значений величин рассматриваемого статистического ряда.
Как доказывается в математической статистике [111], среднее геометрическое всегда меньше среднего арифметического.
В качестве одной из форм трансформации величин исходного ряда статистической совокупности используют преобразование со-
1
вокупности положительных величин х±, хг, Хз, ..., хп в ряд вида — ,
,у . .
Хо Хз Хп
Среднее арифметическое значение трансформированного ука
занным образом ряда равно |
|
|
|
отсюда |
|
|
|
H = j _ |
j _ J _ |
----------• |
(1ЛЗ) |
х х + х 2 + х 3 + |
+ х п |
|
Величина Я, обратное значение которой равно средней арифме тической из обратных значений переменной х, называется средней гармонической величины х.
Некоторые примеры логарифмического преобразования исход ного ряда и использования средней гармонической в гидрологиче ских расчетах рассмотрены в главе II.
Таким образом, средние значения (среднее арифметическое зна чение, медиана, мода и др.) являются характеристиками, вокруг которых осуществляется группирование вариационных рядов, или, как говорят, центрами группирования. Средние значения описы
вают некоторые важные свойства статистических совокупностей, но не являются исчерпывающими их характеристиками. Действи тельно, можно себе представить два ряда величин, средние значе ния которых равны между собой, а характер рассеивания относи тельно средних будет различный. Например, среднее арифметиче ское значение уровня воды в замкнутом водоеме при слабом
42
и сильном волнении будет одно и то же. Однако характер колеба ний уровня воды при многократном измерении, очевидно, будет различным. Следовательно, для описания подобных совокупностей необходимо учитывать характеристики мер рассеивания, к рассмот рению которых перейдем в следующих параграфах.
§8
простейшие меры рассеивания
Наиболее простой мерой рассеивания, или изменчивости, стати стического ряда является амплитуда, или размах варьирования, ра нее введенный при группировании данных наблюдений
Л=л:„ |
(1.14) |
|
Как следует из этой формулы, для вычисления амплитуды необ |
||
ходимо знать лишь наибольшее и наименьшее значения ряда |
на |
|
блюдений. Так, амплитуда колебаний годового стока |
р. Днепра |
|
у пгт Лоцманской Каменки равна А =3040 — 717 = 2323 |
м3/с, а ам |
|
плитуда колебаний поверхности рассматриваемого болота |
А = |
=32— 1=31 см.
Сувеличением продолжительности ряда наблюдений амплитуда колебаний может лишь увеличиваться, что вносит некоторую неоп
ределенность в использование амплитуды как характеристики рас сеивания. Введение поправок на число членов ряда при расчете амплитуды во многих случаях полностью не устраняет этого недо статка. Кроме того, амплитуда имеет большие случайные колебания от выборки к выборке, что также затрудняет ее использование. Не смотря на эти недостатки, амплитуда применяется в некоторых слу чаях в гидрологических расчетах. Например, при оценке оправды ваемое™ гидрологических прогнозов наряду с другими более совер шенными методами иногда используется 20% амплитуды. Если разность между прогнозируемой и фактической величиной меньше Vs А, то прогноз считается удовлетворительным, а в противном слу
чае — неудовлетворительным.
В качестве другой характеристики меры рассеивания исполь зуется среднее абсолютное отклонение, которое рассчитывается по формуле
S l( * £ - * ) l
d = ^ — n-------- |
, |
(1.15) |
где п — число членов ряда xt, от t'=l до i = n\ х — среднее арифме
тическое значение.
Наиболее существенный недостаток среднего абсолютного от клонения заключается в том, что при его расчете не учитывается
знак разности (х{ — х), что затрудняет усовершенствование схемы
43
его подсчета. Вклад малых и больших отклонений Xi от х учиты
вается одинаково, что несколько снижает ценность этого параметра как меры изменчивости.
Величина средних абсолютных отклонений для годового стока р. Днепра у пгт Лоцманской Каменки оказалась равной 360 м3/с, а для поверхности болотного микроландшафта — 3,6 см.
§ 9
среднее квадратическое отклонение (стандарт), дисперсия, коэффициент вариации
Наиболее часто используемой мерой рассеивания статистиче ского ряда относительно средней арифметической его величины яв ляется среднее квадратическое отклонение ох ., или стандарт,
/ — »------------
(1.16)
Среднее квадратическое отклонение сохраняет размерность ис ходного ряда наблюдений.
В случае использования таблицы сгруппированных данных сред нее квадратическое отклонение может быть рассчитано по формуле
2 |
«г (xi - |
x f |
^ |
— п--------- |
- 0-17) |
где щ — абсолютная частота статистического ряда в t-том интер
вале.
Квадрат среднего квадратического отклонения называется дис персией.
В некоторых случаях может оказаться полезным вычисление среднего квадратического отклонения, основанного на способе, по следовательных разностей,
п —1
2 (xi - xi-n)2
а»= i=?±2Tn - 1)----- |
* |
0-18) |
Расчеты по этой формуле не требуют предварительного вычисле ния среднего арифметического значения. Необходимо отметить, что мощность среднего квадратического отклонения, вычисленного по формуле (1.18), составляет приблизительно 2/з от вычисленного по выражению (1.16). Поэтому формула (1.18) для определения о
редко используется. Однако она может оказаться полезной, когда
44
в исходном ряду имеют месте циклические или направленные ко лебания среднего значения. В подобных случаях в среднем квадра тическом отклонении, вычисленном по выражению (1.18), будут ис ключены колебания среднего значения, в то время как в среднее квадратическое отклонение, определенное по формуле (1.16), эти колебания среднего войдут.
Рассмотрим общие свойства дисперсии.
1. Если сумму квадратов отклонений ряда наблюдений xt около величины а назвать дисперсией Xi около а
П
то дисперсия а2 достигает наименьшего значения, когда а=х. Это
свойство дисперсии было рассмотрено при описании свойств сред ней арифметической.
2.Если некоторая величина yt связана с х» уравнением вида yi =
= axi + b, где а к b — постоянные величины,’ то а2у = ах2а2,’ или иначе
П
2 (x, — b f — (x — b)2.
Это равенство часто используется при вычислении дисперсии. При этом постоянные выбираются таким образом, чтобы разности (Xi — b) были наименьшими, т. е. удобными для вычислений;
3. Рассмотрим очень важное свойство сложения дисперсий, ко
торое находит применение в гидрологических расчетах и при раз работке различных теоретических вопросов статистики.
Общая дисперсия суммы k рядов наблюдений случайной вели чины х равна средней арифметической частных дисперсий, сложен
ной с дисперсией частных средних около общей средней
|
k |
|
k |
|
|
h = 1_____■ |
h—1 |
|
(1.19) |
||
|
k |
' |
|
k |
|
|
|
|
|||
где |
|
|
|
|
|
X\i |
X \2 • |
• • |
X\i . . . X \n, |
|
|
X21 |
X22 . . . |
X21 . . |
. Х 2пг |
|
|
X/ti |
Xh2 . . . Xhi .. |
. x hnh |
|
||
Xfi\ |
Xy2 • |
• • |
Xfci . . . Xknk |
|
45
— исходные ряды наблюдений; |
|
|
|
п, |
Пг |
|
"к |
V Х\1 |
V *21 |
|
2 X ki |
х 2 = |
! = 1 |
Xk- |
i =1 |
Щ |
Л2 |
|
«fc |
средние арифметические частных совокупностей;
aj : i—1
Л1
i—1 |
2 i= l |
— средние квадратические отклонения частных совокупностей; пи п-2 , . . tih — объемы частных совокупностей; х — общая средняя всех
|
Z (X) — х)2 |
наблюдений; сг= |
3=1 |
--------- ------------- общая дисперсия всех наблюде |
ний, где / пробегает значения от /= 1 до i = rih и от h —1 до h = k\ об- k
щий объем всех данных равен п= 2 пи- h=1
Свойство сложения дисперсий находит практическое примене ние, когда несколько распределений соединяются в одно, или на оборот, когда одна большая совокупность разделяется на ряд част
ных, для которых отдельно вычисляются Xh и a2h. Например, в ги
дрологических расчетах иногда объединяется в одно распределение та или иная гидрологическая характеристика, полученная по от дельным рекам (параметры максимального или годового стока). В таком случае общая дисперсия суммарного ряда может быть вы числена по известным дисперсиям и средним индивидуальных ря дов с использованием приведенного свойства сложения дисперсий.
Некоторые дополнительные свойства выборочной дисперсии бу дут рассматриваться в главе V. Здесь лишь укажем без доказатель ства, что выборочная дисперсия сколь угодно мало отличается от дисперсии генеральной совокупности, если число членов наблюде ний будет достаточно велико. В практических расчетах дисперсии по ряду наблюдений следует пользоваться формулой
з2= ------ |
. |
(1.20) |
которая здесь также приводится без доказательства и которая дает наилучшее приближение выборочной дисперсии к дисперсии гене ральной совокупности без систематической ошибки. Заметим, что
46
при л > 30 поправка на постоянное смещение ст2 (вместо п в знаме нателе используется п — 1) несущественна. Однако, учитывая не
сложность введения поправки на смещение а2, предпочтительней всегда пользоваться формулой (1.20) вместо (1.16) — (1.18).
В гидрологических расчетах часто возникает необходимость сравнения изменчивости рядов, образованных из существенно раз личающихся по величине гидрологических характеристик. В этом случае средние квадратические отклонения рассматриваемых рядов оказываются несопоставимыми. Например, среднее квадратическое отклонение рядов максимальных в году расходов воды р. Днепра У г. Киева и, допустим, р. Сож у г. Славгорода будет существенно отличаться хотя бы потому, что абсолютные величины этих рядов существенно различаются. Сопоставление изменчивости подобных рядов осуществляется с помощью коэффициента вариации (Cv),
представляющего собой отношение среднего квадратического от клонения к среднему значению ряда
( 1-21)
Коэффициент вариации является безразмерной характеристикой изменчивости статистического ряда. Иногда коэффициент вариации
выражается в процентах от средней величины Cv |
Ох |
= - = - • 100%. |
|
* |
х |
В гидрологических расчетах коэффициент вариации наиболее
часто определяется по формуле |
|
|
|
|
|
|
|
|
(£,-1)2 |
|
|
1 22 |
|
|
V X |
|
|
|
|
|
|
С |
П— 1 |
|
|
( . ) |
|
|
|
|
|
|
||
где k = Xilx — модульный коэффициент. |
|
|
|
|
||
Выражение (1.22) |
легко получается из следующих элементарных |
|||||
преобразований: |
|
|
|
|
|
|
|
|
|
|
|
|
- \ о |
|
(X I - х ) |
|
. / |
|
2 |
Xi — X ' |
п __°дг |
|
|
|
|||
1 |
|
\ |
^ |
|
|
|
- ~ / |
|
|
Л - 1 |
|||
X |
(л — 1) х |
|
|
|
|
|
|
|
|
/ |
п |
|
|
■ У Ш ^ - V |
2 ( k i - I)2 |
|||||
|
л - 1 |
|||||
В случае сгруппированных данных наблюдений выражение (1.22) |
||||||
имеет вид |
|
|
|
|
|
|
СV X |
Щ(h — I)2 |
|
|
|||
Л - |
1 |
|
|
(1.23) |
||
|
|
|
|
|
где m — абсолютная частота /-той градации.
47
Между средним абсолютным |
(d) и средним квадратическим |
(а) отклонениями в случае, если |
статистический ряд подчиняется |
закону нормального распределения, имеет место следующее равен ство:
0,8а. (1.24)
Это соотношение может использоваться для приближенной оценки а при известном среднем абсолютном отклонении. Однако
ошибка такой оценки может быть существенной, если рассматри ваемый статистический ряд значительно уклоняется от нормаль ного.
Важной, хотя и менее употребительной (чем дисперсия и стан дарт) характеристикой меры рассеяния статистического ряда отно сительно его среднего значения является вероятное отклонение
(Д), определяемое по равенству
А = *25~ * 75 . |
(1.25) |
Здесь Х25 и *75 — первая и третья квартили.
Очевидно, что между Х75 и х2ь заключается половина членов ста
тистической совокупности. Иначе говоря, величина А, отложенная
вобе стороны от медианы распределения, определяет те границы,
впределах которых заключена половина всех членов статистиче ского ряда. Поэтому для случайно взятого члена статистической со вокупности одинаково вероятно оказаться в этом интервале или
вне его. Ясно, что чем ближе к медиане располагаются указанные границы, тем меньше рассеяние статистического ряда. Поэтому Д принимается за меру рассеяния аргумента распределения. Для ус ловий нормального распределения Д связано с о постоянным соот
ношением
Д = 0 ,6 7 4 а .
§ 10
асимметрия и эксцесс
Средние, определяющие центры группирования статистических совокупностей, а также различные меры рассеяния, рассмотренные в предыдущих разделах, еще не полностью описывают основные свойства статистических рядов.
В частности, важной отличительной чертой■распределения яв ляется их асимметрия, т. е. различное рассеяние членов ряда отно сительно средней или моды. Дело в том, что среди статистических совокупностей можно обнаружить такие, которые имеют одинако вые средние арифметические значения и дисперсии, однако группи
48
рование относительно центра распределения величин, составляю щих эти совокупности, может быть либо симметричным, либо асим метричным.
В качестве характеристики симметричности (асимметричности) статистического ряда принимается среднее значение кубов откло нений членов ряда от его среднего арифметического значения
П
|
|
|
|
|
|
(v = -)r |
2 |
U - * ) 3- |
|
|
. |
о -26) |
|
|
|
|
|
|
|
|
/= 1 |
|
|
|
|
|
|
Когда члены ряда располагаются симметрично относительно |
|||||||||||||
среднего |
значения, разные по величине положительные и отрица |
||||||||||||
тельные |
отклонения |
от среднего |
повторяются |
одинаково |
часто. |
||||||||
В другом |
случае |
положи |
|
р(х) |
|
|
|
|
|||||
тельные отклонения (много |
|
|
|
|
|
|
|||||||
водные годы) могут повто |
|
|
|
|
|
|
|||||||
ряться реже, |
чем |
отрица |
|
|
|
|
|
|
|||||
тельные, |
и наиболее |
часто |
|
|
|
|
|
|
|||||
наблюдающиеся |
значения |
|
|
|
|
|
|
||||||
переменной (мода) оказы |
|
|
|
|
|
|
|||||||
ваются |
меньше |
средней. |
|
|
|
|
|
X |
|||||
Это |
случай |
положительной |
|
|
|
|
|
||||||
|
|
|
|
|
|
||||||||
асимметрии |
(рис. |
1.4, |
кри |
|
|
|
|
|
|
||||
вая |
/). |
В |
|
противополож |
Рис. 1.4. Кривые распределения вероятно |
||||||||
ном случае наблюдается от |
стей с положительной (1) и |
отрицатель |
|||||||||||
рицательная |
асимметрия |
|
ной |
(2) асимметрией. |
|
||||||||
Для кривой (/) |
характерно, что наиболее часто |
||||||||||||
(рис. |
1.4, |
кривая 2). |
|
||||||||||
|
встречающиеся величины меньше |
среднего, для |
|||||||||||
Если |
ряд |
симметричен, |
кривой (2) характерно обратное соотношение. |
||||||||||
то третьи |
степени |
отклоне |
|
|
|
взаимно |
уравнове |
||||||
ний, которые получаются с разными знаками, |
|||||||||||||
сятся и сумма их будет равна нулю. |
|
включать |
сравни |
||||||||||
При положительной асимметрии ряд будет |
тельно немногочисленные, но большие по величине положительные отклонения и более многочисленные, но менее значительные по ве личине отрицательные отклонения. При возведении в третью сте пень положительные отклонения возрастут больше, чем отрицатель ные, и сумма кубов отклонений окажется положительной.
При отрицательной асимметрии результат будет иметь отрица тельный знак.
Чтобы получить безразмерное выражение для характеристики асимметрии ряда, среднее значение кубов отклонений делят на куб среднего квадратического отклонения. Это отношение называется
коэффициентом асимметрии
2 ( * 1 - з 8 |
|
c . = J = i - S 5------- • |
(>.27) |
4 Зак. № 88 |
49 |