книги из ГПНТБ / Юзбашев М.М. Методы изучения динамики распределений и зависимостей
.pdfвать его не за отдельный произвольно взятый год, а в динамике, становится близким к нормальному распределению.-
Нет необходимости повторять изложенные ранее рас четы по динамике распределений совхозов Ленинград ской области по урожайности других культур. Полезно привести в сводном виде итоги анализа динамики этих распределений, что позволит на более широком и разно образном ^материале проверить ряд ранее высказанных положений, выявить как общие черты, присущие дина
мике разных распределений, так и специфику отдельных из них.
Сводная сравнительная таблица может включать только сравнимые показатели динамики распределений и ее анализа, в основном это относительные показатели динамики, колеблемости и зависимостей между разными характеристиками динамики распределений.
Сводные характеристики динамики распределении
|
Темпы |
роста за 13 |
Средние значения |
Коэффи |
|
|
циенты колеб |
||||
Сельскохо |
лет, в |
процентах |
показателей |
||
лемости, |
|||||
зяйственные |
|
|
|
в процентах |
|
Т |
т |
а |
т |
*■ |
as |
ex |
|
” , |
(О |
|
|
М |
|
1V |
|
|||||||
|
1 |
2 |
з |
4 |
5 |
6 |
7 |
8 |
|
||
Картофель |
223 |
164 |
70 |
29,8 + 0 ,5 5 |
-0 ,6 8 ** |
0,18 |
0 |
13 |
|||
Зерновые |
295 |
180 |
61 |
32,0 |
+0,71 |
-0,95 |
oj 13 |
o ’ IQ |
|||
Овощи |
170 |
154 |
91* |
42,0 + 0 ,6 5 |
-1,29 |
0 j 17 |
0*14 |
||||
Многолет- |
|||||||||||
|
|
|
|
|
|
|
|
|
|
||
ние тра- |
|
121 |
|
|
|
|
|
|
|
||
вы на сено |
156 |
78* |
34,0 + 0 ,4 5 |
+ 0 ,0 8 ** |
0,09 |
0,10 |
|||||
*Тенденция изменения статистически ненадежна. Отличие от нуля статистически ненадежно.
„к каким выводам приводит рассмотрение данных таол. 12? По всем четырем сельскохозяйственным куль турам наблюдается тенденция роста средней урожайно сти. Темп роста урожайности специфичен для каждой группы культур; он отражает усилия, приложенные тру
жениками сельского хозяйства к увеличению урожайно сти, наличие объективных условий для ее возрастания.
а эти группы факторов весьма различны для каждой культуры. Наибольшие успехи достигнуты в увеличении уровня урожайности зерновых культур и наименьшие в увеличении урожайности многолетних трав (в основ
ном— клевера). В первой половине изучаемого периода возделыванию трав уделялось мало внимания, ременоводство трав было запущено и восстановить его быстро было нельзя. С другой стороны, совхозы еще не имели достаточных материальных средств, чтобы обеспечить - мелиорацию и общий уровень агротехники на посевах трав, равный уровню, достигнутому на площадях под
зерновыми культурами и картофелем.
Перейдем к анализу показателей, характеризующих колеблемость средней урожайности. Коэффициенты авто корреляции (графа 9) все без исключения ''"'Малы и не являются статистически значимыми, не доказывают на личия автокорреляции колебаний. К тому же выводу при-
Таблица 12
совхозов по урожайности
Коэффициенты |
автокорреля |
|
Коэффициенты корреляции |
||
ции |
|
|
колебаний |
|
|
|
|
|
|
|
|
'.1 , |
ra |
м ‘ .и + |
п ,м и* |
raM-uas |
rua s ' “ ex |
а |
|||||
9 |
10 |
п |
12 |
13 |
u |
0,00** |
—0,29** |
Д-0,63 |
—0,77 |
—0,62 |
+ 0 ,6 1 |
+ 0 ,1 8 ** |
—0,26** |
+ 0 ,3 2 |
—0,59 |
—0,42 |
J-0,95 |
—0,23** |
—0,14** |
+ 0 ,7 1 |
—0,63 |
—0,42 |
+ 0 ,8 2 |
—0 ,2 2 ** |
-f0 ,2 7 ** |
+ 0 ,5 0 |
—0,19** |
—0,54 |
+0 ,7 1 |
водит и анализ по методу «поворотных точек» Юла и Кендэла. Такая двойная проверка позволяет сделать вы вод о том, что колебания урожайности в отдельные годы являются случайными, что’ вполне соответствует теорети ческому анализу причин колебания урожайности и мно гократно доказанной статистически в трудах В. М. Обу хова и других советских статистиков зависимости коле баний урожайности от метеорологических факторов, рас пределение которых во. времени случайно.
80 |
81 |
Очень большое практическое значение имеет измере ние силы колебаний урожайности. По данным графы 7 табл. 12 можно заключить, что наименее устойчивы к влиянию метеорологических факторов картофель и ово щи, наиболее устойчивы многолетние травы. Это тоже вполне объяснимо со стороны качественных особенностей этих культур. Травы — аборигены данной местности, растущие и в диком виде, а картофель и овощи — куль туры интродуцированные, уроженцы далеких стран с другим климатом. Отсюда вывод о желательности вести селекционную работу по выведению новых сортов кар тофеля н овощей, лучше приспособленных к местному климату. Колеблемость урожайности всех изученных культур не обеспечивает устойчивого производства кор мов для скота и продовольствия для населения. Ведь
даже если vAI{t) яь 10%', это означает, что среднее |
коле |
бание урожайности достигает 10% ее среднего |
много |
летнего уровня. Однако вероятность того, что отклонение урожайности в тот или иной год не выйдет за пределы среднего отклонения, еще весьма далека от единицы. Если считать достаточно надежным уровнем вероятности 0,95, то доверительные пределы колебания урожайности
зерновых достигнут 26%; |
картофеля-— 36%; овощей—- |
34%, трав на сено— 18%. |
Совершенно ясно, что такие |
отклонения в урожайности, а следовательно, и в объеме продукции, приводят к перебоям в снабжении населе ния своими (местного производства) сельскохозяйствен ными продуктами, к необеспеченности скота кормами и большим затратам государства и отдельных совхозов на завоз недостающего количества продукции из других об ластей.
Графы 2, 8, 10 табл. 12 характеризуют динамику сред него квадратического отклонения урожайности в сово купности совхозов области. Абсолютная величина ва риации, характеризуемая показателем а, имеет тенден цию роста, причем по первым трем группам культур более чем в 1,5 раза за 13 лет. Возрастание абсолютных раз личий между уровнями урожайности в передовых сов хозах и в отстающих совхозах — результат различия в скорости роста урожайности: как правило, она выше именно в передовых хозяйствах. Отсюда не следует де лать пессимистического вывода о неизбежности все боль шей дифференциации хозяйств по уровню урожайности.
Наблюдаемая в 1958— 1971 гг. картина роста урожайно сти отвечает начальным этапам процесса интенсифика ции сельского хозяйства области; ведь только в эти годы и начался интенсивный подъем урожайности всех сель скохозяйственных культур.
Наблюдения над различными процессами развития как социально-экономическими, так и биологическими приводят к заключению, что возрастание абсолютной ве личины вариации в совокупности, проходящей начальные стадии развития (если оно связано с увеличением сред него размера варьирующего признака) является общим статистическим законом динамики распределений. Так,
например, дети в возрасте 6—7 лет гораздо больше варьируют по росту, чем новорожденные. На более позд них стадиях развития, когда рост среднего значения при знака замедляется, увеличение абсолютного размера ва риации сменяется его уменьшением, так как единицы со вокупности, несколько отставшие в росте на первых ста диях развития, позднее выравниваются, подтягиваются к среднему уровню, а развивавшиеся ранее быстрее, за медляют рост, подходя к предельному значению (обла сти предельных значений) признака. Если же такового предела в принципе не существует, то за стадией замедле ния роста, по мере накопления количественных, посте пенных изменений следует новый качественный скачок,
совокупность вновь |
вступает в период |
быстрого |
роста |
||
величины |
признака, |
вновь |
возрастает |
и его вариация, |
|
т. е. никл |
повторяется на более высокой ступени. |
|
|||
Сравнивая темп |
роста |
средней урожайности |
(гра |
||
фа 1) с темпом роста среднего квадратического отклоне
ния (графа 2) можно сделать |
вывод о том, |
что во всех |
|
случаях средняя |
растет быстрее, чем растет |
вариация |
|
в. ее абсолютном |
выражении. |
Этот вывод очень важен. |
|
Он свидетельствует о том, что рост вариации в процессе развития совокупности в абсолютном выражении сопро вождается уменьшением ее относительного значения.
О последнем можно судить также и по темпам роста коэффициента вариации урожайности (графа 3). В двух случаях коэффициенты вариации существенно снизи лись.
Следовательно, совокупность совхозов в процессе ин тенсификации сельского хозяйства области в относи тельном выражении становится более однородной, т. е.
83
различия между уровнями урожайности передовых и от стающих групп хозяйств, хотя и возрастают по абсолют ной величине, составляют все меньшую долю по отно шению к среднему уровню урожайности.
Показатели граф 8 и 10 характеризуют колеблемость среднего квадратического отклонения урожайности. Ин тересно отметить, что коэффициенты колеблемости по всем группам культур почти одинаковы. Как видим, эти коэффициенты меньше соответствующих коэффициентов колеблемости средней урожайности (графа 3), кроме трав на сено, где они равны. Такое же соотношение на блюдается и по ряду иных распределений, изученных нами, что позволяет выдвинуть следующую гипотезу:
колеблемость среднего уровня признака в динамике, как правило, сильнее, чем колеблемость среднего квадрати ческого отклонения признака в совокупности. Иначе го воря, вариация признака в совокупности устойчивее к воздействию факторов, вызывающих колебания уров ней отдельных лет, чем величина самого признака. В за висимости от благоприятных и неблагоприятных усло вий погоды распределение совхозов колеблется, несколь ко сжимаясь в неурожайные годы и растягиваясь в уро жайные, но в гораздо меньшей мере, чем колеблется центр этого распределения — средняя величина.
Автокорреляция колебаний среднего квадратического отклонения (графа 10) несущественна, все ее коэффицициенты статистически незначимо отличны от нуля. Это говорит о случайном характере колеблемости среднего квадратического отклонения, так же как случайным яв ляется и колебание самого среднего уровня. Между коле баниями среднего уровня и среднего квадратического отклонения существует статистически значимая прямая зависимость (см. графу 11). Но так как колебания сред него квадратического отклонения слабее, чем колебания средней урожайности, то между колеблемостью коэффи циента вариации и колеблемостью среднего уровня су ществует, как уже было отмечено ранее, обратная зави
симость (гр. 12). В урожайные годы совокупность совхозов является относительно более однородной по урожайности, а в неурожайные годы относительно менее однородной. Такое соотношение колебаний полностью со ответствует соотношению тенденций: по мере роста сред
84
ней урожайности коэффициент вариации имеет тенден цию к сокращению.
В заключение рассмотрим показатели асимметрии, эксцесса распределения и присущие им закономерности динамики. Прежде всего, нужно отметить, что по всем
четырем распределениям тенденции изменения |
показа |
|
телей эксцесса и по трем — асимметрии |
оказались ста |
|
тистически незначимыми, в связи с чем |
темпы |
роста |
этих показателей не исчислялись. Это говорит о том, что процесс развития совокупности может происходить и без изменения показателей асимметрии и эксцесса распреде ления.
По всем четырем группам культур обнаружена право сторонняя асимметрия распределения и положительный
эксцесс. Величина эксцесса |
распределения |
совхозов |
по |
|
урожайности картофеля и трав незначимо |
отлична |
от |
||
нуля, эти же |
распределения |
обладают и |
наименьшей |
|
асимметрией. |
Сравнивая показатели граф |
5 и 6, легко |
||
заметить совершенно четкую прямую зависимость: боль шим показателям асимметрии отвечают и большие пока затели эксцесса. Связь эксцесса с асимметрией особо на глядно доказывается весьма высокими значениями ко эффициента корреляции между их колебаниями (гра фа 14). Сильная прямая зависимость между показателя ми асимметрии и эксцесса обнаружена и при изучении динамики ряда других распределений и, может быть, является довольно широко распространенной. Следует проверить на материале иных совокупностей и признаков следующую гипотезу: асимметрия и эксцесс статистиче ского распределения, как правило, имеют единые причи ны возникновения, поэтому между абсолютной величиной показателя асимметрии и абсолютной величиной показа теля эксцесса распределения существует тесная. прямая корреляционная зависимость.
В графе 13 приведены коэффициенты корреляции между колебаниями средней урожайности и колебания
ми асимметрии. Эти данные подтверждают ранее выска занное предположение о существовании обратной зави симости вследствие важной роли фактора односторон ней ограниченности величины признака в образовании асимметрии распределения. В неурожайные годы асим метрия имеет тенденцию возрастать, а в урожайные —
85
сокращаться, так как распределение удаляется от нижнего предела урожайности. Гипотеза нуждается в дальнейшей проверке.
§ 4. Общая характеристика статистических закономерностей одномерного распределения и его динамики
От изучения динамики отдельных показателей рас пределения и на базе этого изучения необходимо вер нуться к распределению в целом и его динамике. Одной из важнейших обобщающих характеристик распределе ния является закономерность, связывающая частоту со значением варьирующего признака. Эта закономерность может быть выражена в двух формах: а) в форме ве роятности того, что значение варьирующего признака превосходит заданную величину (менее заданной вели чины или заключено в заданном пределе значений). Та кая форма выражения зависимости между значением признака и частотой называется интегральным законом распределения или интегральной функцией распределе ния; б) в форме вероятности заданного значения призна ка. Такая форма выражения зависимости между значе нием признака и частотой для непрерывно варьирующих признаков называется дифференциальным законом (или функцией) распределения. Ее также называют функцией,
описывающей плотность вероятности.
Распределения реальных совокупностей, так называе мые эмпирические распределения, как правило, не от вечают точно никакой элементарной функции плотности распределения вероятности. При этом надо иметь в виду, что любое эмпирическое распределение совокупности, состоящей из я единиц, может быть абсолютно точно опи сано кривой, имеющей не более чем я параметров. Од нако такое описание ровно ничего не дает для углубления нашего знания о распределении. Замена я отдельных значений признака сводным уравнением плотности ве роятности, содержащим те же я параметров, явилась бы ярчайшим образцом математического формализма и ни чего более. Законы реального мира гармоничны и просты, таковы же и законы статистических распределений явле ний этого мира. Поэтому цель исследователя не в том,
86
чтобы подобрать к эмпирическому распределению функ цию, точно его выражающую, а в том, чтобы установить,
ккакому из достаточно элементарных, уже установлен ных наукой дифференциальных и интегральных законов распределения наиболее близко данное эмпирическое распределение. Реже, значительно реже речь может пой ти и о том, что анализ реального распределения приведет
кустановлению нового, опять же достаточно простого и обобщенного закона распределения.
Эмпирическое распределение отклоняется от теоре
тического закона распределения вследствие случайно стей, не устранимых в диалектическом процессе разви тия совокупности. Поэтому для выявления функции, наи лучшим образом описывающей данное распределение, не обходимо свести к минимуму влияние случайных откло нений на характер распределения. Какими методами эта цель может достигаться? В. Т. Евдокимов по этому по воду пишет:
«Более полному выявлению закономерности кон кретного распределения способствует построение ва риационного ряда с равными интервалами, а также пере ход от мелких размеров интервалов к более крупным,'что равносильно уменьшению количества групп ряда. Одна ко следует заметить, что при слишком малом количестве групп (3—4) характерные особенности распределения также затушевываются. Наиболее надежный путь выяв ления закономерности распределения— увеличение ко личества наблюдаемых случаев» [8, с. 179]. Что касает ся равенства интервалов признака, то это элементарное условие построения вариационного ряда, без которого нельзя приступить к установлению закономерностей рас
пределения. Увеличение |
интервалов или их уменьше |
||
ние— выражения неточные. Правильнее |
говорить об |
||
оптимальном числе и размере интервала |
для |
данного |
|
распределения, при котором его закономерности |
выяв |
||
ляются наиболее полно. |
Увеличить количество наблюде |
||
ний в исследовании социально-экономических процессов и совокупностей далеко не всегда возможно. Как прави ло, расширение объекта исследования сопровождается возрастанием неоднородности совокупности. Недопусти мо, например, с целью лучшего выявления закономерно сти распределения совхозов по урожайности картофеля
87
присоединить к совхозам Ленинградской области, отли чающимся значительно более высоким средним уровнем интенсификации производства, совхозы Новгородской, Псковской и Вологодской областей, где уровень интен сификации производства ниже, а поэтому и распределе ние по урожайности и его динамика носят иной харак тер.
Нахождение теоретических кривых, описывающих рас пределение, выражающих его закономерность, означает, что исследователь абстрагируется от случайных особен ностей, флюктуаций реального распределения, вызван ных влиянием случайных факторов на величину призна ка у отдельных единиц совокупности. Однако при этом не происходит абстрагирования от случайных особенно стей. присущих тому периоду или моменту времени, к которому относится эмпирическое распределение. И нет никакой гарантии, что теоретическое распределение, построенное на основе данных только одного случайно выбранного периода, действительно отражает типиче ские черты, закономерности распределения, присущие со вокупности в процессе всего ее развития или на опреде ленном его этапе. Напротив, достаточно обратиться-к дан ным табл. 4—8 и 13, чтобы понять: присущие динамике распределений колебания приводят к значительным раз личиям в характере эмпирических распределений за от дельные годы.
Итак, в дополнение к имеющимся в литературе ука заниям нужно иметь в виду, что для нахождения закона распределения, в том числе и функции плотности вероят ности, необходимо абстрагироваться не только от стати ческих случайностей, присущих эмпирическому распреде лению в каждый отдельный период, но и от~динамических случайных колебаний распределения. Недооценка динамики, игнорирование неизбежных в процессе разви тия колебаний под влиянием побочных факторов, не свя занных с причинами, обуславливающими прогрессивное развитие совокупности, проявляется и в данной пробле ме— в методике выявления закономерностей распреде ления. Необходимо ясно представлять себе, что отыска ние закономерности распределения по одномоментным данным, данным одного периода может быть допустимо только в случае исследования весьма стабильной сово купности, а также для расчетов и прогнозов в условиях,
88
аналогичных тому специфическому периоду или момен ту, который послужил исходным для определения зако номерностей распределения. В большинстве же случаев для исследования законов распределения является не обходимым привлечение и анализ данных о динамике распределения, отделение случайных его особенностей в результате колебаний в отдельные периоды от типиче ских черт, устойчиво присущих распределению в сред нем, в тенденции на протяжении целого длительного этапа развития. Строго говоря, именно только эти послед ние и можно называть закономерностями распределения.
Исследование динамики распределения позволяет решить две познавательные задачи: во-первых, сгладить, выровнять колебания эмпирического распределения в отдельные годы под влиянием переменных во времени факторов (это позволяет надежнее установить типические черты закономерности распределения, его интегральной и дифференциальной функций); во-вторых, выявить эво люцию самой закономерности распределения, постепен но приводящую к качественному изменению типа инте гральной и дифференциальной функций, которым соот ветствует данное распределение. Смена одного типа за кономерности распределения совокупности другим дол жна иметь серьезные причины в материальных факторах динамики совокупности, она должна быть объяснена ими, т. е. раскрыта с точки зрения тех конкретных наук, ко торые изучают развитие данной совокупности (экономи ки сельского хозяйства и агрономии, например, если речь идет о динамике распределения сельскохозяйствен ных предприятий по урожайности).
Рассмотрим результаты исследования динамики рас пределения совхозов Ленинградской области по урожай ности картофеля (табл. 4 и 9). Проверке подвергнута прежде всего гипотеза о том, что данное распределение является нормальным (несущественно отличным от нор мального). Выбор данной гипотезы для проверки обос новывается большой распространенностью нормального распределения, его особо важной ролью в математиче ской статистике и, в частности, тем, что соответствие рас пределения совокупности нормальному закону является, по мнению ряда ученых, предпосылкой применения к этому признаку метода корреляционного анализа. Вто рая гипотеза, подвергнутая проверке, — гипотеза о лога
89
рифмически нормальном законе распределения. Она из брана потому, что, как уже отмечалось ранее, некоторые статистики считают: достаточно быстро развивающаяся совокупность подчиняется именно логарифмически нор мальному закону распределения.
Методика исследования динамики |
распределения |
|||
с точки зрения функции плотности |
вероятности и инте |
|||
грального закона распределения |
может |
включать |
ряд |
|
приемов: прежде всего, |
необходимо проверить гипотезу |
|||
о том или ином законе |
распределения за каждый |
год |
||
в отдельности и установить, происходит или не происхо дит процесс перехода от одной закономерности распреде ления к другой; к какой из проверяемых гипотез чаще и лучше подходит эмпирическое распределение. Проверка, как было отмечено в § 1, произведена по двум крите риям: «хи-квадрат» К. Пирсона и «лямбда» А. Н. Кол могорова. Распределение считается соответствующим данной гипотезе лишь в том случае, когда по одному и по другому критерию предположение о соответствии не опровергается при уровне вероятности 0,05. Если вероят ность, соответствующая тому или другому критерию, ока зывается менее 0,05, эмпирическое распределение счи тается не соответствующим проверяемой гипотезе.
Результаты представлены в табл. |
13. |
Анализ данных табл. 13 очень |
поучителен. Прежде |
всего оказалось, что в большой части случаев за 6 лет обе гипотезы не отвергаются, т. е. эмпирическое распре деление соответствует как нормальному, так и логариф- мически-нормальному закону. За 4 года распределение не подходит к нормальному закону, но соответствует ло- гарифмически-нормальному. Два раза (в 1970 и 1971 гг.) распределение, наоборот, не подходит к логарифмически-
нормальному закону, зато |
соответствует нормальному. |
И два раза распределение |
не подходит ни к тому, ни |
к другому закону; обе гипотезы отвергаются.
Второй важный вывод заключается в том, что все без исключения случаи, когда та или другая гипотеза была отвергнута, объясняются низким значением вероятности критерия х2. В то же время по критерию К обе гипотезы удовлетворяются на протяжении всех 14 лет с большим запасом надежности. Это свидетельствует о том, что «ин тегральный характер» распределения, частота в широких пределах весьма близко соответствует теоретическим
90
