Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Юзбашев М.М. Методы изучения динамики распределений и зависимостей

.pdf
Скачиваний:
14
Добавлен:
23.10.2023
Размер:
7.61 Mб
Скачать

только той частью единиц совокупности, которая не под­ верглась преобразованиям, исключить вновь возникшие единицы совокупности означало бы заведомо исказить общие закономерности ее динамического развития. В са­ мом деле, если при изучении динамики совокупности сов­ хозов искусственно выделить только те хозяйства, кото­ рые за весь период не подвергались преобразованиям, не укрупнялись и не разукрупнялись, не меняли состава земельных угодий, например за счет освоения мелиориро­ ванных болот, кустарника, не меняли своей специализа­ ции и других качественных особенностей, — это означа­ ло бы, что анализ динамики базируется на относительно консервативной части общей совокупности, и выводы, полученные на основе такого исследования, заведомо не­ репрезентативны.

Следовательно, в корреляционную таблицу за каждый период, год следует включать по возможности все едини­ цы однородной совокупности, по которым имеются соот­ ветствующие данные, за исключением явно ошибочных по значениям признаков и не поддающихся уже исправле­ нию (за давностью или ввиду утраты части данных). Однородность изучаемой совокупности, разумеется, яв­ ляется не абсолютной; важно, чтобы она существовала в отношении тех признаков, корреляция между которыми исследуется. Нарушение требования об однородности со­ вокупности может привести к появлению одного из ви­ дов ложной корреляции, подробно рассмотренному Н. С. Четвериковым [26, с. 206—209; 216—218]. Проверка одно­ родности изучаемой совокупности по коррелируемым признакам производится по общему характеру рядов рас­ пределения (отсутствие бимодальности и мультимодаль­ ности), по коэффициенту вариации признаков, который не должен быть велик (не более 40—60%), а также про­ веркой близости закона распределения совокупности по изучаемым признакам к нормальному (по критериям согласия «лямбда» и «хи-квадрат»).

Среди статистиков и всех, применяющих метод кор­ реляционного анализа, много споров вызывает проблема соотношения, значения и применения показателей пар­ ной корреляции и частной корреляции. Парный коэффи­ циент корреляции факторного признака с результатив­ ным измеряет тесноту связи между ними, игнорируя факт переплетения, взаимодействия массы причин и след­

121

ствий. Ввиду этого, на самом деле, парный коэффициент корреляции отражает не только прямое («чистое») влия­ ние данного фактора на результативный признак, но и его косвенное влияние через связь данного фактора с дру­ гими факторами, также влияющими на результативный признак. Например, если сгруппировать совхозы (колхо­ зы) области по дозе органических удобрений, вносимых на гектар пашни, то парные коэффициенты корреляции урожайности сельскохозяйственных культур с дозой ор­ ганических удобрений получаются неожиданно высокими [25, 222—224; 280]. Более тщательное и всестороннее рас­ смотрение проблемы показывает, что хозяйства, внося­ щие большие дозы органических удобрений, как правило, вносят больше и минеральных удобрений, применяют семенной материал лучшего качества, имеют более высо­ кий уровень фондообеспеченности и т. п., иначе говоря, это хозяйства с более высоким общим уровнем интенси­ фикации производства. Следовательно, влияние органиче­ ских удобрений иа урожайность, определяемое с по­ мощью парной корреляции, на самом деле отражает не только эффект действия самих органических удобрений, но и всех сопутствующих факторов интенсификации расте­ ниеводства, иначе говоря, оно явно завышено по отноше­ нию к действительному эффекту одних только органиче­ ских удобрений (или только минеральных удобрений).

Следовательно, если необходимо измерить влияние только самой дозы органических (или минеральных) удобрений на урожайность, их чистую эффективность, обязательно нужно применить методику множественно­ го корреляционного анализа, включающего все основные факторы интенсификации производства, и выделить частную корреляцию дозы органических удобрений с уро­ жайностью, исключая остальные факторы.

Сказанное выше достаточно хорошо описано в лите­ ратуре и не заслуживало бы повторения, если бы не да­ ло повода к широко распространившемуся заблуждению о том, будто всегда и всюду, в любом исследовании пар­ ные корреляции представляют собой лишь полуфабрикат истины, а вот частная корреляция — это готовый продукт, истинное знание в более или менее чистом виде. Ставить вопрос так, значило бы вступить на путь математическо­ го (или статистического) формализма, на путь шаблона, чуждый научному познанию. Роль показателей парной и

122

частной корреляции, их место в исследовании, их позна­ вательный смысл определяются задачей конкретного ана­ лиза и качественным содержанием системы изучаемых взаимосвязей. Рассмотрим пример: исследуя влияние концентрации производства, размеров отрасли в совхозах и колхозах на себестоимость продукции, мы можем оп­ ределить показатели парной корреляции между размером производства (валовым сбором зерна, картофеля и т. д„ валовым надоем молока) и себестоимостью продукции. Как правило, получаются характеристики существенной обратной зависимости, близкой к гиперболическому за ­ кону. К данной проблеме можно подойти и с позиции частной корреляции: выделив систему взаимосвязанных факторов, влияющих на себестоимость (размер произ­ водства, фондовооруженность, производительность труда, его оплата, удельные расходы основных материалов — семян, кормов и т. д.), затем изолировать «чистое» влия­ ние размеров производства от всех остальных факторов с помощью методики частной корреляции и определить характеристики последней. От существенной парной кор­ реляции при этом остаются, образно говоря, «рожки да ножки», частные коэффициенты корреляции сплошь и ря­ дом вообще незначимы. Спрашивается: какая же мето­ дика, какой ответ о влиянии концентрации производства на себестоимость продукции имеет реальное экономиче­ ское содержание? На этот вопрос нельзя ответить исходя из абстрактных схем корреляционного анализа, он тре­ бует экономического обоснования, проникновения в со­ держание процесса концентрации производства и его роли в экономике.

Сущность экономического процесса концентрации про­ изводства не в механическом возрастании размера про­ дукции, размера предприятий, а в том, что это возраста­ ние вызывает повышение технического уровня производ­ ства, применение более совершенной технологии, оснаще­ ние производства новейшими, наиболее производительны­ ми машинами, совершенствование организации труда. Этн факторы позволяют повысить производительность труда, снизить удельные расходы материалов на единицу про­ дукции и тем самым значительно снизить себестоимость продукции. Пытаться «изолировать» рост размеров про­ изводства «в чистом виде» от неразрывно связанных с ним, сопровождающих его факторов, значит разрывать

123

единое целое, искажать сущность процесса концентрации производства. Следовательно, при изучении данной про­ блемы статистическим методом, адекватным экономиче­ скому ее содержанию, является метод парной корреляции между размерами производства и себестоимостью про­ дукции. Необоснованная замена парной корреляции на частную приведена авторами учебника по общей теории статистики [8, с. 233—234]. Они анализируют связь про­

изводственного стажа рабочих

2») с их сменной выра­

ботки («у»), получая вначале

высокий парный

коэф­

фициент корреляции г2у = +0,777.

Далее, они вводят

фактор «х» — продолжительность

внутрисмениых

про­

стоев, и пользуясь методом частной корреляции, «очища­ ют» влияние стажа на выработку от влияния простоев, получая значительно более низкий коэффициент частной корреляции rzyix) = +0,48. По этому поводу в учебнике сделан следующий вывод: «Сопоставляя полученные частные коэффициенты корреляции... с вычисленными ранее парными коэффициентами... мы видим, что обнару­ женная ранее заметная связь между длительностью про­ изводственного стажа (факториальный признак z) и уровнем производительности труда рабочих (результа-' тивный. признак у) определялась главным образом тем, что более опытные (с более длительным производствен­ ным стажем) рабочие имели в среднем меньшие внутрисменные простои (факториальный признак х), чем менее опытные рабочие (с менее длительным производственным стажем); «чистое» же влияние длительности производст­ венного стажа на уровень производительности труда ха­ рактеризуется в данных условиях небольшим показате­ лем: /+(.%■) = +0,48».

Разумеется, если «очистить» влияние стажа рабочих от всех тех реальных преимуществ, к которым ведет больший стаж, то его «влияние» на производительность труда можно свести к нулю. Сокращение внутрисмениых простоев — не посторонний по отношению к стажу рабо­ чих фактор, а неотъемлемо с ним связанный, поэтому применение авторами учебника в данном конкретном примере методики частной корреляции неоправдано.

Итак:

1. Если сущность изучаемой системы взаимосвязе того процесса, который ее порождает, состоит в неразрыв­ ном сочетании изменений одного ведущего фактора с дру-

124

гимн, ему по необходимости соответствующими фактора­ ми, влияние этого ведущего фактора на результативные признаки должно-измеряться, как полное влияние, с по­ мощью методики парной корреляции.

2. Если же изучается влияние дополнительного, по­ бочного фактора системы или сущность исследуемого про­ цесса допускает изолированное изменение отдельных факторов, для измерения влияния каждого из них на результативный признак должна применяться методика частной корреляции.

§ 2. Методы изучения динамики парной линейной регрессии и корреляции

Изучение динамики одномерных распределений на­ чинается с построения и анализа вариационно-динамиче­ ских таблиц (см. § 2 гл. II). Нельзя ли изучение дина­ мики двумерных распределений также начать с корреля­ ционно-динамических таблиц, в которых было бы пред­ ставлено изменение двумерного распределения с течени­ ем времени? К сожалению, корреляционно-динамическая таблица не может быть построена в достаточно наглядной и выразительной форме. Двумерное распределение за один период времени уже представляет собой систему с тремя координатами: значениями факторного признака, значениями результативного признака и частотами.'Вве­ дение четвертой координаты времени приводит к тому, что ни табличное, ни графическое отображение динами­ ки двумерного распределения не может быть осуществле­ но без введения дополнительных условных приемов, как правило, лишающих таблицу и график' наглядности, обо­ зримости и аналитических преимуществ, ради которых строятся таблицы и графики.

Все же для некоторых частных случаев динамики дву­ мерных распределений существуют достаточно нагляд­ ные способы табличного и графического изображения.

Способ условных обозначений частот в разные перио­ ды. Этот способ можно применить, если за все периоды, число которых невелико, двумерное распределение может быть отображено при постоянных интервалах признаков.

Изображение динамики двумерного распределения с помощью условных обозначений частот разных лет раз­ личным цветом или шрифтом можно применять только

7-372

125

 

 

 

 

Т а б л и ц а 23

Динамика корреляционной зависимости.

Способ условного обозначения частот в разные годы

л V у До 15 15-20 20-25 25 -30 30-35

35-90 90 -95

95 -50 50-55

55-60

б о т е

И т ого

 

 

 

 

60

 

Д о 5

5 - 7

7 - 9

5-77

11-13

13-15

15-17

17-19

19-21

ит о го

±

и

8

2

 

 

 

 

 

 

 

 

 

 

 

22

1

2 <

18 3

73 3

16 1

_7

 

 

 

 

 

 

 

8

46

 

 

3

Ю \\ 5 ТО 6

2

2

 

 

 

 

 

 

24

10

 

 

2 5

5_

 

 

 

 

 

 

28

 

 

i

1 Ъ2,2

16

6 8_

 

_

7

1 J_

3

 

 

4 2

13

 

 

1

 

 

12 5 6

 

 

23

 

 

 

 

2 4

4

1о

&2

8 15 2.

2

5

 

3 0

 

 

 

 

±

 

24

11

 

 

 

 

 

1

2

5

 

9 5

б

"

7

2 2

Z &

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

2

6

7 15

2 i5

3 е

3

47'

 

 

 

 

 

 

 

14

 

 

 

 

 

 

 

 

 

i

 

3

 

Ю

9

Z

2 5

 

 

 

 

 

 

 

 

 

 

 

 

4

5

6

1 5

2

18 1

4

26 17 725 28

14

 

 

31

3 7

1 3 ^

4 2 9

и

 

29 9

78 3 1 1в!

1

\346?33

УслоЬные оБазначет/л■ 4 77 8 —7360г

5, 1 1 , 6 - jg s s e ;

i , 2 , 6 — 1970г

при небольшом числе сравниваемых периодов — не бо­ лее 3—4.

Табл. 23 достаточно наглядно отражает динамику двумерного распределения 1, по ней могут быть сделаны следующие выводы:

1. Динамика распределения происходит при возрас­ тании средних величин обоих взаимосвязанных призна­ ков.

2.Численность совокупности заметно возросла только

впериод с 1965 по 1970 г.

3.Распределение совокупности по признакам х и у все время остается близким к нормальному.

4.Зависимость между признаками х и у сохраняет

примерно прямолинейный характер.

5. Теснота зависимости скорее всего несколько умень­ шается ввиду возрастания абсолютной величины вариа­ ции по признаку х.

Графическое изображение динамики корреляционной зависимости также может быть в данном частном случае достигнуто с помощью метода условных обозначений для разных лет. Оно строится в прямоугольной системе ко­ ординат, как и за отдельный период времени, но на поле графика наносятся точки разных цветов или разной формы знаки (точка зачерненная, кружок, звездочка), каждый из которых соответствует определенному пе­ риоду.

Графическое изображение (рис. 5) позволяет сделать следующие выводы.

1. Динамика совокупности приводит к возрастанию как средних значений признаков х и у, так и их диспер­ сий.

2.Зависимость между х и у сохраняет примерно пря­ молинейный характер.

3.Уменьшается наклон линии регрессии у по х, т. е. большой оси воображаемого эллипса, охватывающего «точки» за каждый год, иначе говоря, снижается сред­ нее возрастание признака у на единицу признака хУ

4.Зависимость становится менее тесной, возрастает

разброс «точек», следовательно, относительная роль признака х в вариации признака у постепенно умень­ шается.

1 Для повышения наглядности полезно данные разных лет обо­ значать разными цветами.

Т

127

Способ условного обозначения данных за разные'пе­ риоды особенно пригоден в сочетании с .методом средних двумерных распределений, т. е. распределений, усред­ ненных за ряд лет. Усредненное распределение, например, за пятилетие лучше отражает закономерность связи при­ знаков, чем распределение за один год, если только сама закономерность связи остается на протяжении пятилетия постоянной. Особенно полезно усреднение распределе­ ний при наличии значительной случайной колеблемости признаков в динамике, например, колеблемость урожай­ ности сельскохозяйственных культур. Изобразив с по­ мощью двух видов условных знаков средние распределе­ ния за два пятилетия, можно по графику достаточно уве­ ренно судить о динамике корреляционной зависимости.

жX

ж о *

Г *

Хо

О О

6 -

V №50г

3 -

 

 

 

 

V таг.

 

 

 

 

 

о

 

 

 

 

 

so

wo

150

zoo

Z50

300

Рис. 5. Графическое изображение динамики корреляционной зави­ симости с помощью условных обозначений разных периодов

Другим методом табличного и графического, представ­ ления динамики двумерных распределений может слу­ жить метод параллельного сопоставления серий корре­ ляционных таблиц или графиков. При этом отдельная таблица или график, желательно небольшого размера, строится для каждого периода или момента времени от­ дельно, а затем полученные таблицы или графики распо­ лагаются вместе, желательно в строго определенном по-

128

19Б5г.

25 ~:

2 0 -

15

10 -

5

0-

10 20 30 90 50 00 70

1968 г

25-

2 0 -

15-

10- '

20 30 00 50 SO 70

1.9SC г.

1907г.

25 Н

 

 

 

 

 

 

го-

 

 

 

 

 

 

20 -

 

 

 

 

 

 

го

 

 

 

 

 

 

15

 

 

 

 

 

 

го

 

 

 

 

 

 

10 -

 

 

 

 

 

 

т

 

 

 

 

 

 

5 -

 

 

 

 

 

 

о ■

 

 

 

 

 

 

0_

 

 

 

 

 

 

о

 

 

 

 

 

 

10

го

30

90

50

60

70

10

20

30

90

50

ВО

70

И

 

 

1960 г

 

 

 

 

 

1970 г

 

 

 

25 -

 

 

 

 

 

 

25

 

 

 

 

 

 

20-

 

 

 

 

 

 

20

 

 

 

 

 

 

15 -

 

 

 

 

 

 

15

 

 

 

 

 

 

т -

 

 

 

 

 

 

Ш

 

 

 

 

 

 

 

 

 

 

 

 

 

.1

 

 

 

 

 

 

 

 

 

 

 

 

 

О

 

 

 

 

 

 

т

га

зо

оо

ао

во

'/о

10

20

30

90

50

60

70

ГО-

Рис. 6. Динамика корреляционной зависимости. Метод параллельного сопоставления

СО

рядке друг за другом, с тем, чтобы их можно было охва­ тить единым восприятием и получить на основе их срав­ нения представление о характере динамики зависимости.

Параллельное сопоставление построенных в одинако­ вом масштабе графических изображений корреляционной зависимости за последовательный ряд лет (рис. 6) по­ зволяет судить о динамике формы и тесноты этой зави­ симости. Заметны существенные колебания в расположе­ нии точек на графике, особенно, колебания значений признака х. Колеблется и наклон оси воображаемого эл­ липса, охватывающего точки, т. е. колеблется коэффици­ ент регрессии. Постепенно ослабевает теснота корреля­ ционной зависимости: если по графику за 1965 г. можно примерно оценить коэффициент корреляции в пределах от 0,7 до 0,8, то в 1970 г. его можно оценить, как находя­ щийся в пределах 0,5—0,6. Зависимость в целом сохра­ няет характер, близкий к прямолинейности, однако к концу изучаемого периода более заметна тенденция

к параболе вида у = а + Ьх схг.

Применение метода параллельного сопоставления от­ дельных коррёляциониых таблиц или графиков также ограничено. Чем больший по длине период исследуется, тем более громоздкими и труднообозримыми становятся ряды таблиц или графиков и тем более трудоемким их построение. Вряд ли целесообразно пользоваться дан­ ным методом при изучении динамики зависимости бо­ лее чем за 8— 10 лет. Существенные изменения значений признаков в динамике также препятствуют параллельно­

му сопоставлению одномасштабных

графиков и таблиц

с интервалами, одинаковыми за все годы.

 

Трудность табличного и графического

отображения

динамики двумерных распределений

еще

многократно ,

возрастает при переходе к распределениям с большим числом параметров. Следовательно, табличное и графиче­ ское изображение динамики самих многомерных распре­ делений не может играть основную роль в ее анализе. Эта роль переходит к таблицам и графикам, отражающим динамику сводных характеристик многомерного распре­ деления. Рассмотрим построение и методику анализа

подобной таблицы на примере исследования динамики корреляционной зависимости между урожайностью кар­ тофеля и производительностью труда в его производстве

130

Соседние файлы в папке книги из ГПНТБ