
- •Булдык г.М. Статистическое моделирование и прогнозирование: учебник для вузов
- •Глава 2. Статистические методы моделирования и прогнозирования связей
- •2.1. Статистические методы выявления наличия корреляционной связи
- •2.2. Методы проверки существенности статистических связей
- •2.3. Однофакторные регрессионные модели
- •2.4. Многофакторные регрессионные модели
- •2.5. Ранговая корреляция
- •Корреляция атрибутных признаков
- •Вопросы для самопроверки
- •Явлений на основе факторных регрессионных моделей
Булдык г.М. Статистическое моделирование и прогнозирование: учебник для вузов
Глава 2. Статистические методы моделирования и прогнозирования связей
2.1. Статистические методы выявления наличия корреляционной связи
Метод взаимозависимых параллельных рядов. Суть метода взаимозависимых параллельных рядов заключается в установлении связей между экономическими явлениями и процессами посредством сопоставления двух или нескольких рядов показателей.
Показатели, касающиеся факторного (детерминирующего) признака, располагаются по возрастанию либо убыванию в зависимости от эволюции исследуемого явления или процесса. Операция продолжается путем параллельной записи значений результативных (детерминируемых) признаков. Затем, сравнивая расположенные таким образом ряды значений, выявляют существование связи и ее направление. (Отметим, что возможность связи обоснована предварительным анализом.) Можно сравнивать временные (динамические) и территориальные ряды, ряды распределения.
При сравнении временных рядов нужен предварительный экономический анализ, подтверждающий существование связи между исследуемыми явлениями или процессами, данные должны относиться к достаточно продолжительному периоду времени, чтобы можно было отчетливо выделить тенденцию связи между явлениями.
При исследовании существования связи
между экономическими явлениями или
процессами, выраженными динамическими
рядами, необходимо помнить, что аргумент
функции является фактором-причиной, а
не фактором-временем.
Примером связи между показателями двух динамических рядов служит зависимость между основными производственными фондами на одного рабочего и производительностью труда. Между этими явлениями существует тесная связь.
Преимущество рассмотренного метода – простота его использования. Основной недостаток состоит в субъективной оценке существования зависимости.
Рассмотрим приведенные в табл. 2.1 данные, характеризующие связь между личным доходом X (день. ед.) и личными сбережениями Y (день. ед.).
Т а б л и ц а 2.1
|
|
|
|
|
|
|
|
190 187 200 |
11,2 8,8 13,3 |
|
216 240 251 |
18,9 19,6 21,2 |
|
251 262 267 |
20,4 22,9 23,0 |
Из простого сопоставления этих рядов можно легко установить, что возрастание значения факторного признака X – личного дохода (187; 190; 200; 216; 240; 251; 251; 262; 267) определяет возрастание результативного признака Y – личных сбережений (8,8; 11,2; 13,3; 18,9; 19,6; 21,2; 20,4; 22,9; 23,0). В данном случае между факторным и результативным признаками существует прямая связь.
Метод статистических группировок. Установление связи между двумя или несколькими экономическими явлениями начинается с группировки данных по факторному признаку. Затем вычисляют средние значения для результативного признака по группам, на которые была разбита статистическая совокупность. Вычисленные средние значения результативного признака позволяют устанавливать связь между изучаемыми признаками, показывая среднее влияние определенного фактора в рамках каждой группы.
Отметим, что объективность связи и влияния каждого факторного признака на изменения результативного признака зависят от количества исходных данных и однородности данных в группах. Чем большим числом исходных данных мы располагаем и чем однороднее данные в группах, тем объективнее информация о связи и влиянии факторного признака на результативный.
Кроме того, при исследовании зависимости между экономическими явлениями следует знать, являются ли изучаемые признаки количественными или качественными (атрибутивными).
В экономике выделяют три варианта комбинаций двух признаков:
1) оба признака количественные (например, стаж работы и средняя почасовая оплата; заработная плата и производительность труда и т.д.);
2) один признак количественный, а другой качественный (например, профессия и заработная плата; порода коров и производство молока; вид почвы и средний урожаи с гектара и т.д.);
3) оба признака качественные (например, профессия и образование; социальное происхождение и социальное положение и т.д.).
При изучении связи между количественными признаками выбирают основной факторный признак, разбивают его на группы, затем вычисляют средние значения результативного признака. После составления таблиц приступают к сравнению вычисленных данных, переходя от одной группы к другой. Прослеживая изменения групповых средних, устанавливают связь между изучаемыми признаками.
Величину интервала группировки и, следовательно, число групп можно установить из формулы Стерджеса (1.1).
Интервалы могут быть равными и неравными, если факторные признаки имеют большую и разнообразную вариацию, хотя объем исследуемой совокупности небольшой.
Изучая зависимость между количественными и качественными признаками, за признак группировки можно принимать любой из них. Если группы составляют по качественному признаку, например по виду почвы (тяжелая, средняя, легкая), то вычисляют средние значения результативного признака и проводят анализ существования связи на основании таблицы. Если же в основу группировки положен количественный признак, то для результативного признака, который является качественным, нельзя вычислить групповые средние, так как атрибутивные признаки не имеют числового выражения. Поэтому для каждой из групп вычисляют относительные величины, выражающие удельный вес единиц, характеризуемых качественным признаком в пределах исследуемой совокупности.
Изучение существования связи между двумя качественными признаками проводится следующим образом: строится группировка по факторному признаку, затем вычисляются показатели удельного веса для каждой группы результативного признака и проводится сравнение полученных результатов.
Для характеристики сложных взаимных связей между тремя, четырьмя и более явлениями применяется комбинированная группировка. При этом статистическая совокупность сначала разбивается на группы по одному признаку, затем каждая из полученных групп разбивается на более мелкие группы по другому признаку и т.д. Во избежание слишком большей раздробленности рекомендуют выбрать два или три группировочных признака, составив для каждого из них группы сравнимы и закрытыми интервалами. Закончив группировку, вычисляют средние или относительные значения результативного признака для созданных групп и подгрупп. Вычисленные показатели сравниваются и анализируются в тесной связи с изменением признаков, положенных в основу группировки.
Простые и комбинированные статистические группировки, применяемые для установления связи между экономическими явлениями, могут быть наглядно представлены в виде группировочных и комбинационных таблиц.
Рассмотрим сначала связь между двумя
количественными признаками: личным
доходом и личными сбережениями (см.
табл. 2.1). Разобьем факторный признак X
– личный доход – на группы. Интервал
группировки определим по формуле (1.1).
Получим h = 19,18. Составим табл. 2.2, в
которой указаны интервалы (группы)
факторного признака и средние величины
соответствующих значений результативного
признака. Так, например,
Т а б л и ц а 2.2
Интервал факторного признака X |
Среднее значение результативного признака Y |
189,00 – 206,18 206,18 – 225,36 225,36 – 244,54 244,54 – 263,72 263,72 – 282,90 |
11,1 18,9 19,6 21,5 23,0 |
Переходя от одного интервала к другому и прослеживая изменение групповых средних результативного признака, можно констатировать, что между личным доходом и личными сбережениями существует довольно сильная зависимость. Возрастанию величины интервала личных доходов непременно соответствует возрастание личных сбережений.
Исследуем связь между качественным и количественным признаками. В табл. 2.3 составлены группы по качественному признаку – образованию рабочих (неполное среднее, среднее, профессионально-техническое) и вычислена средняя заработная плата соответствующих групп рабочих.
Т а б л и ц а 2.3
Образование |
Неполное среднее Среднее Профессионально-техническое |
Средняя заработная плата, ден. ед. |
2,075 2,2 2,5 |
Анализ табл. 2.3 показывает, что существует связь между качественным и количественным признаками.
Рассмотрим пример исследования связи между качественным и количественным признаками, когда в основу группировки положен количественный признак. В табл. 2.4 приведена группировка 400 кооперативов одной из областей Республики Беларусь по основным фондам (факторный признак). Результативный признак – передовые, средние и слабые кооперативы – является атрибутивным. Для него нельзя вычислять групповые средние, так как атрибутивные признаки не имеют численного значения. В этом случае вычисляются относительные величины, выражающие удельный вес единиц, характеризуемых качественным признаком в пределах исследуемой совокупности.
Т а б л и ц а 2.4
Интервал основных фондов |
Кооперативы |
Всего по области |
||
передовые |
средние |
слабые |
||
до 20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100 100-110 110-120 120-130 130-140 140-150 Свыше 150 |
- - - - - - 1,6 3,4 5,0 7,9 7,0 21,2 37,5 10,3 6,1 |
- - - - - 6,4 7,1 18,3 37,4 25,0 3,8 2,0 - - - |
10,1 29,9 41,2 9,0 4,3 2,5 1,0 2,0 - - - - - - - |
1,8 3,7 5,2 6,0 6,8 8,0 9,5 18,8 15,2 8,3 7,0 3,0 2,5 2,2 2,0 |
В с е г о, % |
100 |
100 |
100 |
100 |
Исследуя связь между величиной основных фондов и последовательным расположением кооперативов по признакам их развития и укрепления, отмечаем, что слаборазвитые кооперативы входят в своей совокупности в интервалы до 100 ден. ед.; передовые кооперативы в большинстве случаев (90%) сгруппированы в высшие интервалы – с основными фондами свыше 100 ден. ед., а средние кооперативы входят в центральные интервалы от 60 до 130 ден. ед..
Рассмотрим пример связи между двумя атрибутивными признаками: видом обучения рабочих (курсы на производстве и профессионально-технические училища) – факторный признак – и удельным весом рабочих, дававших брак при выполнении фиксированной сложной операции обработки деталей – результативный признак. Результаты статистических наблюдений представлены в табл. 2.5.
Т а б л и ц а 2.5
Y X |
Профессионально-технические училища |
Курсы на производстве |
|||
число рабочих |
% |
число рабочих |
% |
||
Удельный вес рабочих, дававших брак, % |
211 81,2 |
96 61,9 |
|||
Всего рабочих |
260 |
155 |
Из таблицы четко прослеживается связь между исследуемыми атрибутивными признаками. Кроме того, анализ взаимосвязи признаков позволяет сделать вывод о том, что способ получения квалификации является одним из главных факторов выпуска качественной продукции.
Для характеристики сложных взаимосвязей применяются комбинированные группировки.
Так как объем учебника ограничен, а подробное изложение этого метода требует много места, то отошлем читателей к книге [16].
Корреляционная таблица. Специальной формой комбинационной таблицы является корреляционная таблица. Она охватывает два зависимых ряда распределения, один из которых представляет факторный признак (X), другой – результативный (Y).
Если в корреляционной таблице частоты группируются около диагонали, соединяющей левый верхний (нижний) и правый нижний (верхний) углы таблицы, то между исследуемыми явлениями существует прямая (обратная) связь, т.е. возрастание или уменьшение факторного признака влечет за собой возрастание (уменьшение) или уменьшение (возрастание) результативного признака. Такая концентрация частот отражает прямую вариацию исследуемых признаков. При этом интенсивная концентрация частот около диагонали указывает на существование тесной связи между явлениями, а рассеивание частот по всей таблице свидетельствует об отсутствии связи.
Рассмотрим связь между личным доходом
и личными сбережениями (см. табл. 2.1).
Построим корреляционную таблицу, разбив
предварительно факторный и результативные
признаки на интервалы длиной
=19,18
и
=2,83
и подсчитав число значений признаков,
входящих в данные интервалы. Корреляционная
таблица будет иметь вид табл. 2.6.
Т а б л и ц а 2.6
Личные сбережения Y |
Личный доход X |
Личный доход X |
|||||
187,0-206,18 |
206,18-225,36 |
225,36-244,54 |
244,54-263,72 |
263,72-282,90 |
|||
8,80–1,63 11,63–14,46 14,46–17,29 17,29–20,12 20,12–23,00 |
2 1 - - - |
- - - 1 - |
- - - 1 - |
- - - - 3 |
- - - - 1 |
2 1 - 2 4 |
|
|
3 |
1 |
1 |
3 |
1 |
|
Концентрация частот около диагонали, соединяющей левый верхний угол с правым нижним углом, указывает на тесную прямую связь между личным доходом и личными сбережениями.
Графический метод. Графический
метод исследования связи состоит в
следующем: строится прямоугольная
система координат; значения факторного
признака
откладываются на оси абсцисс, а на оси
ординат откладываются значения
результативного признака
.
Результат каждого наблюдения отображается
точками
.
Расположение точек на графике отражает
существование или отсутствие связи
между факторным и результативным
признаками.
Изображение на плоскости всех парных значений двух переменных X и У называется диаграммой рассеяния или корреляционным полем.
Тесная группировка точек около одной определенной линии, выражающей форму связи (прямолинейной, параболической, гиперболической и т.д.), указывает на сильную связь между факторным и результативным признаками. Рассеянное расположение точек на графике доказывает отсутствие связи между признаками.
Таким образом, диаграмма рассеяния позволяет более наглядно выделять меру совместного изменения (ковариации) двух переменных, т.е. с помощью корреляционного поля можно уловить форму и тенденцию зависимости между факторным и результативным признаками.
Рассмотрим изучение зависимости личных сбережений (Y) от личного дохода (X).
На рис. 2.1 представлена диаграмма рассеяния, соответствующая результатам, приведенным в табл. 2.1. Координатами точек диаграммы являются величины личного дохода и личных сбережений. По скоплению точек на диаграмме видно, что с увеличением личного дохода наблюдается ясно выраженная тенденция роста личных сбережений. Эта тенденция имеет явно линейный характер, благодаря чему можно попытаться аппроксимировать рассматриваемую зависимость линейной функцией регрессии. Конечно, эта тенденция существует лишь в среднем, так как она нарушается отклонениями отдельных точек. Отклонения от прямой объясняются влиянием прочих неучтенных или случайных факторов.
Рассмотренные методы исследования зависимости сравнительно просты, но их значение неоспоримо, поскольку они дают полезную информацию о сущности и характере исследуемой связи. Результаты, полученные элементарными методами, служат основой для применения более сложных методов анализа.
Вопросы для самопроверки
1. Назовите методы исследования зависимости между экономическими явлениями.
2. Изложите суть метода взаимозависимых параллельных рядов.
3. Какие варианты комбинации признаков встречаются в экономике?
4. Охарактеризуйте метод исследования сложных взаимных связей между тремя, четырьмя и более явлениями.
5. Как строится корреляционная таблица?
6. Какой метод применяется для визуальной оценки зависимости между экономическими явлениями?
Задача. По данным, приведенным в табл. 2.7, выявите, применив методы исследования зависимости, существует ли связь между валовой продукцией на одного среднегодового работника сельского хозяйства (Y, день. ед.) и нагрузкой сельскохозяйственных угодий на одного работника (X, га/чел.).
Т а б л и ц а 2.7
X |
Y |
|
X |
Y |
|
X |
Y |
10532 11079 8698 7032 12805 13037 9643 8358 11208 11471 |
10,521 7,804 7,616 6,810 8,235 5,744 7,376 8,761 6,594 9,763 |
|
12258 13558 10722 10625 11791 8854 18702 9089 9332 11982 |
8,113 7,677 8,685 11,551 9,185 5,880 8,583 10,019 8,764 8,806 |
|
10535 9956 9903 11050 9886 11423 9145 8307 8744 11776 |
9,091 7,318 8,479 9,699 9,653 8,803 10,563 9,251 11,294 12,506 |