Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы статистического изучения корреляционной...doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
854.02 Кб
Скачать

24

Методы статистического изучения корреляционной связи

(03.10.09.-15.10. 09.)

Между различными процессами, явлениями, происходящими в окружающем мире, могут существовать определенные взаимосвязи, взаимозависимости. Значительную часть этих взаимосвязей можно охарактеризовать какими-то переменными величинами.

Взаимосвязь может быть функциональной, т.е. когда изменение одной величины (независимой переменной ) всегда влечет изменение другой переменной (зависимой величины). Например, и т.д.

Наряду с функциональной зависимостью существует и другой вид зависимости, когда изменение одной переменной не всегда влечет изменение другой переменной, т.к. на результат влияет множество факторов, ряд которых являются случайными. Поэтому, зависимость между переменными будет проявляться не в каждом отдельном случае, а лишь в массе случаев, т.е. среднее изменение независимой величины будет вызывать среднее изменение зависимой величины.

Подобные связи являются вероятностными (стохастическими)связями. Частным случаем стохастической связи является корреляционная связь.1

Корреляционная связь – связь. проявляющаяся не в каждом отдельном случае, а в массе случаев, когда среднее изменение одной величины влечет изменение среднего значения другой величины, т.е. изменение средних проявляется в форме тенденции.

При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обуславливающих изменение других признаков. Признаки этой группы будем называть признаками факторами (факторными признаками); признаки, которые являются результатом влияния этих факторов, будем называть результативными.

Основная цель изучения корреляционной зависимости- это прогнозирование величины результативного признака, как следствие изменения факторного признака; выявление факторов, оказывающих наибольшее влияние на результативный показатель.

Если при росте факторного признака растет результативный признак, то считается, что связь прямая. В случае, когда при росте факторного признака уменьшается величина результативного признака, то считается, что связь обратная (рост фондовооруженности вызывает рост производительности труда- связь прямая; рост возраста основных фондов снижает производительность труда- связь обратная).

Математически корреляционная зависимость в общем виде записывается в виде уравнения: , где у- результативный показатель;

х – факторный показатель.

При изучении связи между одним факторным признаком и результативным- связь парная:

; Например, х- возраст оборудования , у- затраты на ремонт оборудования.

При изучении влияния нескольких факторов на результативный показатель, связь называется множественной корреляцией (зависимостью).

Например: где у- затраты на ремонт оборудования;

-возраст оборудования; - степень его использования; - квалификация рабочих станочников.

Если в прямоугольной системе координат графически изобразить корреляционную связь, то она может носить линейный или криволинейный характер.

При линейной связи она выражается уравнением прямой - ; при криволинейной зависимости она может выражаться уравнением гиперболы - ; параболы - ; степенной функцией- .

При изучении корреляционной связи необходимо соблюдать определенные условия.

1)Применению статистических методов исследования должен предшествовать качественный анализ. Качественный анализ должен ответить, по крайней мере, на два вопроса: а) могут ли быть два анализируемых явления находиться между собой во взаимосвязи; б) какое из этих явлений является независимым (фактор –х), а какое результативным (зависимым-у).

2) Необходимо иметь достаточно большое число наблюдений (не менее 50). Объем совокупности должен быть больше в 6-8 раз числа факторов.

3) Включаемые в исследование факторы, должны быть независимы друг от друга. При этом необходимо полностью исключить факторы функционально связанные с результативным признаком.

4) Исследуемая совокупность должна быть однородна и подчинятся закону нормального распределения (фактор х- должен подчинятся закону нормального распределения).

Качественная однородность предполагает близость условий формирования результативных и факторных признаков (однородность предприятий по виду продукции, применяемой технологии и т.д.).

Количественная однородность заключается в отсутствии единиц наблюдения, которые по своим числовым характеристикам существенно отличаются от основной массы данных. Для оценки однородности совокупности используется коэффициент вариации по факторным признакам:

Совокупность считается однородной, если коэффициент вариации не превышает 33%.

Проверка нормальности распределения, исследуемых факторных признаков ( ), проводится с помощью правила «трех сигм». Т.е. исключаются все единицы, у которых уровень признака не попадает в интервал и формируется новый массив для последующего анализа.

Статистические методы выявления наличия связи

между двумя признаками

Для выявления наличия корреляционной связи используется ряд методов.

  1. Простейший метод выявления связи является метод параллельных сопоставлений. Суть метода заключается в том, что признак фактор располагается в порядке возрастания, а против каждого признака фактора записывается соответствующий ему признак результат. Затем прослеживается направление изменения величины результативного признака.

Пример. По 12 предприятиям имеются месячные данные об объеме произведенной продукции (ее стоимости) и объеме накладных расходов (накладные расходы – расходы на хозяйственное обслуживание производства и управления предприятием, являются дополнительными расходами и включаются в издержки производства).

Табл.1

№ предприятия

1

2

3

4

5

6

Произведенная продукция, млн. руб.-Х

1,54

1,6

1,63

1,73

1,75

1,8

Накладные расходы, тыс. руб.-У

86

91

93

90

97

102

Продолжение таблицы 1

№ предприятия

7

8

9

10

11

12

Произведенная продукция, млн. руб.-Х

1,8

1,8

1,9

1,9

2,0

2,0

Накладные расходы, тыс. руб.-У

98

105

107

108

109

109

Признак фактор –Х был записан в порядке возрастания и против него был записан соответствующий признак результат.

По данным таблицы наблюдаем: при возрастании признака фактора –Х в большинстве случаев растет признак результат-У, т.е. можно предположить наличие прямой корреляционной связи.

При большем числе единиц, составляющих изучаемую совокупность, целесообразнее использовать для установления факта наличия связи корреляционные или групповые таблицы.

Построение корреляционной таблицы начинается с группировки факторного и результативного признаков. Для этого определяют шаг интервала для признаков «Х» и «У» по формуле Стерджесса.

В корреляционной таблице факторный признак-«Х», как правило, располагается в строках, а результативный признак –«У» - в столбцах.

Для построения таблицы используем данные предыдущего примера.

Центр интервала-

88,5

93,5

98,5

103,5

108,5

х/у

86-91

91-96

96-101

101-106

106-111

1,54-1,64

1(1)

2,3(2)

3

91,83

1,64-1,74

4(1)

1

88,5

1,74-1,84

5,7(2)

6,8(2

4

101,0

1,84-1,94

9,10(2)

2

108,5

1,94-2,04

11,12(2)

2

108,5

2

2

2

2

4

12

Числа, расположенные на пересечение строк и столбцов таблицы, означают частоту повторения данного сочетания значений «У» и «Х».

Если частоты расположились по диагонали из левого верхнего угла в правый нижний, следовательно можно предположить, что существует прямая зависимость, если же частоты расположились из правого верхнего угла в левый нижний угол, то существует обратная зависимость.

Возможен вариант, когда все клетки таблицы окажутся заполненными. Это еще не означает отсутствие связи между признаками. Необходимо установить, как расположена в таблице основная масса частот и по ним судить о наличии и характере связи, или ее отсутствии.

Средние значения результативного признака представлены в последней графе. Тенденция их роста также может свидетельствовать о наличии прямой связи.

Следующим способом обнаружения связи является построение групповой таблицы. В этом случае осуществляется группировка по признаку фактору, и по каждой группе вычисляют среднее значение результативного признака.

Стоимость выпущенной продукции, млн. руб.-Х

Число предприятий в группе, n

Общая сумма накладных расходов для данной группы, тыс. руб.

Средняя величина накладных расходов на одно предприятие –

1,54-1,64

3

270,0

90,0

1,64-1,74

1

90,0

90,0

1,74-1,84

4

402,0

100,5

1,84-1,94

2

215,0

107,5

1,94-2,04

2

218

109,0

Итого

12

В данных этой таблицы все случайные значения признака «У» взаимно погасились и ясно выступает зависимость результативного признака от признака фактора, положенного в основу группировки. В нашем случае это стоимость выпущенной продукции.

На основе данных групповой таблицы строится графическое изображение связи – линия связи (эмпирическая линия регрессии). Она показывает направление связи (прямая или обратная связь) и характер связи (линейная или криволинейная связь).

Эмпирическая линия регрессии приближается к прямой линии. Следовательно можно считать наличие прямолинейной связи.

Существует еще один графический метод для определения наличия связи. Он заключается в том, что на основе первичных данных в прямоугольной системе координат наносятся точки, отражающие значение результативного признака. Если большинство точек можно заключить в условный овал («облако точек»), который располагается в направлении из нижнего левого угла в правый верхний, делается вывод о наличии прямой связи. Если же овал располагается в направлении из правого верхнего угла в левый нижний угол, то делается вывод о наличии обратной связи.