- •Корреляционно-регрессионный анализ
- •1. Виды зависимостей
- •2. Определение формы парной корреляционной зависимости
- •3. Регрессионный анализ в парной линейной зависимости
- •4. Корреляционный анализ в парной линейной зависимости
- •5. Простейшие случаи парной нелинейной корреляционной зависимости. Выборочное корреляционное отношение. Его свойства
Корреляционно-регрессионный анализ
1. Виды зависимостей
Признаки, которыми обладают элементы совокупности, существуют неизолированно, они взаимосвязаны между собой. Так, производительность труда на предприятиях зависит от уровня механизации и электрификации производства, стажа и квалификации рабочих и ряда других признаков (факторов). Например, урожайность зерновых зависит от количества внесенных удобрений, срока посева, различных погодно-климатических факторов.
Зависимость между признаками будет функциональной, если каждому значению одного признака соответствует вполне определенное значение другого признака. Подобная зависимость в основном встречается в естественных науках. В экономических же науках между признаками существует статистическая зависимость, при которой каждому значению одного признака соответствует целый ряд распределения другого признака. Так, при одной и той же электровооруженности производительность труда рабочих на различных предприятиях одной отрасли будет разной. Это можно объяснить тем, что производительность труда зависит не только от электровооруженности, но и от ряда других факторов, которые в данный момент не учитываются.
Зависимую переменную принято называть результативным признаком (фактором) и обозначать У. Признаки (факторы), влияющие на результативный признак У, называют факторными признаками и обозначают Х1, Х2, ..., Хn.
Статистическая зависимость между двумя признаками Х и У называется парной. Она задается следующей таблицей:
xi |
х1 |
х2 |
... |
хn |
|
yi |
y1 |
y2 |
... |
yn |
, |
если данные наблюдений не сгруппированы, или корреляционной таблицей:
У \ Х |
х1 |
х2 |
... |
|
... |
|
|
|
|
|
|
... |
|
... |
|
|
|
|
|
|
... |
|
... |
|
|
|
... |
... |
... |
... |
... |
... |
... |
... |
|
|
|
|
... |
|
... |
|
|
|
... |
... |
... |
... |
... |
... |
... |
... |
|
|
|
|
... |
|
... |
|
|
|
|
|
|
... |
|
... |
|
n |
, |
если данные сгруппированы,
.
Частота показывает, сколько раз встречается пара во всех наблюдениях.
В корреляционной таблице наглядно видны ряды распределения одного признака, соответствующие каждому значению другого признака, которые называются условными распределениями. Так, значению х1 признака Х соответствует следующий ряд распределения признака У:
y1 |
y2 |
... |
yi |
... |
ys |
|
|
|
... |
|
... |
|
, |
значению хj:
y1 |
y2 |
... |
yi |
... |
ys |
|
|
|
... |
|
... |
|
. |
Аналогично для признака У значению уi соответствует следующий ряд распределения признака Х:
х1 |
х2 |
... |
хj |
... |
хk |
|
|
|
... |
|
... |
|
. |
По каждому условному ряду распределения можно найти среднюю величину, называемую условной средней и вычисляемую по формуле . В результате получим соответствие между значениями одного признака и условными средними другого признака, то есть:
xj |
х1 |
х2 |
... |
хk |
|
|
|
|
... |
|
. |
Если каждому значению одного признака соответствует вполне определенная условная средняя другого признака, то есть между значениями одного признака и условными средними другого признака наблюдается функциональная связь, то зависимость между этими признаками будем называть корреляционной.
Если с увеличением признака Х условная средняя признака У растет, то корреляционная зависимость называется положительной (прямой). Корреляционная зависимость будет отрицательной (обратной), если с ростом признака Х условная средняя признака У убывает. Если же условная средняя не изменяется, то корреляционная зависимость между признаками отсутствует.
Пример 1. Данные о себестоимости единицы продукции (р.) и производительности труда (тыс. шт.) 50 предприятий представлены в виде следующей корреляционной таблицы:
Себестоимость единицы продукции |
Производительность труда |
|||||
11 |
13 |
15 |
17 |
19 |
Итого |
|
7 9 11 13 15 |
3 2 |
2 5 5 3 |
1 3 7 5 |
2 4 4 1 |
2 1 |
5 10 16 14 5 |
Итого |
5 |
15 |
16 |
11 |
3 |
50 |
Определить, существует ли между этими признаками корреляционная зависимость.
Решение. Пусть признак У - себестоимость единицы продукции, р.; Х - месячная производительность труда, тыс. шт. В этой таблице наглядно представлены условные распределения каждой случайной величины. Так, для х1 = 11 условное распределение признака У имеет следующий вид:
yi |
13 |
15 |
|
|
3 |
2 |
, |
для у4=13:
хj |
11 |
13 |
15 |
17 |
|
|
3 |
5 |
5 |
1 |
. |
Найдем условные средние признака У для каждого значения признака Х.
Результаты вычислений представим в виде таблицы:
хj |
11 |
13 |
15 |
17 |
19 |
|
|
13,8 |
12,2 |
11 |
9,73 |
7,67 |
. |
Итак, себестоимость единицы продукции (У) и производительность труда (Х) связаны между собой корреляционной зависимостью.