- •Ргр2 Корреляционно-регрессионный анализ
- •1. Исследование парной корреляции
- •1.1. Определяется характер связи
- •1.2. Оценка связи между количественными признаками
- •А) Расчет линейного коэффициента корреляции выполняется следующим образом:
- •Б) Оценка значимости коэффициента корреляции по t-критерию Стьюдента:
- •В) Расчет коэффициента детерминации
- •2. Формирование модели парной регрессии
- •2.1 Исследование графически зависимости двух признаков
- •2.2. Расчет параметров уравнения
- •2.3. Оценка коэффициентов уравнения регрессии
- •2.4. Расчет характеристик модели
- •3. Формирование модели множественной регрессии
- •3.1. Отбор значимых факторов
- •3.2. Анализ и способы снижения мультиколлинеарности факторов
- •3.3. Проверка коэффициентов регрессии на статистическую значимость.
- •3.4. Анализ точек исходной совокупности на аномальность
- •3.5. Оценка влияния факторных признаков на результативный признак
- •Оценка адекватности модели множественной регрессии
- •3.7. Проверка выполнения предпосылок множественного регрессионного анализа
Б) Оценка значимости коэффициента корреляции по t-критерию Стьюдента:
,где (n-2) – число степеней свободы при заданном уровне значимости α и объема выборки n.
Полученное значение tрасч сравнивают с табличным значением tтабл. Если tрасч > tтабл, то используемый фактор считается значимым, а связь между x и y – существенной. Для заданных α и n найдем tтабл. Выразим из последней формулы r , и найдем предельное значение r` подставив tтабл и n.
Сравнивая поученное значение коэффициента корреляции – r и предельное значение коэффициента корреляции – r’ делаем вывод о значимости рассчитанного r.
Пример:
Найдем tтабл для α = 0,05 и числа степеней свободы (n-2) равного 5: tтабл = 2,5706.
В
данном примере получили
,
следовательно, коэффициент корреляции
r
является значимым.
В) Расчет коэффициента детерминации
Коэффициент детерминации часто более предпочтителен для измерения связи, так как он может быть использован для измерения не только линейных, но и нелинейных связей. Коэффициент детерминации может быть выражен в процентах.
Коэффициент детерминации принимает значения в интервале [0,1]. Чем ближе значение к 1, теле теснее связь, и наоборот.
В рассматриваемом примере г2=0,9853 или, иначе говоря, на 98,53% изменение цены данного товара зависит от изменения дальности его транспортировки.
2. Формирование модели парной регрессии
Парная регрессия характеризует связь между двумя признаками: результативным и факторным.
Порядок формирования модели парной регрессии следующий:
- исследуется графически зависимость двух признаков.
- осуществляется оценка параметров модели регрессии.
- производится проверка полученной модели парной регрессии на адекватность.
2.1 Исследование графически зависимости двух признаков
Для определения формы связи между рассматриваемыми признаками используют графический метод. На график наносят точки, соответствующие значениям х и у. получают корреляционное поле, а соединив их отрезками - ломаную регрессию.
По характеру ломаной выбирается возможное аналитическое уравнение регрессии, описывающее взаимосвязь между точками - прямой, параболы, гиперболы и т.д .
Пример.
Построить уравнение регрессии зависимости производительности труда у от стажа работы х по данным таблицы 5 (10 рабочих одной бригады заняты производством радиоэлектронных изделий, данные ранжированы по стажу их работы).
Исходя из экономических соображений, стаж работы выбран в качестве независимой переменной х. Сопоставление данных параллельных рядов признаков х и у (табл.4) показывает, что с возрастанием признака х (стаж работы) растет, хотя и не всегда, результативный признак у (производительность труда). Следовательно, между х и у существует прямая зависимость, пусть неполная, но ярко выраженная.
Таблица 4.
Распределение рабочих бригады по выработке и стажу работы.
Исходные данные |
Расчетные значения |
||||||
№ Рабочего |
|
|
|
|
|
|
|
4-й |
1 |
4 |
-4,5 |
20,25 |
-3,3 |
14,85 |
4,6 |
6-й |
2 |
5 |
-3,5 |
12,25 |
-2,3 |
8,05 |
5,2 |
3-й |
3 |
6 |
-2,5 |
6,25 |
-1,3 |
3,25 |
5,8 |
1-й |
4 |
7 |
-1,5 |
2,25 |
-0,3 |
0,45 |
6,4 |
2-й |
5 |
7 |
-0,5 |
0,25 |
-0,3 |
0,15 |
7,0 |
7-й |
6 |
8 |
0,5 |
0,25 |
0,7 |
0,35 |
7,6 |
9-й |
7 |
8 |
1,5 |
2,25 |
0,7 |
1,05 |
8,2 |
10-й |
8 |
9 |
2,5 |
6,25 |
1,7 |
4,25 |
8,8 |
8-й |
9 |
10 |
3,5 |
12,25 |
2,7 |
9,45 |
9,4 |
5-й |
10 |
9 |
4,5 |
20,25 |
1,7 |
7,65 |
10,0 |
Итого |
|
|
|
82,5 |
|
49,5 |
|
Для уточнения формы связи между рассматриваемыми признаками используем графический метод (рис.2).
Рис.2. Зависимость выработки одного рабочего у от стажа работы х. (по данным табл.4).
Анализируя ломаную линию, можно предположить, что возрастание выработки у идет равномерно, пропорционально росту стажа рабочих х. В основе этой зависимости в данных конкретных условиях лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:
,где
- теоретические расчетные значения результативного признака ( выработки одного рабочего, шт.), полученные по уравнению регрессии;
- неизвестные
параметры уравнения регрессии;
- стаж рабочих,
годы.
