- •Корреляционно-регрессионный анализ
- •1. Виды зависимостей
- •2. Определение формы парной корреляционной зависимости
- •3. Регрессионный анализ в парной линейной зависимости
- •4. Корреляционный анализ в парной линейной зависимости
- •5. Простейшие случаи парной нелинейной корреляционной зависимости. Выборочное корреляционное отношение. Его свойства
2. Определение формы парной корреляционной зависимости
С помощью корреляционного анализа изучается теснота взаимосвязи между признаками. Регрессионный анализ позволяет приближенно представить корреляционную зависимость между признаками в виде некоторого уравнения, называемого уравнением регрессии.
Пусть
Х
и У
- признаки, связанные между собой
корреляционной зависимостью, которая
может быть линейной, гиперболической,
параболической или какой-то другой.
Поэтому необходимо предварительно
выяснить форму корреляционной зависимости.
Данные задачи можно решить графически.
Для этого строятся точки с координатами
(хi,
),
если данные сгруппированы в корреляционную
таблицу, или (хi,
уi),
если данные не сгруппированы. По
расположению построенных точек
подбирается линия (прямая, гипербола,
парабола), уравнение которой известно
(рис. 1, 2, 3).

Рис. 1

Рис. 2

Рис. 3
Так,
расположение точек на рис. 1 позволяет
сделать вывод, что зависимость между
признаками линейная, уравнение прямой
у=а0+а1х
принимается за уравнение регрессии. По
рис. 2, 3 делаем вывод, что за уравнение
регрессии следует принимать, соответственно,
уравнение гиперболы
и уравнение параболыу=а0+а1х+а2х2.
Далее
необходимо найти неизвестные числа а0,
а1,
а2,
называемые параметрами
уравнений регрессии.
Их определяют, например, методом
наименьших квадратов,
сущность которого заключается в
следующем: находятся такие параметры
уравнения регрессии, чтобы была
минимальной сумма квадратов отклонений
эмпирических значений признака У
от теоретических, вычисленных по
уравнению регрессии, то есть
.
3. Регрессионный анализ в парной линейной зависимости
Пусть даны признаки Х и У, которыми обладают элементы генеральной совокупности. Предполагаем, что они имеют совместное нормальное распределение. Чтобы изучить взаимосвязь между признаками, проведем выборку объемом n из двухмерной генеральной совокупности. В результате получим эмпирические данные:
|
хi |
х1 |
х2 |
... |
хn |
|
|
yi |
y1 |
y2 |
... |
yn |
. |
Построим точки с координатами (хi, уi), или корреляционное поле (рис. 4). Пусть по расположению построенных точек видно, что зависимость между X и Y близка к линейной: у=а0+а1х. Построим график этой зависимости.

Рис. 4
Эмпирические
значения
соответствуют ординатам точек
корреляционного поля на рис. 4; теоретические
(расчетные) значения признакаУ
найдены по уравнению
и соответствуют ординатам точек с
абсциссами
хi,
лежащих на прямой. На рис. 4 также показаны
отклонения
эмпирических значений признака
от расчетных
.
Обобщаемым показателем рассеяния
эмпирических точек вокруг прямой будет
сумма квадратов отклонений
,
то есть
.
Чем
меньше величина S,
тем лучше прямая
"подогнана" к точкам (хi,
уi)
корреляционного поля.
Необходимым
условием существования минимума функции
является равенство нулю одновременно
всех ее частных производных.
Воспользуемся этим условием и получим следующую систему уравнений:
или

Преобразуем эту систему:

Полученную систему еще можно упростить, поделив обе части каждого уравнения на n. Система примет следующий вид:

Эту систему называют системой нормальных уравнений. Система нормальных уравнений состоит из двух линейных уравнений с двумя неизвестными а0, а1.
Решая эту систему, например, методом Крамера, находим а0, а1.
,
,
Коэффициент а1 называют коэффициентом регрессии у на х.
Коэффициенты а0, а1, вычисленные из системы нормальных уравнений, являются оценками истинных значений параметров регрессии.
Полученное
уравнение регрессии
называют эмпирическим уравнением
регрессии. Преобразуем его. Подставим
в это уравнение значение
из первого уравнения системы нормальных
уравнений:
или
![]()
Уравнение регрессии в этой форме часто применяется на практике. Из данного уравнения мы можем выявить экономический смысл параметра а1, который показывает, как изменяется в среднем результативный признак У, если факторный признак Х увеличится на единицу своего измерения.
Таким образом, по уравнению регрессии мы можем выяснить, как изменяется в среднем результативный признак (У) с изменением факторного признака (Х). Кроме того, уравнение регрессии приближенно выражает в виде функции корреляционную зависимость между признаками, и по нему можно прогнозировать значения результативного признака.
