Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
41
Добавлен:
11.12.2015
Размер:
1.19 Mб
Скачать

2. Определение формы парной корреляционной зависимости

С помощью корреляционного анализа изучается теснота взаимосвязи между признаками. Регрессионный анализ позволяет приближенно представить корреляционную зависимость между признаками в виде некоторого уравнения, называемого уравнением регрессии.

Пусть Х и У - признаки, связанные между собой корреляционной зависимостью, которая может быть линейной, гиперболической, параболической или какой-то другой. Поэтому необходимо предварительно выяснить форму корреляционной зависимости. Данные задачи можно решить графически. Для этого строятся точки с координатами (хi, ), если данные сгруппированы в корреляционную таблицу, или (хi, уi), если данные не сгруппированы. По расположению построенных точек подбирается линия (прямая, гипербола, парабола), уравнение которой известно (рис. 1, 2, 3).

Рис. 1

Рис. 2

Рис. 3

Так, расположение точек на рис. 1 позволяет сделать вывод, что зависимость между признаками линейная, уравнение прямой у=а01х принимается за уравнение регрессии. По рис. 2, 3 делаем вывод, что за уравнение регрессии следует принимать, соответственно, уравнение гиперболы и уравнение параболыу=а01х+а2х2.

Далее необходимо найти неизвестные числа а0, а1, а2, называемые параметрами уравнений регрессии. Их определяют, например, методом наименьших квадратов, сущность которого заключается в следующем: находятся такие параметры уравнения регрессии, чтобы была минимальной сумма квадратов отклонений эмпирических значений признака У от теоретических, вычисленных по уравнению регрессии, то есть .

3. Регрессионный анализ в парной линейной зависимости

Пусть даны признаки Х и У, которыми обладают элементы генеральной совокупности. Предполагаем, что они имеют совместное нормальное распределение. Чтобы изучить взаимосвязь между признаками, проведем выборку объемом n из двухмерной генеральной совокупности. В результате получим эмпирические данные:

хi

х1

х2

...

хn

yi

y1

y2

...

yn

.

Построим точки с координатами (хi, уi), или корреляционное поле (рис. 4). Пусть по расположению построенных точек видно, что зависимость между X и Y близка к линейной: у=а01х. Построим график этой зависимости.

Рис. 4

Эмпирические значения соответствуют ординатам точек корреляционного поля на рис. 4; теоретические (расчетные) значения признакаУ найдены по уравнению и соответствуют ординатам точек с абсциссами хi, лежащих на прямой. На рис. 4 также показаны отклонения эмпирических значений признакаот расчетных. Обобщаемым показателем рассеяния эмпирических точек вокруг прямой будет сумма квадратов отклонений, то есть

.

Чем меньше величина S, тем лучше прямая "подогнана" к точкам (хi, уi) корреляционного поля.

Необходимым условием существования минимума функции является равенство нулю одновременно всех ее частных производных.

Воспользуемся этим условием и получим следующую систему уравнений:

или

Преобразуем эту систему:

Полученную систему еще можно упростить, поделив обе части каждого уравнения на n. Система примет следующий вид:

Эту систему называют системой нормальных уравнений. Система нормальных уравнений состоит из двух линейных уравнений с двумя неизвестными а0, а1.

Решая эту систему, например, методом Крамера, находим а0, а1.

, ,

Коэффициент а1 называют коэффициентом регрессии у на х.

Коэффициенты а0, а1, вычисленные из системы нормальных уравнений, являются оценками истинных значений параметров регрессии.

Полученное уравнение регрессии называют эмпирическим уравнением регрессии. Преобразуем его. Подставим в это уравнение значениеиз первого уравнения системы нормальных уравнений:

или

Уравнение регрессии в этой форме часто применяется на практике. Из данного уравнения мы можем выявить экономический смысл параметра а1, который показывает, как изменяется в среднем результативный признак У, если факторный признак Х увеличится на единицу своего измерения.

Таким образом, по уравнению регрессии мы можем выяснить, как изменяется в среднем результативный признак (У) с изменением факторного признака (Х). Кроме того, уравнение регрессии приближенно выражает в виде функции корреляционную зависимость между признаками, и по нему можно прогнозировать значения результативного признака.