- •1. Понятие о функциональной и корреляционной связи
- •2. Корреляционно-регрессионный анализ
- •3. Регрессионный анализ
- •1. Понятие о функциональной и корреляционной связи
- •1.1. Требования к статистической информации, исследуемой методами корреляционно-регрессионного анализа
- •1.2. Линейная и нелинейная связи
- •2. Корреляционно-регрессионный анализ
- •2.1. Парные (линейные) коэффициенты корреляции
- •Шкала оценок парных коэффициентов корреляции
- •2.2. Оценка существенности связи
- •2.3. Определение множественного коэффициента корреляции
- •3. Регрессионный анализ
- •3.1. Общие принципы построения регрессионных уравнений
- •3.2. Построение парного линейного уравнения
- •Стоимость основных фондов и выпуск продукции по группе заводов
- •Расчет параметров уравнения регрессии
- •4,72 А0 10,8 0,422, откуда а0 0,16.
- •Расчет линейного коэффициента корреляции
- •3.3. Построение множественного уравнения регрессии
- •Расчет параметров уравнения множественной регрессии
- •Расчет коэффициента множественной корреляции
2.3. Определение множественного коэффициента корреляции
Следующий этап корреляционного анализа связан с расчетом множественного (совокупного) коэффициента корреляции.
Множественный коэффициент корреляции характеризует тесноту линейной связи между одной переменной и совокупностью других переменных, рассматриваемых в корреляционном анализе.
Если изучается связь между результативным признаком y и лишь двумя факторными признаками х1 и х2, то для вычисления множественного коэффициента корреляции можно использовать следующую формулу, компонентами которой являются парные коэффициенты корреляции:
где r парные коэффициенты корреляции.
3. Регрессионный анализ
3.1. Общие принципы построения регрессионных уравнений
На рисунке 2 приведены примеры корреляционного поля и формы связи, образованные скоплениями точек. Точки группируются возле некоторой линии, если связь показателей линейна, или кривой, если связь нелинейна. Эти линии называются линиями регрессии, а описывающие их аналитические выражения уравнениями регрессии (рис. 2).
Рис. 2. Формы связи: а линейная связь; б параболическая связь; в гиперболическая связь; г нет связи (если две переменные практические не связаны между собой, то моделью будет являться горизонтальная прямая)
Зная уравнение регрессии, можно приближенно оценить значение зависимой переменной Y при определенном значении Х. Причем точность такой оценки будет тем выше, чем теснее группируются точки фактических наблюдений относительно линии регрессии, т. е. точность модели регрессии определяется тем, насколько тесной является взаимозависимость признаков Х и Y.
Регрессионный анализ это статистический метод исследования зависимости случайной величины Y от переменных Хj.
При построении парной регрессии (с одной факторной переменной) обычно используются следующие функции:
1) линейная
2) степенная
3) показательная
4) параболическая
5) гиперболическая
6) логарифмическая
где а0 свободный коэффициент уравнения регрессии;
а1 параметр уравнения регрессии.
Однако в действительности любой результативный показатель испытывает воздействие не одного, как в случае парной корреляции, а нескольких факторов, поэтому зачастую строят модели множественной регрессии, которые принимают вид:
1) линейная:
(наиболее часто встречающаяся модель);
2) степенная:
3) показательная:
4) параболическая:
5) гиперболическая:
где а0 свободный коэффициент регрессии;
аj (j 1, 2, …, k) параметры регрессионного уравнения, называемые коэффициентами регрессии.
Для того чтобы правильно выбрать тип регрессионного уравнения, следует знать условный закон распределения зависимой переменной Y. На основе графика не всегда удается определить его однозначно, поэтому строят несколько регрессионных моделей, а затем по определенным критериям определяют лучшую модель. Если в проводимом исследовании можно ограничиться построением линейной модели, выбирают ее. Такая популярность и предпочтительность объясняется очень просто: математический аппарат линейных уравнений наиболее разработан, а сами модели легко интерпретируемы.
Критерием нахождения значений коэффициентов регрессии аj является следующее требование: сумма квадратов отклонений наблюдаемых «игреков» от «игреков», рассчитанных по уравнению регрессии, должна быть минимальной. Параметры регрессионной модели должны быть такими, чтобы на графике корреляционного поля линия регрессии оказалась там, где точки фактических наблюдений наибольшим образом сконцентрированы, т. е. проходила бы на минимальном удалении от них. В виде формулы это требование записывается следующим образом:
Метод нахождения значений коэффициентов регрессии по приведенному критерию называется методом наименьших квадратов (МНК).