Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1 Конспект лекций для ЗО (1).doc
Скачиваний:
26
Добавлен:
25.11.2018
Размер:
3.89 Mб
Скачать

Вопрос 3. Регрессионный анализ связи

После того, как корреляционный анализ закончен и связь между признаками выявлена, следует определить форму, и главное, – уравнение связи между признаками, т.е. построить теоретическую линию регрессии.

Теоретической линией регрессии называется та линия, вокруг которой группируются точки корреляционного поля и которая указывает основное направление, основную тенденцию связи.

Исходными данными регрессионного анализа выступают негруппированные данные, ранжированные по признаку-фактору.

Основные этапы однофакторного регрессионного анализа:

1 Этап. Теоретическое обоснование регрессионной модели

На этом этапе осуществляется выбор:

- факторного признака (возможно, в ходе корреляционного анализа были выявлены несколько факторов, оказывающих существенное влияние на результативный признак. Для построения регрессионной модели следует отобрать наиболее значимый их них);

- формы уравнения регрессии. Наглядное представление о форме линии регрессии может дать график эмпирической линии регрессии.

Связь между факторным и результативным признаком по форме может описываться линейной и криволинейной зависимостью. Наиболее часто для характеристики связей экономических показателей используются следующие типы функций:

линейная

параболическая

гиперболическая

показательная

степенная

логарифмическая

2 Этап. Расчет параметров уравнения регрессии

После того, как форма уравнения регрессии определена, приступают к расчету его параметров. Для этого используется прием аналитического выравнивания результативного ряда по уравнению выбранной кривой.

Выравнивание по прямой

Найти теоретическое уравнение связи, значит, определить параметры прямой. Эти параметры находят методом наименьших квадратов, который дает следующую систему нормальных уравнений:

, (8.3)

где n – численность совокупности.

Решив систему уравнений, получим значения и .

Параметр при имеет большое практическое значение и носит название коэффициента регрессии. Коэффициент регрессии показывает, на сколько в среднем единиц измерения изменяется величина у при изменении факторного признака х на одну единицу измерения. При наличии прямой корреляционной связи коэффициент регрессии имеет положительное значение, при обратной – отрицательное. Коэффициент регрессии применяют для определения коэффициента эластичности.

Коэффициент эластичности при линейной связи показывает, на сколько процентов изменится величина результативного признака у при изменении факторного признака х на 1%:

. (8.4)

На основании уравнения регрессии могут быть вычислены теоретические (выровненные) значения для любых значений .

Рассеяние точек корреляционного поля бывает очень большим, и вычисленное уравнение регрессии может давать большую погрешность в оценке анализируемого показателя. Для всей совокупности наблюдаемых значений рассчитывается средняя квадратическая ошибка уравнения регрессии (), которая представляет собой среднее квадратическое отклонение фактических значений относительно теоретических значений , рассчитанных по уравнению регрессии:

, (8.5)

где s – число параметров уравнения регрессии (для уравнения прямой s=2).

Оценить величину средней квадратической ошибки можно сопоставив ее:

а) со средним значением результативного признака (): если , то использование данного уравнения регрессии является целесообразным;

б) со средним квадратическим отклонением признака: если у, то использование данного уравнения регрессии является целесообразным.

Отдельно оцениваются средние квадратические ошибки параметров уравнения регрессии:

, , (8.6)

где  – средние квадратические ошибки коэффициентов регрессии и ;

х – среднее квадратическое отклонение значений признака х.

Фактические данные и выровненные значения, полученные на основании уравнения регрессии, наносятся на график. Кроме того, в этих же координатных осях помещается линия среднего значения результативного признака. Итак, среди аналитических линий связи между признаками различают линии трех типов:

- ломаная эмпирическая линия регрессии фактических значений признака уi – наглядно отражает изменение результативного признака под влиянием всех без исключения факторных признаков;

- эмпирическая линия регрессии теоретических значений признака (в нашем случае восходящая прямая) отражает изменение фактических значений признака при учете влияния только фактора х (переменная средняя линия);

- прямая горизонтальная линия – линия среднего значения результативного признака, которая наглядно отражает отсутствие влияния на у всех без исключения факторов (постоянная средняя линия).

Степень отличия переменной средней от постоянной средней говорит о силе влияния фактора х на результативный признак y.

Тот факт, что линия не совпадает с линией уi, говорит о том, что связь между у и х не полная, не функциональная.

Следовательно, чтобы измерить тесноту связи, т.е. измерить, насколько она близка к функциональной, нужно определить дисперсию, измеряющую отклонения уi от ух и характеризующую остаточную вариацию, обусловленную прочими факторами.