Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика. 1 часть.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
354.82 Кб
Скачать

22. Множественная регрессия

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии требуется определить аналитическое выражение связи между результативным признаков (Y) и множеством факторных признаков (x1, x2, x3,…xn).

Построение моделей множественной регрессии включает несколько этапов:

- выбор формы связи (уравнения регрессии);

- отбор факторных признаков;

- обеспечение достаточного объема совокупности для получения реальных оценок.

Практика построения многофакторных моделей показывает, что все реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:

- линейная;

- степенная;

- показательная;

- параболическая;

- гиперболическая.

Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности.

Немаловажное значение имеет процедура отбора факторов в уравнение. Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия. Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости.

Если при включении нового фактора в модель, коэффициенты регрессии меняют не только свои значения, но и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак признается нецелесообразным для включения в модель связи.

Сложность и взаимно переплетение отдельных факторов, обуславливающих исследуемое экономическое явление, могу проявляться в так называемой мультиколлинеарности. Под мультиколлинеарностью понимается тесная зависимость между факторными признаками, включенными в модель. Одним из индикаторов определения мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8.

При наличии линейной связи между результативным и несколькими факторными признака, а также между парой факторных признаков определяется множественный коэффициент корреляции:

Множественный коэффициент корреляции изменяется в пределах от 0 до 1. Чем ближе R к единице свидетельствует о сильной зависимости между признаками.

23. Анализ качества регрессионной модели

Оценками качества регрессии является коэффициент корреляции и коэффициент детерминации. В качестве меры точности модели используются стандартная ошибка оценки, обозначается знаком - סּ (ст) или (Sст).

סּ (ст) = √.S2 ост. : (n-k -1) = ∑(Уi – Уср.)2 : (n – k -1)

C помощью статистических критериев Стьюдента и Фишера можно проверить статистическую значимость как отдельных коэффициентов регрессии так и управления в целом. Проверка значимости коэффициента значимости вj проверяется с помощью критерия Стьюдента 1) Н : вj=0 2) tj = вj : вj , где Н –гипотеза, вj -коэффициент

Находится критические значения t- критерия по таблице распределения Стьюдента при заданном уровне значимости גּ и числе степеней свободы n-k-1 . t גּ (n-k-1)

Если tj <tגּ , то гипотеза Н отвергается и коэффициент вj признается статистически значимым. Гипотеза принимается, соответствующий фактор хj исключается из уравнения.

Статистическая значимость уравнения в целом проверяется с помощью критерия Фишера:

Н: в1= в2=…..=вk=0

Р= S2регр /K Fגּ ( K; n-k-1) . Если F больше Fגּ, то гипотеза отвергается и

S2ост/(n-k-1) уравнение признается значимым. В противном случае уравнение необходимо корректировать. Все эти формулы применимы для парной линейной регрессии при k=1 . Очевидно величина F связана с коэффициентом детерминации R2. Действительно, можно показать, что

P= R2/K

(1-R2)/(n-k-1)

Поэтому задачу проверки значимости уравнения регрессии можно рассматривать как задачу проверки значимости коэффициента детерминации.

Измерение связи качественных признаков:

Корреляционно-регрессионный анализ очевидно применим только к количественным признакам, т.к. требует вычисления оценок характеристик распределения. Для оценки связи качественных признаков используют ранги значений признаков (порядковые номера) если признаки можно ранжировать, либо частоты распределений f. Признаки которые можно ранжировать упорядочиваются по значениям или градациям. При ранжировании в каждой единице совокупности присваивается порядковый номер – ранг. В частности для определения связи. Для определения связи таких признаков применяют ранговые коэффициенты корреляции.