Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
otchet_po_2_rabote_1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
178.63 Кб
Скачать

3. Проверка наличия мультиколлинеарности между факторами модели

Мультиколлинеарность - это коррелированность двух или нескольких объясняющих параметров в уравнении регрессии.

Оценка коэффициента регрессии может оказаться незначимой не только из-за не существенности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов.

Это бывает в том случае, когда какие-то факторы линейно связаны между собой и меняются синхронно. Связь зависимой переменной с изменениями каждого из них можно определить только, если в число объясняющих переменных включается лишь один из этих факторов.

Природа мультиколлинеарности нагляднее всего может быть продемонстрирована на примере совершенной мультиколлинеарности, то есть факторы связаны между собой функционально.

(1)

Пусть уравнение регрессии имеет вид:

(2)

Используя уравнение (1), уравнение 2 можно переписать в следующем виде:

Используя yi и x2i методом МНК находим оценки , причем . В этом случае имеем одно уравнение с двумя неизвестными, поэтому найти оценки и не представляется возможным.

В реальности мы имеем несовершенную мультиколлинеарность, т.е. стохастическую , линейную связь между х1 и х2. Оценка этой стохастической связи находится путем расчета коэффициента парной корреляции.

;

Чем больше по абсолютной величине значение корреляции к единице, тем ближе мультиколлинеарность к совершенной и тем труднее разделить влияние объясняющих переменных x1 и х2 на поведение переменной у, и тем менее надежными будут оценки коэффициентов уравнения регрессии при этих переменных.

Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.

Мультиколлинеарность приводит к тому, что уравнение становится неустойчивым, т.е. оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.

Для проверки наличия мультиколлинеарности между факторами, необходимо найти значения коэффициентов корреляции. Для нахождения матрицы коэффициентов парной корреляции используем табличный редактор "Excel", выполнив следующие команды: "Сервис" - "Анализ данных" - "Корреляция" Затем в диалоговом окне "Корреляция" в поле "Входной интервал" вводим адреса ячеек таблицы "Исходные данные", включая названия реквизитов. Установив отметки в окне "Метки в первой строке" и "По столбцам", выбираем параметр выбора "Новый рабочий лист". Получим результат в виде таблицы:

Таблица №2

Матрица коэффициентов парной корреляции

 

Y

Z1

Z2

T

Y

1,00

Z1

-0,49

1,00

Z2

0,96

-0,52

1,00

T

-0,75

0,86

-0,72

1,00

Для проверки значимости коэффициентов парной корреляции используют t-критерий Стьюдента. Для этой цели требуется найти для каждого коэффициента парной корреляции значение t-критерия Стьюдента, который рассчитывается по формуле:

где:

r - значение коэффициента парной корреляции;

n - число наблюдений (n = 20).

Полученные данные занесем в таблицу

Таблица №3

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]