- •О лабораторной работе № 2
- •На тему:
- •«Определение параметров нестационарного нелинейного уравнения регрессии»
- •Введение
- •1. Постановка задачи
- •Исходные данные
- •2. Приведение исходного нелинейного уравнения регрессии к линейному
- •3. Проверка наличия мультиколлинеарности между факторами модели
- •Матрица коэффициентов парной корреляции
- •Проверка значимости коэффициентов парной корреляции, используя t - критерий Стьюдента
- •4. Определение параметров уравнения регрессии. Построение уравнения регрессии
- •Дисперсионный анализ
- •Вывод остатка
- •5. Проверка статистической значимости уравнения регрессии
- •5.1. Проверка случайности колебаний уровней статочной последовательности
- •5.2. Проверка соответствия распределения случайной компоненты нормальному закону распределения
- •5.3. Проверка равенства математического ожидания случайной компоненты нулю
- •5.4. Проверка независимости значений уровней случайной компоненты
- •5.5. Определение точности модели
- •5.6. Тест ранговой корреляции Спирмена
- •6. Проверка наличия аномальных колебаний исследуемой модели
- •7. Определение оптимального вида линии тренда. Прогноз показателей
- •Список используемой литературы:
3. Проверка наличия мультиколлинеарности между факторами модели
Мультиколлинеарность - это коррелированность двух или нескольких объясняющих параметров в уравнении регрессии.
Оценка коэффициента регрессии может оказаться незначимой не только из-за не существенности данного фактора, но и из-за того, что трудно разграничить воздействие на зависимую переменную двух или нескольких факторов.
Это бывает в том случае, когда какие-то факторы линейно связаны между собой и меняются синхронно. Связь зависимой переменной с изменениями каждого из них можно определить только, если в число объясняющих переменных включается лишь один из этих факторов.
Природа мультиколлинеарности нагляднее всего может быть продемонстрирована на примере совершенной мультиколлинеарности, то есть факторы связаны между собой функционально.
(1)
Пусть уравнение регрессии имеет вид:
(2)
Используя уравнение (1), уравнение 2 можно переписать в следующем виде:
Используя yi
и x2i
методом МНК находим оценки
,
причем
.
В этом случае имеем одно уравнение с
двумя неизвестными, поэтому найти оценки
и
не представляется возможным.
В реальности мы имеем несовершенную мультиколлинеарность, т.е. стохастическую , линейную связь между х1 и х2. Оценка этой стохастической связи находится путем расчета коэффициента парной корреляции.
;
Чем больше по абсолютной величине значение корреляции к единице, тем ближе мультиколлинеарность к совершенной и тем труднее разделить влияние объясняющих переменных x1 и х2 на поведение переменной у, и тем менее надежными будут оценки коэффициентов уравнения регрессии при этих переменных.
Считается, что предельным является значение коэффициента корреляции между двумя факторами, равное 0,8.
Мультиколлинеарность приводит к тому, что уравнение становится неустойчивым, т.е. оценки коэффициентов уравнения регрессии становятся сильно зависимыми от точности нахождения исходных данных и резко изменяют свои значения при изменении количества наблюдений.
Для проверки наличия мультиколлинеарности между факторами, необходимо найти значения коэффициентов корреляции. Для нахождения матрицы коэффициентов парной корреляции используем табличный редактор "Excel", выполнив следующие команды: "Сервис" - "Анализ данных" - "Корреляция" Затем в диалоговом окне "Корреляция" в поле "Входной интервал" вводим адреса ячеек таблицы "Исходные данные", включая названия реквизитов. Установив отметки в окне "Метки в первой строке" и "По столбцам", выбираем параметр выбора "Новый рабочий лист". Получим результат в виде таблицы:
Таблица №2
Матрица коэффициентов парной корреляции
|
Y |
Z1 |
Z2 |
T |
Y |
1,00 |
|
|
|
Z1 |
-0,49 |
1,00 |
|
|
Z2 |
0,96 |
-0,52 |
1,00 |
|
T |
-0,75 |
0,86 |
-0,72 |
1,00 |
Для проверки значимости коэффициентов парной корреляции используют t-критерий Стьюдента. Для этой цели требуется найти для каждого коэффициента парной корреляции значение t-критерия Стьюдента, который рассчитывается по формуле:
где:
r - значение коэффициента парной корреляции;
n - число наблюдений (n = 20).
Полученные данные занесем в таблицу
Таблица №3
