
- •40. Линейная модель множественной регрессии
- •41 . Метод наименьших квадратов (мнк).
- •42. Свойства оценок мнк.
- •43.Показатели качества регрессии.
- •44. Линейные регрессионные модели с гетероскедастичными остатками.
- •41. 44. Проверка выполнения предпосылок мнк. Обнаружение гетероскедастичности.
- •45.Линейные регрессионные модели с автокоррелированными остатками.
- •46.Обобщенный метод наименьших квадратов (омнк).
- •47.Регрессионные модели с переменной структурой (фиктивные переменные).
- •48.Нелинейные модели регрессии и их линеаризация.
- •49.Характеристики временных рядов.
- •50.Модели стационарных и нестационарных временных рядов, их идентификация.
- •51.Система линейных одновременных уравнений.
40. Линейная модель множественной регрессии
В большинстве случаев нужно отождествить более одного фактора, влияющего на стоимость объекта оценки. Количественные измерения влияния множества факторов на зависимую переменную (у) можно осуществить на основе методики многофакторного регрессионного анализа. В данном случае, так же как и в парной регрессии, зависимость может характеризоваться как линейной, так и нелинейной связью.
Линейная модель множественной регрессии имеет общий вид:
y = b0 + b1x1 + b2x2+...+ bnxn + ε, где Y – зависимая переменная;
b 1 b2 bn - коэффициенты множественной регрессии;
x1, x2, хn - факторы, влияющие на стоимость объекта оценки, включенные в анализ или объясняющие (независимые) переменные или регрессоры;
b0 - постоянная величина, не зависящая от влияния отобранных факторов;
n - объем статической выборочной совокупности данных;
ε – ошибка вычислений.
Отбор факторов начинается с логического анализа: если вариация у в зависимости от вариации конкретного фактора х логически необъяснима, в модель фактор включать не следует.
Можно исследовать линейную зависимость между у и любой комбинацией независимых переменных, однако модель будет иметь силу только в случае, если существует значимая связь и если каждый коэффициент регрессии b значимо отличается от нуля.
Факторы - это технические, экономические, природно-климатические, организационные, технологические, социально-демографические и другие показатели, оказывающие количественное влияние на какой-либо результирующий экономический показатель: себестоимость, прибыль, выручка, стоимость объекта, денежный поток.
Задача математического моделирования состоит в выявлении количественной связи между факторами и результирующим показателем (признак-фактором).
Факторы не должны быть тесно связаны между собой, т. е. не должно быть мультиколлинеарности.
Построение модели множественной регрессии является одним из методов характеристики аналитической формы связи между зависимой (результативной) переменной и несколькими независимыми (факторными) переменными.
Модель множественной регрессии строится в том случае, если коэффициент множественной корреляции показал наличие связи между исследуемыми переменными.
Общий вид линейной модели множественной регрессии:
yi=β0+β1x1i+…+βmxmi+εi,
где yi – значение i-ой результативной переменной,
x1i…xmi – значения
факторных переменных;
β0…βm – неизвестные коэффициенты модели множественной регрессии;
εi – случайные ошибки модели множественной регрессии.
При построении нормальной линейной модели множественной регрессии учитываются пять условий:
1) факторные переменные x1i…xmi – неслучайные или детерминированные величины, которые не зависят от распределения случайной ошибки модели регрессии βi;
2) математическое ожидание случайной ошибки модели регрессии равно нулю во всех наблюдениях:
3) дисперсия случайной ошибки модели регрессии постоянна для всех наблюдений:
4) между значениями
случайных ошибок модели регрессии в
любых двух наблюдениях отсутствует
систематическая взаимосвязь, т.е.
случайные ошибки модели регрессии не
коррелированны между собой (ковариация
случайных ошибок любых двух разных
наблюдений равна нулю):
Это условие выполняется в том случае, если исходные данные не являются временными рядами;
5) на основании третьего и четвёртого условий часто добавляется пятое условие, заключающееся в том, что случайная ошибка модели регрессии – это случайная величина, подчиняющейся нормальному закону распределения с нулевым математическим ожиданием и дисперсией G2: εi~N(0, G2).
Общий вид нормальной линейной модели парной регрессии в матричной форме:
Y=X* β+ε,
Где
– случайный вектор-столбец значений результативной переменной размерности (n*1);
– матрица значений
факторной переменной размерности
(n*(m+1)).
Первый столбец является единичным,
потому что в модели регрессии коэффициент
β0
умножается на единицу;
– вектор-столбец неизвестных коэффициентов модели регрессии размерности ((m+1)*1);
– случайный
вектор-столбец ошибок модели регрессии
размерности (n*1).
Включение в линейную модель множественной регрессии случайного вектора-столбца ошибок модели обусловлено тем, что практически невозможно оценить связь между переменными со 100-процентной точностью.
Условия построения нормальной линейной модели множественной регрессии, записанные в матричной форме:
1) факторные переменные x1j…xmj – неслучайные или детерминированные величины, которые не зависят от распределения случайной ошибки модели регрессии εi. В терминах матричной записи Х называется детерминированной матрицей ранга (k+1), т.е. столбцы матрицы X линейно независимы между собой и ранг матрицы Х равен m+1<n;
2) математическое ожидание случайной ошибки модели регрессии равно нулю во всех наблюдениях:
3) предположения о том, что дисперсия случайной ошибки модели регрессии является постоянной для всех наблюдений и ковариация случайных ошибок любых двух разных наблюдений равна нулю, записываются с помощью ковариационной матрицы случайных ошибок нормальной линейной модели множественной регрессии:
где
G2 – дисперсия случайной ошибки модели регрессии ε;
In – единичная матрица размерности (n*n).
4) случайная ошибка модели регрессии ε является независимой и независящей от матрицы Х случайной величиной, подчиняющейся многомерному нормальному закону распределения с нулевым математическим ожиданием и дисперсией G2: ε→N(0;G2In.
В нормальную линейную модель множественной регрессии должны входить факторные переменные, удовлетворяющие следующим условиям:
1) данные переменные должны быть количественно измеримыми;
2) каждая факторная переменная должна достаточно тесно коррелировать с результативной переменной;
3) факторные переменные не должны сильно коррелировать друг с другом или находиться в строгой функциональной зависимости.