
- •5.2. Построение системы нормальных уравнений. Оценка коэффициентов уравнения множественной регрессии
- •5.3. Построение множественной линейной регрессии в ms excel
- •5.4. Матричное представление метода наименьших квадратов при оценке параметров
- •5.5. Задание к лабораторной работе №3 «Множественная линейная регрессия»
- •5.6. Отбор факторов при построении множественной регрессии
- •5.7. Задание к лабораторной работе № 4 «Отбор факторов во множественную линейную регрессию»
- •5.8. Импортирование данных из ms excel в Eview3.0
- •5.9. Мультиколлинеарность факторов
Как и в парной корреляции, возможны разные виды уравнения множественной регрессии, чаще используются следующие функции: линейные и нелинейные.
В линейной множественной регрессии коэффициенты при хi характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменных значениях других факторов, закреплённых на среднем уровне.
Пример 1. Предположим, что зависимость расходов на продукты питания по совокупности семей характеризуется следующим уравнением:
Yteor(x1,x2) = 0,6 +0,27x1 + 0,72x2,
где у – расходы семьи за месяц на продукты питания, тыс. руб.;
x1– месячный доход на одного члена семьи, тыс. руб.;
x2 – размер семьи, чел.
Анализ данного уравнения позволяет сделать выводы: – с ростом дохода на одного члена семьи на 1 тыс. руб. расходы на питание возрастут в среднем на 270 руб. при том же среднем размере семьи. Увеличение размера семьи при тех же её доходах предполагает дополнительный рост расходов на питание на 720 руб. Параметр а = 0,6 не имеет экономической интерпретации.
При изучении вопросов потребления коэффициенты регрессии рассматриваются как характеристики предельной склонности к потреблению. Например, если функция потребления Сt имеет вид Сt = b0 + b1* Rt + b2* Rt-1 +t, то потребление за t-й период времени зависит от дохода того же периода Rt и от дохода предшествующего периода Rt-1. Соответственно, коэффициент b1 характеризует эффект от единичного возрастания дохода Rt при неизменном уровне предыдущего дохода. Коэффициент b1 обычно называют краткосрочной предельной склонностью к потреблению. Общим эффектом возрастания как текущего, так и предыдущего дохода будет рост потребления на величину b = b1+b2. Коэффициент b рассматривается здесь как долгосрочная предельная склонность к потреблению. Например [15], за период 1908-1981 гг. (за исключением военных лет) М. Фридман построил для США следующую функцию потребления:
Сt = 53 + 0,58Rt + 0,32Rt-1
с краткосрочной предельной склонностью к потреблению 0,58 и долгосрочной предельной склонностью к потреблению 0,9=0,58+0,32.
Функция потребления может рассматриваться также в зависимости от прошлых привычек потребления, т.е. от предыдущего уровня потребления Ct-1:
Сt = b0 + b1Rt + b2Ct-1 + et.
В этом уравнении параметр b1 также характеризует краткосрочную предельную склонность к потреблению, т.е. влияние на потребление единичного роста доходов того же периода. Долгосрочная предельная склонность к потреблению имеет вид b1/(1- b2).
Так, если уравнение регрессии составило
Сt = 20 + 0,46Rt + 0,2Сt-1 ,
то краткосрочная предельная склонность к потреблению равна 0,46, а долгосрочная предельная склонность к потреблению равна величие 0,46/(1-0,2).
В степенной функции yтеор(x1,x2,…,xp) = ax1b1 x2 b2 …xp bp коэффициенты b1, b2, …, bp являются коэффициентами эластичности. Они показывают, на сколько процентов изменяется в среднем результат с изменением соответствующего фактора на 1% при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, в исследованиях спроса и потребления.
5.2. Построение системы нормальных уравнений. Оценка коэффициентов уравнения множественной регрессии
Оцененное уравнение в первую очередь должно описывать общий тренд (направление) изменения зависимой переменной Y. При этом необходимо иметь возможность рассчитать отклонения от этого тренда.
По данным выборки объема n: (x1i, x2i, ..., хpi, уi), i = 1,2, ..., n, требуется оценить значения параметров i вектора , т.е. оценить (приблизить) значения коэффициентов выбранной обычно вначале линейной модели (здесь хij, (j = 1, 2, ..., n) - это значение переменной Xi в j-ом наблюдении).
yi = b0 + b1x1i + b2x2i +…+ bpxpi+ ei.. (5.2)
При выполнении предпосылок МНК (о них мы поговорим позже) относительно ошибок еi оценки b0, b1, …, bp коэффициентов 0, 1, ..., p множественной линейной регрессии по МНК являются несмещенными, эффективными и состоятельными.
На основании (5.2) отклонение ei значения уi зависимой переменной Y от теоретического (модельного) значения
уteor(x1i, x2i, ..., хpi) = b0 + b1x1i + b2x2i +…+ bpxpi (5.3)
соответствующего уравнению регрессии в i-м наблюдении (i = 1, 2, ..., n), рассчитывается по формуле
ei = yi - b0 - b1x1i - b2x2i -…- bpxpi.
Параметры уравнения множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов (МНК), т.е. минимизируется функция S(b0, b1,…, bp) по переменным b0, b1,…, bp
S(b0,
b1,…,
bp)
=
.
(5.3')
На основании необходимого условия экстремума функции многих переменных S(b0, b1,..., bp), представляющей (5.3'), необходимо приравнять к нулю частные производные по этим переменным или в матричной форме — вектор частных производных
.
В результате получится система p+1 линейных уравнений для неизвестных b0, b1,..., bp. После приведения подобных членов получится система нормальных уравнений, решение которой и позволяет получить оценку коэффициентов множественной регрессии.
Так для уравнения yteor(x1i, x2i, ..., хpi) = b0+b1x1i + b2x2i +…+ bpxpi система нормальных уравнений имеет вид:
Ее
решение может быть найдено в частности,
методом Гаусса, методом Крамера, методом
вычисления обратной матрицы и многими
другими методами решения систем линейных
уравнений.
В пункте 5.3 будет показано, как обратиться к процедурам в Microsoft Excel, позволяющим решать это уравнение и вычислять не только значения коэффициентов множественной регрессии, но и числовые значения других ее характеристик.
При нелинейной зависимости признаков, приводимой к линейному виду, значения коэффициентов множественной регрессии также определяются также с помощью метода наименьших квадратов лишь с той разницей, что он применяется не к исходной информации, а к преобразованным данным. Так, рассматривая степенную функцию
мы преобразовываем её в линейный вид:
ln(y) = ln(a) + b1ln(x1) + b2ln(x2) + … + bpln(xp) + ln(),
где переменные выражены в логарифмах.
Далее метод наименьших квадратов применяется так же, как и раньше: строится система нормальных уравнений и определяются значения ln(a), b1, b2, …, bp. Потенцируя ln(a), найдём значение параметра а и общий вид уравнения степенной функции.
Поскольку параметры степенной функции представляют собой коэффициенты эластичности, то они сравнимы по разным факторам.
Пример 2. При исследовании спроса на некоторый продукт получено следующее уравнение
ln(y) = -1,28 – 0,888ln(x1) + 1,126ln(x2) + ,
где у – количество продукта на душу населения (кг); х1 – цена (руб.); х2 – доход на душу населения (тыс. руб.)
Из этого уравнения видно, что с ростом цены на 1% при том же доходе спрос снижается в среднем на 0,888%, а увеличение дохода на 1% при неизменных ценах вызывает увеличение спроса на 1,126%.
При других нелинейных функциях методика оценки параметров метода наименьших квадратов выполняется также. В отличие от предыдущих функций параметры более сложных моделей не имеют чёткой экономической интерпретации – они не являются показателями силы связи и её эластичности. Это не исключает возможности их применения, но делает их менее привлекательными в практических расчётах.