Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика / glava1_2_3.doc
Скачиваний:
131
Добавлен:
15.05.2015
Размер:
780.8 Кб
Скачать

3.3. Парная линейная регрессия

Если функция регрессии линейна, то говорят о линейной регрессии. Модель линейной регрессии (линейное уравнение) является наиболее простым и распространенным видом зависимости между экономическими переменными. Кроме того, построенное линейное уравнение может служить начальной точкой эконометрического анализа.

Например, Кейнсом была предложена формула такого типа для моделирования зависимости частного потребления С от располагаемого дохода I: С = С0 + bI, где С0 — величина автономного потребления, b (0 < b < 1) — предельная склонность к потреблению. Однако при использовании этой модели при анализе конкретных данных мы практически всегда будем иметь определенную погрешность, так как строгой функциональной зависимости между этими показателями нет. Однако никто не будет отрицать, что люди (домохозяйства) с большим доходом имеют большее в среднем потребление. Данная ситуация наглядно представлена на рисунке 3.2.

Рис. 3.2. Зависимость величины частного потребления С от располагаемого дохода I, изображенная вместе с плотностью вероятности в каждой точке дохода I

Из предыдущих рассуждений ясно, что линейная регрессия (теоретическое линейное уравнение регрессии) представляет собой линейную функцию между условным математическим ожиданием М(YX=xi) зависимой переменной Y и одной объясняющей переменной X (xi — значения независимой переменной в i-ом наблюдении, i = l, 2, ..., n).

М(YX=xi) = 0 + 1xi. (3.5)

Отметим, что принципиальной в данном случае является линейность по параметрам 0 и 1 уравнения.

Для отражения того факта, что каждое индивидуальное значение yi отклоняется от соответствующего условного математического ожидания, необходимо ввести в соотношение (4.5) случайное слагаемое i,

yi = М(YX=xi) + i = 0 + 1xi+ i. (3.6)

Соотношение (3.6) называется теоретической линейной регрессионной моделью; 0 и 1 – теоретическими параметрами (теоретическими коэффициентами) регрессии; i – случайным отклонением.

Следовательно, индивидуальные значения yi представляются в виде суммы двух компонент: систематической (0 + 1xi) и случайной (i), причина появления которой достаточно подробно рассмотрена далее. В общем виде теоретическую линейную регрессионную модель будем представлять в виде

Y = 0 + 1X+ . (3.7)

Для определения значений теоретических коэффициентов регрессии необходимо знать и использовать все значения переменных X и Y генеральной совокупности, что практически невозможно.

Таким образом, задачи линейного регрессионного анализа состоят в том, чтобы по имеющимся статистическим данным (xi, уi, i = 1, 2, ..., n) для переменных X и Y:

а) получить наилучшие оценки неизвестных параметров 0 и 1;

б) проверить статистические гипотезы о параметрах модели;

в) проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).

Следовательно, по выборке ограниченного объема мы сможем построить так называемое эмпирическое уравнение регрессии

yтеор(xi) = a* + b*xi, (3.8)

где yтеор(xi) — оценка условного математического ожидания M(Y Х = xi);

a* и b* – оценки неизвестных параметров 0 и 1, называемые эмпирическими (выборочными) коэффициентами регрессии (иногда они далее будут обозначаться как b0 и b1). Следовательно, в конкретном случае

yi = a* + b*xi+ei, (3.9)

где отклонение ei – оценка теоретического случайного отклонения i.

В силу несовпадения статистической базы для генеральной совокупности и выборки оценки a* и b* практически всегда отличаются от истинных значений коэффициентов 0 и 1, что приводит к несовпадению эмпирической и теоретической линий регрессии. Различные выборки из одной и той же генеральной совокупности обычно приводят к определению отличающихся друг от друга оценок. Возможное соотношение между теоретическим и эмпирическим уравнениями регрессии схематично изображено на рисунке 3.3.

Рис. 3.3. Теоретическое и эмпирическое уравнения регрессии

Задача состоит в том, чтобы по конкретной выборке (xi, yi), i = l, 2, ... , n найти оценки a* и b* неизвестных параметров 0 и 1 так, чтобы построенная линия регрессии являлась бы наилучшей в определенном смысле среди всех других прямых. Другими словами, построенная прямая yтеор(xi) = a* + b*∙xi должна быть “ближайшей” к точкам наблюдений по их совокупности. Мерами качества найденных оценок могут служить определенные композиции отклонений ei, i = 1, 2, ... , n. Например, коэффициенты a* и b* эмпирического уравнения регрессии могут быть оценены исходя из условия минимизации одной из следующих сумм:

1)

2)

3)

Однако первая сумма не может быть мерой качества найденных оценок в силу того, что существует бесчисленное количество прямых (в частности, Y = уср), для которых ei = 0 (доказательство этого утверждения выносится в качестве упражнения).

Метод определения оценок коэффициентов из условия минимизации второй суммы называется методом наименьших модулей (МНМ).

Самым распространенным и теоретически обоснованным является метод нахождения коэффициентов, при котором минимизируется третья сумма. Он получил название метод наименьших квадратов (МНК). Этот метод оценки является наиболее простым с вычислительной точки зрения. Кроме того, оценки коэффициентов регрессии, найденные МНК при определенных предпосылках, обладают рядом оптимальных свойств.

Среди других методов определения оценок коэффициентов регрессии отметим метод моментов (ММ), метод максимального правдоподобия (ММП) и метод центра неопределённости (МЦН).

Соседние файлы в папке Эконометрика