Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лр1_2 по эконометрике.doc
Скачиваний:
31
Добавлен:
05.11.2018
Размер:
916.48 Кб
Скачать

Регрессия по методу наименьших квадратов.

Допустим, что имеется четыре наблюдения, для x и y, представленные на рис. 1, и поставлена задача, – определить значения  и  в управлении (1). В качестве грубой аппроксимации можно сделать это, отложив четыре точки P и построив прямую, в наибольшей степени соответствующую этим точкам. Это сделано на рис. 2. Отрезок, отсекаемый на прямой по оси y, представляет собой оценку  и обозначен а, а угловой коэффициент прямой представляет собой оценку  и обозначен b.

Построение линии регрессии на глаз является достаточно субъективным. Более того, это просто невозможно, если переменная y зависит не от одной, а от двух или более независимых переменных. Возникает вопрос о существовании способа достаточно точной оценки  и  алгебраическим путем.

Первым шагом является определение остатка для каждого наблюдения. За исключением случаев чистого совпадения, построенная линия регрессии не пройдет точно ни через одну точку наблюдения. Например, на рис. 3 при x=x1 соответствующей ему точкой на линии регрессии будет R1 со значением y, которое обозначено вместо фактически наблюдаемого значения y1. Величина описывается как расчетное значение y, соответствующее x1. Разность между фактическим и расчетным значениями (y1- ), определяемая отрезком P1R1,описывается как остаток в первом наблюдении. Обозначим его e1. Соответственно, для других наблюдений остатки будут обозначены как e2, e3 и e4.

Рис. 2. Прямая, построенная по точкам

Рис. 3. Построенная по точкам линия регрессии, показывающая остатки.

Очевидно, что требуется построить линию регрессии таким образом, чтобы эти остатки были минимальными. Очевидно также, что линия, строго соответствующая одним наблюдениям, не будет соответствовать другим, и наоборот. Необходимо выбрать какой-то критерий подбора, который будет одновременно учитывать величину всех остатков.

Один из способов решения поставленной проблемы состоит в минимизации суммы квадратов остатков S. Для рис. 3 верно такое соотношение:

S=e12+e22+e32+e42 (2)

Величина S будет зависеть от выбора a и b, так как они определяют положение линии регрессии. В соответствие с этим критерием, чем меньше S, тем строже соответствие. Если S=0, то получено абсолютно точное соответствие, так как это означает, что все остатки равны нулю. В этом случае линия регрессии будет проходить через все точки, однако, вообще говоря, это не возможно из-за наличия случайного члена.

При выполнении определенных условий метод наименьших квадратов дает несмещенные и эффективные оценки  и .

Детальное рассмотрение остатков.

После построения линии регрессии рассмотрим более детально общее выражение для остатка в каждом наблюдении.

Рис. 4.

На рис. 4 линия регрессии

=a+bx (3)

построена по выборке наблюдений. Для того чтобы не загромождать график, показано только одно такое наблюдение: наблюдение i, представленное точкой P с координатами (xi, yi).

Когда x=xi линия регрессии предсказывает значение y=, что соответствует точке R на графике, где

=a+bxi (4)

Используя условные обозначения, принятые на рис. 4, это уравнение можно переписать следующим образом:

RT=ST+RS, (5)

так как отрезок ST равен a,а отрезок RS равен bxi.

Остаток PR – это разность между PT и RT:

PR= PT- RT= PT- ST - RS (6)

Используя обычную математическую запись, представим формулу (6) в следующем виде:

ei=yi-= yi-a-bxi (7)

Если в примере, показанном на графике, выбрать несколько большее значение a или несколько большее значение b, то прямая прошла бы ближе к P, и остаток ei был бы меньше. Однако это повлияло бы на остатки всех других наблюдений, и это необходимо учитывать. Минимизируя сумму квадратов остатков, необходимо найти некоторое равновесие между ними.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]