Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы.печать.docx
Скачиваний:
47
Добавлен:
17.04.2019
Размер:
1.16 Mб
Скачать
  1. Модель парной линейной регрессии

Мы уже отмечали ранее, что если между переменными х и у существует теоретическая линейная связь в виде

y = α + βx, (2.1)

то наблюдаемые значения xi, yi, i =1, 2, …, n этих переменных связаны линейной моделью наблюдений

(2.2)

Если α и β – истинные значения параметров линейной модели связи, то величина εi = yi - (α +βxi) представляет собой ошибку в i-м наблюдении.

Поиск коэффициентов α и β осуществляется таким образом, чтобы величина ε стремилась к минимуму (в идеале к нулю). Если εi = 0, то все точки лежат на одной прямой. В результате получают подобранную модель линейной связи

.

В подобранной модели наблюдаемому значению x переменной х сопоставляется значение переменной у. Значения подобранное и реальное наблюдаемое у обычно отличаются. Разность

называется остатком в i-м наблюдении.

  1. Метод наименьших квадратов оценки параметров парной регрессионной модели

Для реальных данных, как правило, все остатки отличны от нуля, так что часть из них имеет положительный знак, а остальные – отрицательный. При этом необходимо соблюдение принципа наименьших квадратов

(2.5)

Получаемые при этом оценки а и b называются оценками наименьших квадратов. Свойством оценок наименьших квадратов является то, что соответствующая им прямая проходит через точку . Поиск пары чисел а и b с помощью метода наименьших квадратов (МНК) сводятся к математической задаче поиска точки минимума функции двух переменных. В результате получаем коэффициенты в подобранной модели

, (2.6) , (2.7)

где

При подстановке в формулу (2.3) выражения (2.7) получаем оценку уравнения парной линейной регрессии (функция регрессии)

.

  1. Статистические свойства мнк-оценок параметров уравнения регрессии

При выполнении стандартных предположений регрессионного анализа, МНК-оценки параметров уравнения регрессии будут обладать следующими статистическими свойствами:

  1. Несмещенность.

Статистическая оценка некоторого параметра называется несмещенной, если ее математическое ожидание равно истинному значению этого параметра. В случае парной линейной регрессии: М(a)=α, М(b)=ß.

  1. Состоятельность.

При неограниченном возрастании объема выборки значение оценки должно стремиться по вероятности к истинному значению параметра, а дисперсии оценок параметров должны уменьшаться и в пределе стремиться к 0: , при .

  1. Эффективность.

Оценка называется эффективной, если она имеет минимальную дисперсию по сравнению с другими оценками заданного класса.

  1. Использование модели парной линейной регрессии для прогноза

Пусть мы имеем модель наблюдений в виде

(2.9)

и хотим дать прогноз, каким будет значение объясняемой переменной y при некотором выбранном (фиксированном) значении x объясняющей переменной x если мы будем продолжать наблюдения.

Мы умеем оценивать коэффициенты α и β методом наименьших квадратов и получать подобранную модель

(2.10)

где – прогнозируемое значение объясняемой переменной.

Вопрос: насколько надежным является выбор такого значения в качестве прогнозируемого?

Выбирая в качестве прогноза в (n+1)-м наблюдении для y0 значение мы тем самым допускаем ошибку прогноза

. (2.11)

Эта ошибка является следствием:

- неопределенности, связанной с отклонением вычисленных значений случайных величин а и b от истинных значений параметров α и β ;

- неопределенности, связанной со случайной ошибкой ε0 в (n+1)-м наблюдении.

При наших стандартных предположениях о линейной модели ошибка прогноза является случайной величиной с математическим ожиданием

(2.12)

[ M(a) = α; M(b) = β; M0) = 0 ].

Теоретическая точность такого прогноза характеризуется дисперсией ошибки прогноза

. (2.13)

Далее мы будем рассматривать оценку этой дисперсии S , то есть оценку дисперсии ошибки прогноза (дисперсию остатков)

, (2.14)

где n – количество наблюдений;

m – количество параметров уравнения регрессии.