Определение оценок параметров уравнения регрессии с помощью

метода наименьших квадратов (МНК)

Для статистической проверки взаимосвязи между зависимой и независимой переменными необходимо найти значения ₀, ₁и  в выражении (9). Метод оценивания должен быть таким, чтобы это были наилучшие, линейные, несмещенные оценки (BLUE – Best, Linear, Unbiased Estimator).

Понятие наилучшие относится к требованию для оценок параметров быть наиболее эффективными, т.е., чтобы дисперсии оценок параметров были как можно меньше. Это достигается таким выбором значений ₀и ₁, которые минимизируют сумму квадратов значений ².

Термин линейные просто повторяет, что связь линейна.

Требование несмещенные означает, что ожидаемые (математическое ожидание) значения оценок параметров модели совпадают с истинными значениями параметров.

Метод, используемый чаще других для нахождения оценок параметров уравнения регрессии и известный как метод наименьших квадратов (МНК), дает наилучшие линейные несмещенные оценки. Он называется так потому, что при расчете коэффициентов прямой линии, которая наиболее соответствует фактическим данным, с помощью этого метода стараются найти линию, минимизирующую сумму квадратов отклонений (расхождений) модельных значений Y (рассчитанных по уравнению прямой) от фактических наблюдений.

Истинные значения параметров ₀ и ₁вычислить невозможно, поскольку обычно в распоряжении исследователя находится ограниченное число наблюдений, поэтому неизвестные параметры регрессии подлежат оцениванию по определенной процедуре. Оценки параметров будем обозначать через b₀ и b₁ соответственно. Тогда уравнение парной регрессии, по которому можно рассчитать ожидаемое значение Y, т.е. , может быть представлено так:

(10)

Следовательно, для каждого значения X_i существует фактическое значение Y_i, но при использовании выражения (10) появляется также оценочное значение . Разности между Y_i и – это остатки е_i. Найденная с помощью МНК линия регрессии представляет собой прямую, минимизирующую сумму квадратов е_i, т.е. минимизирует

Для обоснованного применения МНК необходимо, чтобы были выполнены следующие требования (основные предпосылки):

значение возмущения е_i нормально распределено со средней, равной нулю, и постоянной дисперсией ², что часто записывается как е_i  N(0, ²),
значения возмущения попарно независимы, т.е. ковариация в парах значений возмущения равна нулю (Cov e_ie_j = 0);
независимая (объясняющая) переменная не связана корреляционной зависимостью с возмущением.

Первая предпосылка указывает, что существует только один главный фактор (Х), определяющий величину Y, присутствует также множество второстепенных факторов, некоторые из которых оказывают прямое воздействие на величину Y, а другие – обратное. В случае множества прямых и обратных влияний значение остатка будет нормально распределено. Допущение о постоянной дисперсии значения возмущения означает, что как бы ни была велика или мала величина независимой переменной Х, разброс значений е постоянен. При этом говорят, что значение возмущения обладает свойством гомоскедастичности. Если же дисперсия остатка непостоянна, то возмущения определяются как гетероскедастичные.

Вторая предпосылка (о независимости значений е друг от друга) определяет тот факт, что второстепенные факторы или факторы, которые послужили причиной ошибки для одной из величин Y, не приводят автоматически к ошибкам для всех наблюдений Y. Эта предпосылка приобретает большое значение прежде всего в том случае, когда исходные данные представлены временными рядами. Когда значения е зависимы, говорят об автокоррелированности возмущения.

Третья предпосылка находит свое выражение в том, что переменная Х объясняет изменение переменной Y, но мы не можем утверждать обратное, т.е. переменная Y не объясняет переменную Х. Итак, предполагается односторонняя зависимость Y от Х.

Определение линии регрессии.

Величины b₀ и b₁, при которых сумма квадратов отклонений фактических значений результативного признака от расчетных (теоретических) минимальна, находятся из решения так называемой системы нормальных уравнений

Формулы для их определения:

<<< < Предыдущая 1 2 34 / 134 5 6 7 8 9 10 11 12 13 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
09.09.201944.09 Кб1метод часть Настя.docx
#
27.11.20195.98 Mб60метод. P-CAD.doc
#
15.04.2019443.9 Кб5Метод. для ЭПР-99 и ЭФ-99.doc
#
06.11.20181.72 Mб11метод. по электротехнике.doc
#
04.09.2019820.22 Кб1Метод.указ. к эк.ч. дипл.проекта ТКС 2.doc
#
15.08.20191.63 Mб3МЕТОД.УКАЗ.ПО ЭКОНОМЕТР.для ДПИ.doc
#
28.07.2019957.95 Кб7Метод.Указания по Лаб.Раб..doc
#
07.05.20197.37 Mб16Метод.указания_254.doc
#
18.11.2018276.99 Кб1Метод_заочн_ОТ в отрасли_2004_осень.DOC
#
11.11.20191.21 Mб24Метод_кп_ТАП_11_1.doc
#
19.12.2018129.54 Кб2Метод_указ к лабам 2010.doc