Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика для начинающих - В.П. Носко.doc
Скачиваний:
80
Добавлен:
24.05.2014
Размер:
9.34 Mб
Скачать

2.2. Гауссовское (нормальное) распределение ошибок в линейной модели наблюдений

Итак, предположив, что в модели наблюдений

ошибки независимые случайные величины, имеющие одинаковое распределение (i. i. d), мы должны сделать и предположение о том,каким именноявляется это распределение.

Классические методы статистического анализа линейных моделей наблюдений предполагают, что таковым является распределение Гаусса (Gaussian distribution), функция плотности которого имеет вид

График указанной функции плотности имеет колоколообразную форму

Параметр характеризует степень рассредоточения распределения вдоль оси абсцисс. На диаграмме представлены графики функций плотности гауссовского распределения при трех различных значениях параметра. Из трех представленных функций наибольшее значение в нуле имеет функция плотности с, наименьшее — функция плотности с, а промежуточное между ними — функция плотности с. Эти значения равны, соответственно,

Гауссовское распределение симметрично относительно нуля, и это предполагает, чтоположительные ошибки столь же вероятны, как и отрицательные; при этом, малые ошибки встречаются чаще, чем большие. Если случайная ошибка имеет гауссовское распределение с параметром, тос вероятностью ее значение будет заключено в пределах от до . Соответственно, для трех рассмотренных случаев получаем: с вероятностьюзначение случайной ошибки заключено в интервале

—при ,- при,- при.

Хотя гауссовское распределение довольно часто вполне приемлемо для описания случайных ошибок в моделях наблюдений, оно вовсе не является универсальным. Такое распределение характерно для ситуаций, когда результирующая ошибка является следствием сложения большого количества независимых случайных ошибок, каждая из которых достаточно мала.

Мы будем далее в этом параграфе предполагать, что процесс порождения данных (ППД, или DGP- data generating process)устроен следующим образом. Значенияизвестны точнои рассматриваются какзаданные, а значенияполучаютсяналожениемна значенияслучайных ошибок.

В этом контексте, рассматриваются как некоторыепостоянные(хотя ине известныенаблюдателю). Напротив, значенияносятслучайныйхарактер, определяемый случайным характером значений. Собственно,отличается от случайной величинылишьсдвигом на постоянную , и потому также является случайной величиной. Мы будем обозначать ее в этом качестве как случайную величину. Функция распределения этой случайной величины имеет вид

где — функция распределения случайной величины(одинаковаядля всех). Соответственно, функция плотности распределения случайной величиныимеет вид

где — функция плотности распределения случайной величины.

Таким образом, случайные величины хотя и являются взаимно независимыми (в силу предполагаемой взаимной независимости случайных величин), но имеютразные распределения,отличающиеся сдвигом. На следующем рисунке представлены графики функции плотностираспределения(гауссовское распределение с параметром) и функции плотностираспределения случайной величиныпри значении.

Заметим, что если случайная ошибка имеетгауссовское распределение с плотностью

то отличающаяся от нее сдвигом случайная величина имеет функцию плотности

Эта функция плотности принадлежит двухпараметрическому семейству функций плотности вида

Функции плотности такого вида называются нормальными плотностями, а определяемые ими распределения вероятностей называютсянормальными распределениями вероятностей. Если некоторая случайная величинаимеет плотность распределения, заданную последним соотношением, то говорят, чтослучайная величина Y имеет нормальное распределение с параметрами и 2. Распределение такой случайной величины симметрично относительно своегосреднего значения. Максимальное значение функции плотности этой случайной величины достигается при.

Таким образом, строго говоря, гауссовское распределение — это нормальное распределение с нулевым средним значением.Однако, в современной научной литературе терминынормальное распределение игауссовское распределение используются как синонимы:нормальное распределение с параметрами и называют такжегауссовским распределением с параметрами и 2.

Важнейшая роль предположения о нормальном (гауссовском) распределении ошибок в линейной модели наблюдений

определяется тем обстоятельством, что при добавлении такого предположения к стандартному предположениюо том, что ошибкинезависимые случайные величины, имеющие одинаковое распределение, можно легко найти точный вид распределения оценок наименьших квадратов для неизвестных значений параметров модели.

Вспомним, в этой связи, полученное ранее выражение

Обозначая

мы можем записать выражение для в виде

где

Таким образом,

где фиксированные величины, анаблюдаемые значения случайных величин . Поэтомувычисленноепо последней формуле значениеявляетсянаблюдаемым значением случайной величины

которая является линейной комбинацией случайных величини имеет некоторое распределение вероятностей, зависящее от распределения последних.

В общем случае, аналитическое описание распределения как случайной величины довольно затруднительно. Более просто эта задача решается в ситуации, когдаимеетгауссовскоераспределение. Если ошибки-независимые случайные величины, имеющие одинаковое нормальное распределение с нулевым средним, то тогда оценка наименьших квадратовпараметратакже имеет нормальное распределение. Чтобы указать параметры этого нормального распределения и иметь возможность проводить статистический анализ подобранной модели линейной связи между переменными факторами, нам придется уделить внимание некоторым важным числовым характеристикам случайных величин и их свойствам.