Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
126
Добавлен:
27.03.2015
Размер:
500.22 Кб
Скачать

Исходные статистические данные.

Все выводы в регрессионном анализе делаются на основе известных статистических данных. Имеются результаты регистрации значений переменных (факторов) и результативного признакау на k статистически обследованных объектах. Если i - номер обследованного объекта, то исходные статистические данные представляют собой следующих k строчек:

(), гдеi = 1,2, …, k.

В случае множественной регрессии, исходные данные представляются в виде следующей матрицы:

− матрица наблюдаемых значений, имеющая k строк и (n+1)столбец.

- вектор – столбец результирующих переменных.

Если данные регистрируются на одном объекте, но в разные периоды времени, то i – номер этого периода, k – их число. В первом случае говорят о пространственной выборке, во втором – о временной выборке.

Основные задачи прикладного регрессионного анализа заключаются в следующем:

  1. Построение наилучших точечных и интервальныхоценок для неизвестной функции регрессии для любых заданных значений объясняющих переменных.

  2. Построение наилучшего точечного и интервальногопрогнозов неизвестного значения результирующей переменной у по заданным значениям объясняющих переменных (факторов) .

  3. Оценка удельного веса влияния каждой из объясняющих переменных (факторов) , на результативный признак, определение переменных, которые можноисключить из модели как практически не влияющие на результат (некоторые факторы практически не влияют на результат и их можно исключить).

Регрессионный анализ начинается с решения задачи конструирования по исходным статистическим данным оценки для неизвестной функции регрессии. Решающим этапом здесь становится выбор конкретного вида функции. При этом не следует гнаться за чрезмерной сложностью функции, описывающий искомую регрессию. Обычно сначала используют возможность применения простейшейлинейной модели.

Понятие о линейной модели множественной регрессии (лммр).

Традиционные ЛММР математически формулируются следующим образом:

(2) ,

В (2) - математическое ожидание случайной величины .

, - среднее квадратическое отклонение (стандартное отклонение).

В традиционной ЛММР рассматриваются только линейные функции регрессии, - неслучайные переменные, случайными составляющими являются регрессионные остатки.

Постулируется взаимная некоррелируемость (независимость) случайных регрессионных остатков (некоррелируемость ошибок для разных наблюдений). Так как для всех остатков выполняется соотношение (от номера наблюдения i не зависит), это означает неизменность отклонений (дисперсий) регрессионных остатков. По сути это условие независимости дисперсии ошибки от номера наблюдения.

Это свойство называется гомоскедастичностью (или равноизменчивости) регрессионных остатков. Случай, когда это условие не выполняется, называется гетероскедастичностью.

Требование к рангу Х означает, что не должно существовать строгой линейной зависимости между объясняющими переменными (вектор не коллинеарен вектору).

Матричная форма записи ЛММР.

Введем единичную матрицу I размерностью ;

- вектор – столбец параметров;

- вектор – столбец остатков;

ковариационную матрицу (она является многомерным аналогом дисперсии одной переменной):

.

Тогда в матричной форме ЛММР имеет вид:

(3)

Лекция 3