- •1. Введение в статистику связей случайных величин
- •1.1. Краткие сведения об используемых понятиях и терминах
- •1.1.1. Эмпирические данные
- •1.1.2. Стохастическая эмпирическая зависимость случайных величин
- •1.1.3. Математическая модель эмпирической зависимости и ее остатки
- •1.1.4. Зависимая и независимая переменные эмпирической зависимости
- •1.2. Основные методы построения стохастической зависимости
- •1.2.1. Корреляционный анализ
- •1.2.2. Регрессионный анализ
- •1.2.3. Меры расхождений и методы приближений
- •1.3. Задача аппроксимации и принципы оптимального решения
- •1.3.1. Постановка задачи аппроксимации эмпирической зависимости
- •1.3.2. Неопределенность и неоднозначность задачи аппроксимации
- •1.3.3. Оптимальное приближение эмпирической зависимости
- •2. Основы линейного приближения стохастической зависимости
- •2.1. Задача линейного приближения при парной связи
- •2.1.1. Виды математических моделей парной линейной зависимости
- •2.1.2. Неопределенность задачи построения линейной модели
- •2.1.3. Правила оптимального решения задачи линейной аппроксимации
- •2.2. Оценка реальности парной линейной связи и ее тесноты
- •2.2.1. Случайное рассеяние и неопределенность парной линейной связи
- •2.2.2. Корреляционное отношение – показатель тесноты связи
- •2.2.3. Ковариация – признак линейной стохастической связи
- •2.2.4. Коэффициент корреляции – показатель силы линейной связи
- •2.2.5. Коэффициент детерминации – показатель определенности связи
- •2.2.6. Интерпретация линейной корреляции
- •2.3. Методы определения параметров линейной модели
- •2.3.1. Суть и эффективность методов определения параметров модели
- •2.3.2. Максимально правдоподобные меры расхождения
- •2.4. Качество линейной модели эмпирической зависимости
- •2.4.1. Значимость и доверительные интервалы параметров регрессии
- •2.4.2. Доверительные интервалы линейной эмпирической зависимости
- •2.4.3. Дисперсия и доверительная область прогнозных оценок
- •2.4.4. Оценка адекватности линейной модели
- •3. Компьютерный практикум
- •3.1. Исходные данные для построения парной зависимости
- •3.1.1 Регулярная составляющая аукционных цен
- •3.1.1. Случайная составляющая аукционных цен
- •3.1.3. Линейное приближение зависимости и его приложения
- •3.2. Линейное приближение парной зависимости в Excel
- •3.2.1. Ввод данных
- •3.2.2. Оценка тесноты линейной связи
- •3.2.3 Построение регрессии процедурой вывода тренда на график
- •3.2.4. Вывод параметров линейной регрессии встроенными функциями
- •3.2.5. Оценки качества линейной модели
- •3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
- •3.2.7. Применение процедуры Регрессия для линейной модели
- •3.6. Вопросы для самопроверки
3.2.5. Оценки качества линейной модели
Качество линейной модели характеризуется ее соответствием неизвестной, но объективно существующей истинной зависимости, и доверительными границами соответствия.
1. Доверительные интервалы оценок коэффициентов регрессии вычисляются через дисперсии по формулам (2.34), (2.65) и (2.67).
Доверительные интервалы линии регрессии и прогнозируемой зависимой переменной у включают дисперсию D2, рассчитываемую по формуле (2.34).
По дисперсиям оценок параметров регрессии вычисляются стандарты:
= 0,629 0,052 и = – 8,203 2,142.
Выборочные коэффициенты регрессии по абсолютной величине превышают среднеквадратичные погрешности оценивания в несколько раз и позволяют отклонить нулевую гипотезу. Однако погрешности оценивания параметров регрессии обуславливают ее случайное отклонение от истинной зависимости с неизвестными точными значениями параметров.
2. Доверительные границы линии регрессии (y+ и y–) рассчитываются по формулам (2.84) и (2.85) для всех х. Величину t рекомендуется определить для вероятности 99%.
3. Доверительные границы прогнозируемой переменной y, то есть y’+ и y’–, вычисляются по формуле (2.85) для всех х с указанной выше величиной t.
По результатам расчетов строятся графики, как показано на рис. 2.07.
Графики (рис. 2.07) показывают, что хотя линейная зависимость значима:
– положение линии регрессии случайно и колеблется в доверительной области;
– предсказываемые моделью цены являются приближенными (попадают в доверительные границы) и реальны при выдержке вина более 15 лет;
– модель неадекватна заметным нелинейным проявлениям аукционного ценообразования, и допускает нереальную экстраполяцию цен в отрицательную область при выдержке вина менее 15 лет.
3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
Встроенная функция ЛИНЕЙН решает методом наименьших квадратов задачи линейной множественной и, в частности, двухмерной регрессии.
В частном случае двухмерной линейной регрессии ее уравнение рассматривается, как
y = mx + b, (3.2)
где: y – линейная функция независимой переменной x;
m – коэффициент при независимой переменной x;
b – свободный член.
Функция ЛИНЕЙН возвращает массив параметров регрессии и дополнительную статистику. Синтаксис функции
ЛИНЕЙН(известные_значения_y;известные_значения_x;конст;статистика)
где: известные_значения_y – множество значений зависимой переменной y (один столбец или одна строка);
известные_значения_x – множество значений независимой переменной x, соответствующих значениям зависимой переменной y;
конст – логическое значение: если конст – ИСТИНА (равно 1) или опущено, то b вычисляется, Если конст – ЛОЖЬ (равно 0), то b полагается равным 0, и рассматривается уравнение регрессии y = mx;
статистика – логическое значение: если статистика – ИСТИНА (равно 1), то возвращается дополнительная регрессионную статистика, если статистика – ЛОЖЬ (равно 0) или опущена, то функция возвращаются только коэффициент m и постоянная b.
Функция ЛИНЕЙН является функцией массивов и возвращает не одно значение, а несколько – массив параметров, под которые предварительно выделяется (засвечивается) диапазон ячеек – в двухмерном случае из 2-х столбцов по 5 строк. Только после этого вызывается Мастер функций.
В диалоговом окне функции заполняются поля, и затем нажимается комбинация клавиш Ctrl, Shift и Enter. При этом функция ЛИНЕЙН возвращает в выделенный диапазон, если статистика – ИСТИНА, массив данных, приведенный на рис. 3.4.
Рис. 3.4. Массив данных, возвращаемый функцией ЛИНЕЙН
Возвращаемые данные в виде двух столбцов на рис 3.4 затонированы и их смысл поясняется символами (слева и справа от массива данных):
m – коэффициент при независимой переменной x в уравнении (3.2);
b – свободный член в уравнении (3.2);
Sm – среднеквадратичная погрешность оценки коэффициента m;
Sb – среднеквадратичная погрешность оценки свободного члена b;
S2 – стандарт рассеяния зависимой переменной y относительно регрессии;
R2 – квадрат корреляционного отношения (коэффициента корреляции)
n – 2 – число степеней свободы n отклонений зависимой переменной y относительно линейной регрессии;
D1 – дисперсия зависимой переменной y в модели – имеет одну степень свободы;
F – отношение дисперсий D1 /D2;
– сумма квадратов отклонений зависимой переменной y относительно линейной регрессии, определяющая дисперсию D2 и стандарт S2.
Смысл отношения дисперсий D1 /D2 следует из уравнений (2.32) и (2.40)
Adjusted R2 R2 = k2 = 1 – . (3.3)
Из выражения (3.3) видно:
– если D1 /D2 0, то Adjusted R2 R2 = k2 0, то есть линейная связь отсутствует;
– если D1 /D2 , то Adjusted R2 R2 = k2 1, следовательно, линейная стохастическая связь максимальна и вырождается в функциональную.
Очевидно, чем больше отношение дисперсий D1 /D2, тем значимее значения Adjusted R2 R2 = k2 и теснее линейная связь.
Отношение D1 /D2 подчиняется F-распределению, которое позволяет проверить нулевую гипотезу о равенстве F = 1, что является более сильным условием по сравнению с F 0. Если отклоняется условие F = 1, то тем более есть основание отклонить равенство F = 0.
В рассматриваемом случае (рис. 3.4) функция ЛИНЕЙН возвращает значение F = 146,337. Вероятность ошибки того, что F 1, то есть отклонения нулевой гипотезы, возвращается функцией =FРАСП(146,337;1;12), и практически равна нулю. Минимальная критическая величина F для отклонения нулевой гипотезы с доверительной вероятность 95% (вероятностью ошибки 5%) возвращается функцией =FРАСПОБР(0,05;1;12) = 4,747.
Следовательно, по критической величине F и вероятности ошибки при отклонении нулевой гипотезы для фактической величины F можно сделать вывод о значимости обсуждаемой линейной связи.