- •1. Введение в статистику связей случайных величин
- •1.1. Краткие сведения об используемых понятиях и терминах
- •1.1.1. Эмпирические данные
- •1.1.2. Стохастическая эмпирическая зависимость случайных величин
- •1.1.3. Математическая модель эмпирической зависимости и ее остатки
- •1.1.4. Зависимая и независимая переменные эмпирической зависимости
- •1.2. Основные методы построения стохастической зависимости
- •1.2.1. Корреляционный анализ
- •1.2.2. Регрессионный анализ
- •1.2.3. Меры расхождений и методы приближений
- •1.3. Задача аппроксимации и принципы оптимального решения
- •1.3.1. Постановка задачи аппроксимации эмпирической зависимости
- •1.3.2. Неопределенность и неоднозначность задачи аппроксимации
- •1.3.3. Оптимальное приближение эмпирической зависимости
- •2. Основы линейного приближения стохастической зависимости
- •2.1. Задача линейного приближения при парной связи
- •2.1.1. Виды математических моделей парной линейной зависимости
- •2.1.2. Неопределенность задачи построения линейной модели
- •2.1.3. Правила оптимального решения задачи линейной аппроксимации
- •2.2. Оценка реальности парной линейной связи и ее тесноты
- •2.2.1. Случайное рассеяние и неопределенность парной линейной связи
- •2.2.2. Корреляционное отношение – показатель тесноты связи
- •2.2.3. Ковариация – признак линейной стохастической связи
- •2.2.4. Коэффициент корреляции – показатель силы линейной связи
- •2.2.5. Коэффициент детерминации – показатель определенности связи
- •2.2.6. Интерпретация линейной корреляции
- •2.3. Методы определения параметров линейной модели
- •2.3.1. Суть и эффективность методов определения параметров модели
- •2.3.2. Максимально правдоподобные меры расхождения
- •2.4. Качество линейной модели эмпирической зависимости
- •2.4.1. Значимость и доверительные интервалы параметров регрессии
- •2.4.2. Доверительные интервалы линейной эмпирической зависимости
- •2.4.3. Дисперсия и доверительная область прогнозных оценок
- •2.4.4. Оценка адекватности линейной модели
- •3. Компьютерный практикум
- •3.1. Исходные данные для построения парной зависимости
- •3.1.1 Регулярная составляющая аукционных цен
- •3.1.1. Случайная составляющая аукционных цен
- •3.1.3. Линейное приближение зависимости и его приложения
- •3.2. Линейное приближение парной зависимости в Excel
- •3.2.1. Ввод данных
- •3.2.2. Оценка тесноты линейной связи
- •3.2.3 Построение регрессии процедурой вывода тренда на график
- •3.2.4. Вывод параметров линейной регрессии встроенными функциями
- •3.2.5. Оценки качества линейной модели
- •3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
- •3.2.7. Применение процедуры Регрессия для линейной модели
- •3.6. Вопросы для самопроверки
2.4.3. Дисперсия и доверительная область прогнозных оценок
В случайную погрешность прогнозируемой зависимой переменной y основной вклад вносят две случайные величины:
1). Независящие от абсцисс колебания y относительно линии регрессии в пределах постоянной по ширине полосы. Такие колебания с дисперсией D2, подсчитываемой по формуле (2.35), имеют стандарт S2 = и соответствуют составляющей погрешности модели.
2). Отклонения самой линии регрессии (угла наклона и точки пересечения оси ординат) от истинной зависимости с точными значениями параметров. Такие отклонения приводят к зависящим от абсцисс возрастаниям погрешностей модели со стандартом S(y) и дисперсией D(y), рассмотренной выше (2.82).
Поскольку составляющая, указанная второй, зависит от абсцисс, среднеквадратичная погрешность прогнозируемой переменной, ее дисперсия и доверительные границы также являются функциями абсцисс. Для того, чтобы отличать эти статистики от аналогичных для регрессии, к обозначениям добавляется штрих: D’(y), S’(y), y’+, y’–.
1. Взаимосвязь случайных составляющих прогноза следует из выражений дисперсий (2.82) и (2.34) и соответствующих им стандартов:
S(y) = S2. (2.86)
В левой части уравнения (2.86) – стандарт искомой зависимости (2.55), как функции аргумента x, то есть, левая часть уравнения (2.86) при подробном обозначении – это S(y(x)).
Само уравнение (2.86) можно рассматривать как некоторую линейную зависимость, где: S(y) – зависимая переменная; S2 – независимая переменная;
– угловой коэффициент, обозначаемый далее .
В соответствии с этим уравнение (2.86) выражается компактнее:
S(y) = S2. (2.87)
В соответствии с соотношением (2.28) коэффициент корреляции между S(y) и S2, как переменными, можно представить в виде
, (2.88)
где:
и , (2.89)
как следует из выражений стандартов среднеквадратичных отклонений нормально распределенных случайных величин с числом степеней свободы n – 2.
С учетом выражений стандартов (2.89) формула (2.89) упрощается:
. (2.90)
Ковариация между переменными S(y) и S2 выражается через их стандарты и коэффициент корреляции (2.90) в соответствии с уравнением (2.18):
= (2.91)
2. Общая дисперсия прогнозной оценки D’(y) складывается из дисперсий взаимосвязанных отклонений D2 и D(y) и их ковариации (2.91):
D’(y) = D2 +2 + D(y). (2.92)
Следовательно, стандарт S’(y) прогнозной оценки зависимой переменной y составит
S’(y) = . (2.93)
3. Доверительные границы прогнозируемой зависимой переменной y со стандартом (2.93) определяются аналогично обсуждавшимся для линии регрессии (2.84) и (2.85):
y’+ = x + + t S’(y) и y’– = x + – t S’(y). (2.94)
Их графики (рис. 2.7) построены по данным (таблица 3.1) опубликованным в газете “The Chicago Maroon” за 10 ноября 1972 г., об оптовых аукционных ценах на марочные вина в зависимости от года их закладки и показывают:
– исходные данные (цены вин в долларах за бутылку и годы выдержки);
– линейную регрессию аукционных цен вин на годы их выдержки;
– доверительные границы, рассчитанные по формулам (2.84), (2.85), (2.94).
Рис. 2.7. Графики исходных данных у, линейной регрессии у(х) и доверительных границ:
у+ и у– с вероятностью 99%; y’+ и у’– с вероятностью 95%
Границы у+ и у– охватывают допустимые колебания линии регрессии; границы y’+ и у’– – возможное рассеяние прогнозных оценок.