- •1. Введение в статистику связей случайных величин
- •1.1. Краткие сведения об используемых понятиях и терминах
- •1.1.1. Эмпирические данные
- •1.1.2. Стохастическая эмпирическая зависимость случайных величин
- •1.1.3. Математическая модель эмпирической зависимости и ее остатки
- •1.1.4. Зависимая и независимая переменные эмпирической зависимости
- •1.2. Основные методы построения стохастической зависимости
- •1.2.1. Корреляционный анализ
- •1.2.2. Регрессионный анализ
- •1.2.3. Меры расхождений и методы приближений
- •1.3. Задача аппроксимации и принципы оптимального решения
- •1.3.1. Постановка задачи аппроксимации эмпирической зависимости
- •1.3.2. Неопределенность и неоднозначность задачи аппроксимации
- •1.3.3. Оптимальное приближение эмпирической зависимости
- •2. Основы линейного приближения стохастической зависимости
- •2.1. Задача линейного приближения при парной связи
- •2.1.1. Виды математических моделей парной линейной зависимости
- •2.1.2. Неопределенность задачи построения линейной модели
- •2.1.3. Правила оптимального решения задачи линейной аппроксимации
- •2.2. Оценка реальности парной линейной связи и ее тесноты
- •2.2.1. Случайное рассеяние и неопределенность парной линейной связи
- •2.2.2. Корреляционное отношение – показатель тесноты связи
- •2.2.3. Ковариация – признак линейной стохастической связи
- •2.2.4. Коэффициент корреляции – показатель силы линейной связи
- •2.2.5. Коэффициент детерминации – показатель определенности связи
- •2.2.6. Интерпретация линейной корреляции
- •2.3. Методы определения параметров линейной модели
- •2.3.1. Суть и эффективность методов определения параметров модели
- •2.3.2. Максимально правдоподобные меры расхождения
- •2.4. Качество линейной модели эмпирической зависимости
- •2.4.1. Значимость и доверительные интервалы параметров регрессии
- •2.4.2. Доверительные интервалы линейной эмпирической зависимости
- •2.4.3. Дисперсия и доверительная область прогнозных оценок
- •2.4.4. Оценка адекватности линейной модели
- •3. Компьютерный практикум
- •3.1. Исходные данные для построения парной зависимости
- •3.1.1 Регулярная составляющая аукционных цен
- •3.1.1. Случайная составляющая аукционных цен
- •3.1.3. Линейное приближение зависимости и его приложения
- •3.2. Линейное приближение парной зависимости в Excel
- •3.2.1. Ввод данных
- •3.2.2. Оценка тесноты линейной связи
- •3.2.3 Построение регрессии процедурой вывода тренда на график
- •3.2.4. Вывод параметров линейной регрессии встроенными функциями
- •3.2.5. Оценки качества линейной модели
- •3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
- •3.2.7. Применение процедуры Регрессия для линейной модели
- •3.6. Вопросы для самопроверки
1.3.3. Оптимальное приближение эмпирической зависимости
Приближение рассматривается как оптимальное, если оно удовлетворяет изложенной постановке задачи аппроксимация эмпирической зависимости в условиях обсуждавшейся неопределенности и неоднозначности. Для этого требуется, прежде всего, установить само существование связи и, если она реальна, определить:
– меру расхождений и метод приближения;
– класс аппроксимирующей функции (некоторый функциональный ряд);
– порядок модели (число членов ряда);
– распределение остатков.
Решения этих проблем, необходимых для оптимального приближения, реализуются по определенным правилам, которые составляют целостную систему принципов и алгоритмов оптимальной аппроксимации эмпирических зависимостей, рассматриваемых далее отдельно для парных линейных, нелинейных и многомерных функций.
2. Основы линейного приближения стохастической зависимости
Линейное приближение является самым простым случаем стохастической связи.
2.1. Задача линейного приближения при парной связи
В задаче линейного приближения вид математических моделей предопределен.
2.1.1. Виды математических моделей парной линейной зависимости
Общее уравнение парной линейной зависимости имеет вид
y = ax + b, (2.1)
где: x – независимая; y – зависимая переменная; a и b – параметры (коэффициенты).
Частными случаями общего уравнения (2.1) являются:
y = ax при b = 0; (2.2)
y = b при a = 0; (2.3)
y = 0 при a = 0 и b = 0; (2.4)
x = 0 при a = 1, b = 0 и y = 0 (2.5)
Линейные зависимости, задаваемые уравнениями (2.1), (2.2), (2.3), (2.4) и (2.5), отображаются семейством линейных графиков (рис. 2.1).
Эмпирические данные x и y состоят из истинных, явно не выделенных, значений некоторых характеристик (регулярной составляющей), которые рассматриваются как детерминированные, и случайных отклонений (случайной составляющей), вызванных влиянием неучитываемых факторов и ошибками измерений x и y. При этом независимая переменная x полагается условно детерминированной, а ее случайные колебания переносятся на зависимую переменную y.
Рис.2.1. Графики зависимостей y = ax + b при различных значениях коэффициентов a и b
2.1.2. Неопределенность задачи построения линейной модели
Общая неопределенность задачи аппроксимации для линейной модели, несмотря на ее предопределенность (2.1), полностью не устраняется. Не определены, в частности:
– истинные значения эмпирических данных (их регулярные составляющие), зависимость которых моделируется;
– реальность (значимость) линейной зависимости между характеристиками x и y рассматриваемого явления (априорно это неизвестно);
– подходящая мера расхождений и метод оценки параметров a и b;
– состав формулы линейной зависимости (2.1), которая может иметь вид (2.2) – (2.5);
– оптимальность именно линейной модели, то есть ее предпочтительность по сравнению с нелинейной аппроксимацией;
– адекватность линейной модели искомой истинной зависимости.
Эти вопросы не имеют определенных и однозначных решений, и задача приближения парной эмпирической зависимости, даже в простейшем линейном случае, – problems under uncertainty (неопределенная задача), предполагающая построение оптимального решения.
Как указывалось, очень точное приближение к эмпирическим данным, отнюдь, не является оптимальным. Более того, слишком хорошее приближение к эмпирическим данным, содержащим ошибки измерения, указывает на несоответствие модели истинным значениям.