
- •1. Введение в статистику связей случайных величин
- •1.1. Краткие сведения об используемых понятиях и терминах
- •1.1.1. Эмпирические данные
- •1.1.2. Стохастическая эмпирическая зависимость случайных величин
- •1.1.3. Математическая модель эмпирической зависимости и ее остатки
- •1.1.4. Зависимая и независимая переменные эмпирической зависимости
- •1.2. Основные методы построения стохастической зависимости
- •1.2.1. Корреляционный анализ
- •1.2.2. Регрессионный анализ
- •1.2.3. Меры расхождений и методы приближений
- •1.3. Задача аппроксимации и принципы оптимального решения
- •1.3.1. Постановка задачи аппроксимации эмпирической зависимости
- •1.3.2. Неопределенность и неоднозначность задачи аппроксимации
- •1.3.3. Оптимальное приближение эмпирической зависимости
- •2. Основы линейного приближения стохастической зависимости
- •2.1. Задача линейного приближения при парной связи
- •2.1.1. Виды математических моделей парной линейной зависимости
- •2.1.2. Неопределенность задачи построения линейной модели
- •2.1.3. Правила оптимального решения задачи линейной аппроксимации
- •2.2. Оценка реальности парной линейной связи и ее тесноты
- •2.2.1. Случайное рассеяние и неопределенность парной линейной связи
- •2.2.2. Корреляционное отношение – показатель тесноты связи
- •2.2.3. Ковариация – признак линейной стохастической связи
- •2.2.4. Коэффициент корреляции – показатель силы линейной связи
- •2.2.5. Коэффициент детерминации – показатель определенности связи
- •2.2.6. Интерпретация линейной корреляции
- •2.3. Методы определения параметров линейной модели
- •2.3.1. Суть и эффективность методов определения параметров модели
- •2.3.2. Максимально правдоподобные меры расхождения
- •2.4. Качество линейной модели эмпирической зависимости
- •2.4.1. Значимость и доверительные интервалы параметров регрессии
- •2.4.2. Доверительные интервалы линейной эмпирической зависимости
- •2.4.3. Дисперсия и доверительная область прогнозных оценок
- •2.4.4. Оценка адекватности линейной модели
- •3. Компьютерный практикум
- •3.1. Исходные данные для построения парной зависимости
- •3.1.1 Регулярная составляющая аукционных цен
- •3.1.1. Случайная составляющая аукционных цен
- •3.1.3. Линейное приближение зависимости и его приложения
- •3.2. Линейное приближение парной зависимости в Excel
- •3.2.1. Ввод данных
- •3.2.2. Оценка тесноты линейной связи
- •3.2.3 Построение регрессии процедурой вывода тренда на график
- •3.2.4. Вывод параметров линейной регрессии встроенными функциями
- •3.2.5. Оценки качества линейной модели
- •3.2.6. Оценка регрессии и ее качества встроенной функцией линейн
- •3.2.7. Применение процедуры Регрессия для линейной модели
- •3.6. Вопросы для самопроверки
1.3.2. Неопределенность и неоднозначность задачи аппроксимации
Задача аппроксимации эмпирических зависимостей предполагает решение неопределенных и неоднозначных проблем (Problems under uncertainty), состоящих в следующем.
1. Реальность стохастической связи априорно неясна. Если она отсутствует или очень слабая, то аппроксимация вообще не имеет смысла.
Проблемы состоят в том, что реальность связи в общем случае оценивается корреляционным отношением, которое, в свою очередь, определяется суммой квадратов остатков искомой модели. Получается замкнутый круг проблем, из которого, строго говоря, нет выхода: прежде, чем строить модель необходимо установить реальность связи, но это делается по остаткам модели, которой пока нет.
2. Регулярная составляющая эмпирических данных явно не задана. Приближение к ней осуществляется, путем оптимизации расхождений осложненных случайными отклонениями данных с моделью, и обеспечения согласия распределений остатков и случайной составляющей эмпирических данных.
Например, вес младенца увеличивается буквально ежедневно. Динамика веса является важным показателем развития и здоровья ребенка. Однако при построении графика веса по эмпирическим данным заметны случайные отклонения, вызванные, предшествующим приемом пищи, мочеиспусканием, может быть, стулом и ошибками взвешиваний и т.п. Для анализа развития и здоровья ребенка модель должна отражать не результаты взвешиваний, а их регулярную составляющую, которая явно не задана. При этом расхождения результатов взвешивания с графиком должны соответствовать указанным случайным отклонениям.
3. Мера расхождений и метод приближения не заданы. Аппроксимацию можно выполнить минимизируя обсуждавшиеся (5), (6), (7) и другие меры расхождений. Исходя из статистических характеристик исходных данных, выбирается наиболее подходящая мера.
Влияние меры расхождений и метода приближения на эмпирическую зависимость видно из аппроксимации степенным полиномом 2-го порядка одних и тех же данных (рис. 3).
Рис. 3. Графики эмпирической зависимости по случайным данным (1) методами: 2 – наименьших квадратов; 3 – минимакса (по Чебышеву); 4 – наименьших модулей
4. Истинная модель эмпирической зависимости неизвестна, для ее построения необходимо подобрать подходящую функцию. Формально приближению, удовлетворяют многие функции (множество функций-претендентов) в общем случае – функциональные ряды.
На рис. 4 пример эмпирической зависимости силы тока I от сопротивления нагрузки R при напряжении 220 20 В со случайными отклонениями по нормальному закону.
Рис. 4. Результаты аппроксимации эмпирической зависимости: 1– исходные данные; 2, 3, 4, 5, 6 – графики аппроксимирующих функций
Зависимость эмпирических данных (рис. 4 график 1) аппроксимирована функциями:
2) линейной в виде двух первых членов степенного ряда;
3) квадратичной в виде трех первых членов степенного ряда;
4) кубической в виде четырех первых членов степенного ряда;
5) экспоненциальной – из одного члена ряда
;
(8)
6) дробно-рациональной (закона Ома) – одного члена ряда
I
=
,
(9)
Все функции-претенденты с той или иной точностью удовлетворяют исходным данным, но линейная зависимость (рис.4, график 2) несколько нарушает общую тенденцию.
Наиболее подходящей, то есть близкой к истинной зависимости (1), является закон Ома (рис. 4, график 6). Однако, если природа эмпирической зависимости априорно неизвестна, то выбраковка других функций-претендентов не очевидна: требуется анализ приближения к явно незаданной регулярной составляющей и неизвестной истинной зависимости.
5. Количество членов аппроксимирующей функции подходящего класса, то есть порядок модели (степенного или другого ряда), который используется для приближения эмпирической зависимости, априорно неизвестен.
Закон Ома (1), отвечающий сущности обсуждавшейся эмпирической зависимости (рис. 4), является первым членом ряда дробно-рациональных функций (9), и правомерно поставить вопрос о подходящем числе m членов ряда.
В численном эксперименте при увеличении m мера расхождения (5) снижается с 0,39 для m = 1 до 0,20 для m = 6, (рис. 5, графики 2 и 3).
Если приближение в классе дробно-рациональных функций (9) принципиально не влияет на поведение аппроксимирующей функции, то приближение степенным рядом, при увеличении его порядка и снижении меры расхождения (5) с заданными исходными данными, сказывается на аппроксимирующих функциях (рис. 4, графики 2, 3, 4; рис. 5, график 4).
Рис. 5. Графики аппроксимации эмпирической зависимости:
1– исходные данные; 2 – функция (1); 3 – функция (9) при m = 6; 4 – степенной ряд 10 порядка
Степенной ряд 10-го порядка уменьшает меру расхождения до 0,16 в заданных точках, но между ними возникают нерегулярные (незакономерные) отклонения и разрывы (скачки), то есть суммирование всех членов является некорректным.
Следовательно, необходим выбор подходящего порядка аппроксимирующего ряда (его ограничение), то есть регуляризация по А.Н. Тихонову или ограничения по Р.И. Дубову.