ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ ИМ. ПРОФ. М.А. БОНЧ-БРУЕВИЧА»
(СПбГУТ)
КАФЕДРА СЕТЕЙ СВЯЗИ И ПЕРЕДАЧИ ДАННЫХ (СС и ПД)
Дисциплина: «Оптимизация и математические методы принятия решений»
Лабораторная работа №7.
Тема: «Оценка эффективности моделей
аппроксимации стохастических данных»
Вариант 16
Выполнил:
Студент группы ИКПИ-32
Иванов О. В.
Принял:
Владимиров С.А.
Подпись ______________
Цель работы
Научиться оценивать получаемые результаты математического моделирования. Приобрести навык проведения оценок эффективности и пригодности имитационных математических моделей. Освоить методики принятия решений по результатам статистического анализа стохастических данных произвольной природы в рамках их аппроксимации математическими моделями скользящего среднего и авторегрессии и скользящего среднего. Получить навык анализа статистических характеристик и применения общих критериев согласия при выполнении задания своего варианта.
Ход работы Файл а (нормальное распределение)
Описательные моменты входной последовательности:
Минимум: -167.98
1-й квартиль: -42.164
Медиана: -0.0184 (близка к нулю)
3-й квартиль: 40.436
Максимум: 194.70
Среднее: 0.6581 (близко к медиане, но есть небольшой сдвиг)
СКО (σ): 60.759
Асимметрия: 0.1166 (слабая правосторонняя асимметрия)
Эксцесс: 3.1073 (близко к нормальному распределению, где эксцесс = 3)
Дисперсия (σ²): 3691.6
Критерий Колмогорова-Смирнова
Для модели СС:
p = 0 (гипотеза H0 о совпадении распределений принимается).
ks = 0.2348 (значение статистики).
d = 0.0775 (расстояние между эмпирической и модельной функциями распределения).
Для модели АРСС:
p = 0 (гипотеза H0 принимается).
ks = 0.1731 (лучше, чем у СС).
d = 0.0725 (немного меньше, чем у СС).
Вывод: Обе модели не идеально описывают данные, но АРСС чуть лучше.
Критерий Хи-квадрат
Для модели СС и АРСС:
p = 0 (гипотеза H0 принимается).
kchi = 0.9396 (p < kchi)
chi2stat = 1.7693 (значение статистики).
df = 6 (степени свободы).
Наблюдаемые (O) и ожидаемые (E) частоты в интервалах приведены.
Вывод: Обе модели прошли тест, распределение частот близко. Обе модели в норме.
Критерий Пирсона
Для моделей СС и АРСС:
pval = 1 (гипотеза H0 принимается).
0.8562 (СС) и 0.8470 (АРСС)
Вывод: Модели практически не отличаются от исходных данных, но АРСС показывает себя чуть точнее.
Парный критерий Стьюдента
Для модели СС:
h = 0 (H0 принимается).
p = 0.3509 (нет значимой разницы в средних).
Для модели АРСС:
h = 0 (H0 принимается).
p = 0.5230
Вывод: Средние значения моделей и исходных данных значимо не отличаются, модель АРСС принимает несколько более точное значение.
Медианный критерий
Для модели СС:
p = 0.0801 (на границе значимости, но h = 0 — H0 принимается).
sign = 218 (количество наблюдений выше медианы).
Для модели АРСС:
p = 0.7263 (H0 принимается).
sign = 196 (близко к ожидаемому).
Вывод: Медианы моделей и исходных данных практически не отличаются, но АРСС чуть точнее.
Критерий Манна-Уитни-Вилкоксона
Для модели СС:
p = 0.6623 (H0 принимается).
z = 0 (нет сдвига).
Для модели АРСС:
p = 0.8286 (H0 принимается).
z = 0 (нет сдвига).
Вывод: Распределения моделей и исходных данных не имеют значимого сдвига.
Все шесть критериев не отклоняют нулевую гипотезу.
Итоговый результат
Обе модели (СС и АРСС) не идеальны, но:
АРСС лучше соответствует данным по KS-тесту и моментам.
СС хуже воспроизводит среднее и экстремумы.
Гипотезы о равенстве распределений не отвергаются, что означает, что модели статистически близки к исходным данным.
Модель с авторегрессией + скользящим средним (АРСС) проходит все критерии и даёт более правдоподобное распределение, хотя в одиночном прогоне немного увеличило дисперсию.
Скользящее среднее (СС) формально корректно, но проигрывает по ключевым критериям согласия и искажает форму хвостов.
АРСС является статистически эквивалентной исходному процессу и предпочтительна для дальнейшего моделирования.
Рис. 1 Гистограмма входных данных
Гистограмма входных данных
Описание графика:
Светло-голубые столбцы — гистограмма входного сигнала (основное распределение значений).
Зелёные столбцы — более детализированная гистограмма (с меньшим шагом/бином).
Синяя линия — эмпирическая плотность распределения (по выборке).
Красная кривая — теоретическая нормальная плотность распределения (с тем же средним и СКО, как у выборки).
Рис. 2 Функция плотности вероятности
На изображении показана функция плотности вероятности (ФПВ) случайного процесса.
Описание графика:
Гистограмма (голубые и зелёные столбцы):
Голубые столбцы — вероятностная гистограмма по всей реализации процесса. Это отражение распределения значений за весь период наблюдения.
Зелёные столбцы — вероятностные гистограммы для малых участков.
Синяя линия — это вероятностная эмпирическая плотность распределения, построенная по данным гистограммы с зелеными столбцами.
Красная линия — эмпирическая плотность распределения.
Рис. 3 Функция распределения
График: Функция распределения
Что изображено:
Синяя линия — эмпирическая функция распределения (EDF), построенная по входной выборке. Она показывает, какая доля значений наблюдений меньше или равна данной точке.
Зелёная линия — сглаженная эмпирическая функция распределения.
Рис. 4 Автокорреляционная функция
График: Автокорреляционная функция (АКФ)
Что изображено:
По оси абсцисс: значение задержки (лаг) ΔN от −N до +N
По оси ординат: коэффициент автокорреляции R(τ)
Синяя вертикальная линия в центре при τ=0— всегда равна 1, так как это автокорреляция сигнала с самим собой.
Все R укладываются в доверительную полосу ±0.10.
У стационарного процесса автокорреляция должна зависеть только от лагов, а не от времени. Если ACF быстро убывает к нулю — это признак стационарности. Если ACF долго затухает или убывает медленно — признак нестационарности, возможно, наличие тренда или цикличности. В данном случае ACF затухает, а значит, можно утверждать о стационарности процесса.
Рис. 5 ВКФ 2-х половин ВХ
График: ВКФ 2-х половин ВХ
Что изображено: — Это взаимная корреляционная функция (ВКФ) между двумя равными половинами входного сигнала (ВХ). — По оси X: сдвиг ΔN между двумя половинами. — По оси Y: коэффициент корреляции R от -0.2 до +0.2.
Вывод:
Две половины выборки статистически независимы.
Это признак эргодичности по корреляции: одна реализация уже даёт достоверную информацию.
Подтверждает, что входной процесс стационарен и эргодичен — его характеристики не зависят от временного положения сегмента.
На рис. 5 все значения R близки к нулю. Это значит, что две половины статистически эквивалентны и не содержат систематического сдвига.
Рис. 6 Графики "ВХ-А0", "СС", "АРСС"
Сравнение графиков "ВХ–A0", "CC", "АРСС"
Что показано:
Синий: входной сигнал минус среднее (ВХ–A0)
Красный: модель СС
Зеленый: модель АРСС Вывод:
АРСС (зеленый) ближе к исходному сигналу, чем СС (красный)
СС-сглаживание теряет резкие перепады АРСС точнее отражает детали сигнала
Рис. 7 Графики остатков шумов
Остатки шумов: (ВХ–A0)–CC и (ВХ–A0)–АРСС
Что показано:
Черный: ошибка модели СС
Зелёный: ошибка модели АРСС
Вывод:
Ошибки АРСС лежат ближе к нулю
Модель СС даёт большие отклонения АРСС имеет меньшую ошибку восстановления
Рис. 8 График СПМ моделей "СС" и "АРСС"
СПМ моделей СС и АРСС
Что показано:
Частотный спектр мощностей (СПМ)
Красный — СС, зелёный — АРСС
Вывод:
У АРСС — более сложная частотная структура, сохраняются пики
У СС — сглаженный спектр АРСС лучше сохраняет частотные особенности
Рис. 9 График ошибок апроксимации ДКП моделей "СС" и "АРСС"
Ошибки аппроксимации после ДКП
Что показано:
Разность после дискретного косинус-преобразования (ДКП) Вывод:
Ошибки у обеих моделей в пределах ±4e-14 — это численные погрешности Аппроксимация по ДКП выполнена почти идеально
Рис. 10 Исходные и экстраполированные данные по моделям "СС" и "АРСС"
Исходные и экстраполированные данные (СС и АРСС)
Что показано:
Сравнение исходных и синтезированных сигналов
Синий — вход, красный — СС, зеленый — АРСС Вывод:
АРСС лучше повторяет форму входа
СС «размывает» пики АРСС точнее экстраполирует.
Рис. 11 ВКФ исходного и экстраполированного массива по модели "СС"
ВКФ: входной и экстраполированный массив по СС
Вывод:
Пик в 0, остальное в пределах ±0.05
Шумоподобная картина Модель СС воспроизводит некоррелированный сигнал
Рис. 12 ВКФ исходного и экстраполированного массива по модели "АРСС"
ВКФ: входной и экстраполированный массив по АРСС
Вывод:
Пик в центре больше ≈ 0.85
Небольшая автокорреляция АРСС лучше сохраняет корреляционную структуру
Рис. 13 Функции распределения
Функции распределения
Что видно:
Чёрная — теоретическая функция
Синяя – эмпирическая функция
Зеленая – АРСС модель
Красная – СС модель
Вывод:
Все близки, но АРСС (зеленая) точнее
Рис. 14 Функции плотности вероятности
Плотность вероятности (PDF)
Что видно:
Синий — оригинал, зеленый — АРСС, красный — СС
Вывод:
АРСС ближе по форме к исходному
СС смещён и даёт сглаженные пики АРСС точнее описывает плотность
