МИНОБРНАУКИ РОССИИ
Санкт-Петербургский государственный
электротехнический университет
«ЛЭТИ» им. В.И. Ульянова (Ленина)
Кафедра биотехнических систем
отчет
по лабораторной работе №1
по дисциплине «Моделирование биологических процессов и систем»
Тема: Временные ряды. Расчет скользящих статистик.
Студенты гр. 2503 |
|
Малышев К.А. |
|
|
Кузнецов Д.А. |
Преподаватель |
|
Палогианнидис Д. |
Санкт-Петербург
2025
Основные теоретические положения
Цель: изучение влияния размера окна фильтра скользящего среднего на результаты фильтрации (на примере 10-ти секундного тренда ЧСС).
Временной ряд (Time Series) – это последовательность значений, описывающих протекающий во времени процесс и измеренных в последовательные моменты времени (чаще - через равные промежутки).
Единица ряда называется измерением или отсчётом (иногда - уровнем). Во временном ряде для каждого отсчёта должно быть указано время измерения или номер измерения по порядку (индекс отсчета). Временной ряд отличается от простой выборки данных, так как при анализе учитывается взаимосвязь измерений со временем, а не только статистическое разнообразие и статистические характеристики выборки.
Временные ряды можно разделить на два класса: с постоянным временным промежутком между отсчетами (регулярный ряд) и с разными временными промежутками между отсчетами (нерегулярный ряд) (рис. 1).
Рисунок 1 – Регулярный и нерегулярный временные ряды
В первом случае для указания времени измерения используется индекс отсчета, во втором – его позиция во времени. Причем индекс отсчета соответствует позиции отсчета в массиве и не требует сохранения в отдельном свойстве, в отличии от позиции отсчета в нерегулярном ряде – это всегда дополнительное поле.
В данной работе рассмотрен пример анализа регулярного ряда. Он имеет следующие параметры:
1. Частота дискретизации, Fs (Гц).
2. Дата и время начала записи (время первого отсчета).
3. Единицы измерения.
Строго говоря, параметры 2 и 3 не являются обязательными. Но при работе с биологическими сигналами лучше переводить их в физические величины (мкВ, мм.рт.ст, мОм и т.д.) и рассматривать на временной сетке.
В этой лабораторной работе на примере анализа 10- тисекундного тренда ЧСС рассмотрим такой метод анализа временных рядов как скользящее среднее (moving average). Он может быть полезен при анализе данных, собранных в результате длительного мониторинга (например, за неделю) или же для визуальной демонстрации наблюдаемых в данных зависимостей.
Скользящее среднее сглаживает колебания, наблюдаемые в данных, и позволяет получить представление о тенденции или закономерности в данных. Полученный паттерн затем может быть использован в том числя для оценки будущих значений ряда (предсказание).
Скользящее среднее может определено несколькими способами, в частности:
1. Простое скользящее среднее (sma - Simple Moving Average)
Значение для SMA в любой момент времени может быть получено простым вычислением среднего значения за определенное количество периодов до этого момента времени (в окне). Например, 5-тиминутное простое скользящее среднее ЧСС означает среднее значение ЧСС за последние 5 минут.
где 𝑋𝑖 – значение i-го отсчета в окне, N – размер окна.
2. Взвешенное скользящее среднее (wma - Weighted Moving Average)
Формула для WMA использует разные веса для точек данных. Как правило, вес уменьшается с каждой точкой. Это позволит уменьшить факт «отставания от реальности».
где 𝑋𝑖 – значение i-го отсчета в окне, 𝑤𝑖 – значение i-го весового коэффициента, N – размер окна.
Выбор весов зависит от характера динамики исследуемого ряда. Например, веса могут возрастать линейно или экспоненциально. В случае линейно взвешенной скользящей средней 𝑤𝑖 = 𝑖.
Построению и простой, и взвешенной скользящих средних присущи два недостатка.
Первый из них проявляется в том, что при расчете их значений учитываются только те значения ряда, которые охвачены окном.
Второй недостаток заключен в самом принципе расчета средних значений – при продвижении окна на один интервал времени значение скользящей средней реагирует на изменение дважды: первый раз значение скользящей средней изменится при включении в нее нового отсчета, второй раз – при выбытии этого значения из порядка скользящей средней.
Снять эти недостатки, т.е. обеспечить возможность учета всех предшествующих текущему окну значений таким образом, что каждое новое значение скользящей средней не будет дважды реагировать на включение в нее новых значений, позволяет расчет экспоненциальной скользящей средней.
