
- •9. Оформить отчет, содержащий необходимые измерения, записи, рисунки и выводы по результатам п.П. 2 – 8.
- •VIII. Методика работы с системой «эвриста»
- •8.1. Работа с данными
- •8.2. Работа с графиками
- •8.3.Методы обработки временных рядов
- •8.4. Оформление отчета
- •8.5. Помощь в системе.
- •Библиографический список
Лабораторный практикум по дисциплине
«Методы обработки данных»
VII. ЛАБОРОАТОРНЫЕ РАБОТЫ 5-6.
СОДЕРЖАНИЕ ЛАБОРАТОРНЫХ РАБОТ
Лабораторная работа №5
ЦЕЛЬ РАБОТЫ: изучение способов моделирования временных рядов, методов их визуального анализа и редактирования.
ЗАДАНИЕ:
1. Используя методическое описание системы «ЭВРИСТА» и системную помощь, ознакомиться с методами обработки временных рядов, представленными в пакете, возможностями пакета по моделированию, хранению, табличному и графическому представлению временных рядов, назначением пунктов главного меню и функциональных клавиш.
2. Смоделировать временной ряд Х, заданный моделью авторегрессии–скользящего среднего АРСС(1,1); параметры модели (по модулю меньше единицы) задать самостоятельно.
3. Используя интерпретатор формул, смоделировать временные ряды, заданные формулами:
ряд E005 EXP(0.005*CASE(500))+2*NOISE(500),
ряд SI002 SIN(0.002*2*pi*CASE(500))+NOISE(500),
ряд SI00015*SIN(0.0001*2*pi*CASE(500))+0.5*NOISE(500)+A,
где A имя столбца, содержащего ряд SIN(0.01*2*pi*CASE(500)).
Все смоделированные временные ряды сохранить в каталоге переменных.
4. Для любого из pядов провести визуальный анализ аномальных измерений, для этого:
создать основной график выбранного временного ряда;
найти и записать координаты двух выделяющихся точек (максимальное и минимальное значения) вручную и в автоматическом режиме поиска максимального и минимального измерений;
изменить способ вывода на экран, вызвав режим работы "ЛУПА", и исследовать в этом режиме две части ряда в окрестности экстремальных точек;
записать в память график ряда в целом и частей ряда.
5. Отредактировать выбранный в п.4 временной ряд, для чего:
аппроксимировать ряд полиномом первого или второго порядка;
в режиме табличного представления данных провести редактирование ряда:
а) введя вместо максимального измерения значение, полученное линейной интерполяцией соседних измерений,
б) введя вместо минимального измерения соответствующее значение из аппроксимирующей полиномиальной зависимости.
6. Сохранить отредактированные экспериментальные данные, для чего:
выделить блоки (10 – 20 значений ряда), содержащие новые значения, и сохранить;
вызвать сохраненные блоки данных и сделать надписи на рисунках (тип ряда, обозначения осей, номер группы, бригады).
7. Провести визуальный анализ наличия детерминированной компоненты (тренда) во временных рядах:
E005, SI002, SI0001
по исходным реализациям и по их сглаженным изображениям.
Сглаживание провести методом простого скользящего среднего с разным числом точек усреднения (например, n=10, 60, 99).
8. Сделать выводы о предполагаемом составе рядов и качестве оценивания тренда при разном количестве точек усреднения.
9. Провести выделение и удаление тренда, используя метод простого скользящего среднего (в тех рядах, где он обнаружен) с подходящим значением параметра сглаживания.
10. Провести повторный анализ свойств рядов с удаленным трендом различными способами: визуально и с помощью сглаженной реализации.
11. Оформить отчет, содержащий необходимые измерения, записи, рисунки и выводы по результатам п.п. 4 – 10.
Контрольные вопросы к лабораторной работе №5
1) Что представляет собой временной ряд (ВР)? Приведите примеры экспериментов, в которых получаются временные ряды.
2) В какой последовательности обычно проводится предварительная обработка ВР?
3) Какие задачи предварительной обработки ВР могут быть решены визуально?
4) Что такое аномальные измерения? Как выявить аномальные наблюдения во временном ряде? Какие особенности анализа можно отметить для временных рядов?
5) Как можно исследовать и обрабатывать аномальные измерения? Какие особенности анализа можно отметить для временных рядов?
6) Как выглядит типовая аддитивная модель ВР? Дайте определения типовым составляющим временного ряда.
7) Алгоритмы методов полиномиального и простого скользящего среднего.
8) Каково влияние параметра метода полиномиального и простого скользящего среднего? Какие значения параметра предпочтительны при анализе тренда?
8) Как процедура простого скользящего среднего (СС), может быть использована для обнаружения тренда? Как следует выбирать параметр сглаживания?
9) Влияет ли процедура СС на другие компоненты временного ряда? Если влияет, то, каким образом?
10) Как использовать процедуру сглаживания для обнаружения колебательной составляющей во временном ряде?
Лабораторная работа №6
ЦЕЛЬ РАБОТЫ: изучение методов предварительной обработки экспериментальных данных.
ЗАДАНИЕ:
Смоделировать временные ряды, используя формулы:
ряд E005 EXP(0.005*CASE(500))+2*NOISE(500)
ряд SI00015*SIN(0.0001*2*pi*CASE(500))+B+NOISE(500),
где B имя столбца, содержащего ряд SIN(0.2*2*pi*CASE(500))+2.
Проверить гипотезу о случайности наблюдений в рядах данных, используя критерии инверсий, серий, Up&Down и поворотных точек для всех рядов.
Сделать вывод о независимости наблюдений в исследуемой реализации и о возможном альтернативном предположении, если гипотеза о случайности отвергнута.
Исследовать стационарность рядов, возможно включающих тренд, используя ряд оценок математического ожидания и дисперсии, рассчитанные в 10 последовательных блоках по 50 точек и критерии проверки случайности.
Для исходных рядов, предположительно содержащих тренд, рассчитать математическую модель тренда в виде линейной полиномиальной регрессии, предварительно оценив порядок полинома К>1.
Для этого выполнить следующие действия:
рассчитывать последовательно ряды разностей первого, второго,...,R–ого порядков, записывать их в каталог и рассчитывать оценки математического ожидания и дисперсии рядов разностей;
рассчитать оценки дисперсии исходного ряда, полученные по оценкам дисперсий рядов разностей,
анализируя полученные оценки принять решение о порядке полинома К.
5. Оценить тренд, построив:
полиномиальную регрессию выбранного порядка К, выделить его и записать в каталог;
простую линейную. регрессию (y=β0+β1*t) и нелинейную регрессию на основе экспоненциальной базисной функции (y=β0+β1*EXP(t));
проанализировать значимость оценок параметров всех моделей тренда.
6. Выделить тренды и вывести на один рисунок оценки всех трендов, полученных разными методами для одного ряда.
7. Удалить обнаруженные и оцененные тренды из рядов, провести повторный анализ наличия тренда и качества удаления тренда различными способами.
8. Провести начальный статистический анализ рядов с удаленным трендом, рассчитав оценки основных числовых характеристик, проверив гипотезу о нормальности и подобрав вид распределения, если гипотеза о нормальности отвергнута.
9. Оформить отчет, содержащий необходимые измерения, записи, рисунки и выводы по результатам п.П. 2 – 8.
Контрольные вопросы к лабораторной работе №6
1) Какие способы обнаружения тренда во ВР вы знаете?
2) Можно ли использовать критерии проверки независимости отсчетов временного ряда для обнаружения тренда?
3) Для чего нужна проверка независимости отсчетов ВР? Какие критерии применяются для проверки этого свойства? Какие особенности критериев можно указать?
4) Алгоритм проверки независимости отсчетов временного ряда с использованием:
а) критерия инверсий, его особенности,
б) критерия серий, его особенности,
в) критерия Up&Down,
г) критерия поворотных точек, его особенности.
5) Дайте определение свойства стационарности случайного процесса. Какие методы применяются для проверки стационарности?
6) Можно ли использовать методы анализа стационарности ВР для обнаружения аддитивного тренда? Если можно, то, каким образом?
7) Приведите алгоритм анализа степени полинома методом переменных разностей.
8) Укажите достоинства и недостатки метода переменных разностей.
9) Зачем выделяют тренд из временного ряда? Как выделить тренд из временного ряда?
10) Каковы недостатки описания тренда полиномом ряда в целом ? Какие модели тренда могут быть использованы?
VIII. Методика работы с системой «эвриста»
В данном разделе приводится краткое описание возможностей системы «ЭВРИСТА» и руководство для ее практического использования при работе с экспериментальными данными. Само название системы – «ЭВРИСТА», что означает Экспериментальные Временные Ряды: Интерактивный Статистический Анализ, показывает, что система предназначена для обработки данных, зависящих от времени. Пакет программ представляет собой большую исследовательскую систему для IBM совместимых компьютеров и включает набор методов, необходимый для прикладного анализа экспериментальных данных в различных областях. Система предназначена для работы в среде WINDOWS и разработана в Центре Статистических исследований и Лаборатории статистического анализа МГУ.
Вся работа в системе организуется с помощью главного горизонтального меню, основными разделами которого являются:
Данные – создание новых переменных, открытие и создание списка рабочих переменных, импорт и экспорт данных.
Таблица – просмотр и редактирование рабочих переменных, вызов калькулятора и интерпретатора формул.
Граф – создание и редактирование графических окон.
Метод – перечень методов статистической обработки временных рядов.
Проект – создание, открытие и редактирование проекта, представляющего собой заданную последовательность методов.
Счет – выполнение расчетов по выбранному методу.
Результаты – сохранение результатов расчетов и работа с текстовыми файлами.
Окно – проведение стандартных действий с окнами.
Опции – задание и редактирование настроек системы, определение рабочего каталога.
Помощь – справочная информация о работе системы и используемых методах.
Файл – создание и редактирование текстовых файлов.
Редактирование – стандартные операции редактирования текстовых файлов.
Знакомство с основными разделами мы проведем на примерах выполнения стандартных операций с данными, необходимыми при выполнении лабораторных работ.