
- •Теория информационных процессов и систем
- •Санкт-Петербург
- •Содержание
- •Введение
- •Лабораторная работа № 1 Кластерный анализ
- •Задача 1. Метод k-средних.
- •Общая логика
- •Вычисления
- •Интерпретация результатов
- •Выполнение работы
- •Шаг 1. Загрузка файла данных
- •Шаг 2. Выбор метода анализа данных
- •Вывод результатов и их анализ
- •Задача 2. Иерархические алгоритмы.
- •Общая логика
- •Иерархическое дерево
- •Меры расстояния
- •Правила объединения или связи
- •Выполнение работы
- •Вывод результатов и их анализ
- •Задача 3.
- •Лабораторная работа № 2 Анализ временных рядов
- •Основные цели
- •Идентификация модели временных рядов
- •Анализ тренда
- •Анализ сезонности
- •Модель арпсс
- •Идентификация
- •Оценивание параметров
- •Оценивание модели
- •Экспоненциальное сглаживание
- •Сезонная и несезонная модели с трендом или без тренда
- •Задача 1. Определение тренда методом скользящих средних. Анализ сезонной составляющей.
- •Выполнение работы
- •Расчет сезонных индексов исходного ряда по аддитивной модели ряда
- •Расчет сезонных индексов исходного ряда по мультипликативной модели ряда
- •Задача 2. Прогнозирование по тренду и сезонной составляющей. Прогнозирование временного ряда методом экспоненциального сглаживания.
- •Выполнение работы
- •Дополнительно:
- •Задача 3.
- •Лабораторная работа № 3 Регрессионный анализ
- •Задача 1. Пошаговая регрессия.
- •Выполнение работы
- •Процедура пошаговой регрессии Backward stepwise:
- •Процедура пошаговой регрессии Forward stepwise:
- •Результаты регрессионного анализа:
- •Дисперсионный анализ:
- •Вычисление предсказанных значений доверительных интервалов:
- •Задача 2. Корреляционный анализ.
- •Выполнение работы
- •Задача 3. Нелинейная регрессия.
- •Выполнение работы:
- •Лабораторная работа № 4 Непараметрические методы математической статистики Основная цель
- •Краткий обзор непараметрических процедур
- •Выбор метода
- •Большие массивы данных и непараметрические методы
- •Задача 1. Таблицы сопряженности 22, статистики , , критерий Макнимара, точный критерий Фишера.
- •Выполнение работы
- •Задача 2. Статистика для сравнения наблюдаемых и ожидаемых частот.
- •Выполнение работы
- •Задача 3. Коэффициенты ранговой корреляции Спирмена и Кендалла.
- •Выполнение работы
- •Задача 4. Критерий серий Вальда-Вольфовица.
- •Выполнение работы:
- •Задача 5. Критерий Манна-Уитни.
- •Выполнение работы:
- •Задача 6. Однофакторный дисперсионный анализ Краскела-Уоллиса и медианный критерий.
- •Выполнение работы:
- •Задача 7. Критерий знаков. Критерий Вилкоксона для связанных пар наблюдений.
- •Выполнение работы:
- •Задача 8. Двухфакторный анализ Фридмана и коэффициент конкордации Кендалла.
- •Выполнение работы:
- •Задача 9. Q-критерий Кокрена.
- •Выполнение работы:
- •Лабораторная работа № 5 Однофакторный дисперсионный анализ
- •Цель дисперсионного анализа
- •Задача 1
- •Выполнение работы:
- •Задача 2
- •Выполнение работы:
- •Задача 3
- •Содержание отчета
- •Список литературы
- •Приложение 1 Пример оформления титульного листа лабораторной работы
Федеральное агентство по образованию
Государственное образовательное учреждение
высшего профессионального образования
«Санкт-Петербургский государственный
инженерно-экономический университет»
Кафедра информационных систем в экономике
УТВЕРЖДАЮ
Проректор
по учебно-методической работе
и качеству образования
д.э.н., профессор
_______________ В.И. Малюк
« » ____________ 2009 г.
Рег. № ______
Теория информационных процессов и систем
Методические указания по выполнению лабораторных работ
для студентов всех форм обучения
Специальность 230201 – Информационные системы и технологии
Санкт-Петербург
2009
Допущено
редакционно-издательским советом СПбГИЭУ
в качестве методического издания
Составитель
канд. техн. наук, доц. А.И. Краснова
Рецензент
д-р техн. наук, проф. В.Л. Горохов
Подготовлено на кафедре
информационных систем в экономике
Одобрено научно-методическим советом факультета
информационных систем в экономике и управлении
Отпечатано в авторской редакции с оригинал-макета,
представленного составителем
СПбГИЭУ, 2009
Содержание
Введение 4
Лабораторная работа № 1 5
Кластерный анализ 5
Лабораторная работа № 2 35
Анализ временных рядов 35
Лабораторная работа № 3 82
Регрессионный анализ 82
Лабораторная работа № 4 122
Непараметрические методы математической статистики 122
Лабораторная работа № 5 167
Однофакторный дисперсионный анализ 167
Содержание отчета 186
Список литературы 187
Приложение 1 188
Пример оформления титульного листа лабораторной работы 188
Введение
Основная цель лабораторных работ по дисциплине «Теория информационных процессов и систем» – изучение принципов описания информационных систем, количественных и качественных методов описания информационных систем, моделей информационных систем, типов информационных процессов и систем, основных принципов представления информации с использованием различных моделей информационных систем; формирование навыков применения теоретических положений дисциплины для решения практических инженерных задач.
Методические указания предназначены для студентов, обучающихся по специальности 230201 – Информационные системы и технологиии другим родственным специальностям.
Лабораторные работы выполняются на персональных компьютерах в операционной среде Windows с установленными программными продуктами STATISTICA, SPSS или STATGRAPH.
Лабораторная работа № 1 Кластерный анализ
Кластерный анализ (Data clustering) – задача разбиения заданной выборки объектов (ситуаций) на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.
Типы входных данных:
-
Признаковое описание объектов. Каждый объект описывается набором своих характеристик, называемых признаками. Признаки могут быть числовыми или нечисловыми.
-
Матрица расстояний между объектами. Каждый объект описывается расстояниями до всех остальных объектов обучающей выборки.
Цели кластеризации:
-
Понимание данных путём выявления кластерной структуры. Разбиение выборки на группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа (стратегия «разделяй и властвуй»).
-
Сжатие данных. Если исходная выборка избыточно большая, то можно сократить её, оставив по одному наиболее типичному представителю от каждого кластера.
-
Обнаружение новизны (novelty detection). Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.