- •Язык имитационного моделирования gpssWorld
- •Базовые понятия системы имитационного моделирования gpssWorld.
- •Системные числовые атрибуты
- •Логические и условные операторы
- •Формат записи операторов языка gpss
- •Операторы, имитирующие работу динамической категории объектов.
- •Операторы, имитирующие работу аппаратной категории объектов.
- •Операторы, имитирующие работу статистической категории объектов
- •Операторы операционной категории
- •Блок выбора объекта из однородной совокупности объектов по заданному условию
- •Блоки, изменяющие маршрут движения транзактов.
- •Размножение транзактов.
- •Операторы вычислительной категории
- •Операторы, имитирующие работу группирующей категории
- •Операторы, имитирующие работу запоминающей категории
- •Примеры построения модели на языке gpssWorld
- •Пример №1
- •Пример №2
- •Пример №3
- •Пример №4
- •Пример №5
- •Пример №6
- •Редактор форм
- •Введение
- •Создание формы и указание модели
- •Ввод информации о модели
- •Настройка динамического мониторинга
- •Добавление пользовательского объекта мониторинга
- •Построение формы ввода одного эксперимента
- •Корневая панель
- •Команда «Надпись»
- •Команда «Группа»
- •Команда «Элемент управления вкладками»
- •Команда «Скрывающаяся панель»
- •Команда «Изображение»
- •Команда «Секция ввода»
- •Привязка к операнду
- •Связывание элемента диалога и элемента «надпись»
- •Добавление/удаление факторов
- •Команда «Выпадающий список»
- •Команда «Галка»
- •Команда «Кнопка»
- •Форма планирования экспериментов
- •Принципы планирования
- •Добавление факторов
- •Добавление показателей
- •Выбор серии экспериментов
- •Ручной план эксперимента
- •Автоматическое построение плана с использованием шага
- •Работа с exe-модулем
- •Ошибки во время моделирования
- •Анализ результатов
- •Открытие результатов
- •Анализ результатов моделирования одиночного эксперимента
- •Стандартный отчет
- •План полного факторного эксперимента.
- •План дробного факторного эксперимента
- •Планы второго порядка
- •Ортогональный центральный композиционный план
- •Ротатабельный центральный композиционный план
- •Планы Коно
- •Планы Кифера
- •Использование пакета Statistica10 для статистической обработки экспериментальных данных
- •Вычисление основных статистических характеристик
- •Оценка нормальности распределения
- •Необходимость проверки нормальности распределения анализируемых данных
- •Проверка на нормальность распределения анализируемых данных
- •Тесты Колмогорова – Смирнова и Шапиро – Уилка
- •График нормальных вероятностей
- •Корреляционный анализ
- •Коэффициент корреляции Пирсона
- •Коэффициент корреляции Спирмена
- •Факторный анализ
- •Выбор числа факторов
- •Кластерный анализ
- •Стандартизация данных
- •Кластерный анализ
- •Регрессионный анализ
- •Оптимизация
- •Пример моделирования предметной области и анализ результатов
- •Модель процесса сборки пк
- •Разработка модели процесса сборки пк
- •Моделирование процесса сборки пк
- •Настройки модели
- •Корреляционный анализ
- •Регрессионный анализ
- •Задание
- •Задание на лабораторную работу №1
- •Задания на лабораторную работу №2
- •Задание на лабораторную работу №3
- •Варианты заданий
- •Варианты первых заданий
- •Варианты вторых заданий
- •Варианты третьих заданий
Оценка нормальности распределения
Необходимость проверки нормальности распределения анализируемых данных
Как известно, существующие методы статистического анализа можно подразделить на две группы – параметрические и непараметрические. Важным условием, определяющим возможность применения параметрических методов, является подчинение анализируемых данных закону нормального (Гауссова) распределения. В то же время непараметрические методы выполнения этого условия не требуют. Применение параметрических методов анализа для ненормально распределенных признаков приводит к выводам, не соответствующим действительности. Во избежание указанной ошибки, любой анализ признаков должен сопровождаться проверкой нормальности их распределения.
Проверка на нормальность распределения анализируемых данных
Оценить соответствие анализируемых данных нормальному закону можно с помощью модуля «Statistics/Distributionfitting». В диалоговом окне этого модуля (рис. 5 .99) в списке непрерывных распределений (ContinuousDistributions) указывается тип распределения (Normal).
Рисунок 5.99. Диалоговое окно «Distribution fitting»
По нажатию кнопки «OK» будет отображено диалоговое окно настройки процесса оценки нормальности «FittingContinuousDistributions» (рис. 5 .100), где по кнопке «Variable» следует выбрать переменные для анализа (например, ID_UNEMPLAYMENT – индекс уровня безработицы).
Рисунок 5.100. Диалоговое окно «Fitting Continuous Distributions»
Нажав кнопку «Plot of observed and expected distributions» (График наблюдаемого и ожидаемого распределений), получим гистограмму распределения данных о индексе уровня безработицы и красную кривую, соответствующую ожидаемому нормальному распределению (у этого ожидаемого распределения те же средняя арифметическая и стандартное отклонение, что и в анализируемой совокупности данных) (рис. 5 .101). Глядя на полученный рисунок, можно сказать, что в целом распределение значений индекса уровня безработицы соответствует нормальному. Это заключение, основанное на визуальном анализе распределения, имеет и более строгое подтверждение в виде результатов теста (Chi-square test, см. в верхней части графика на рис. 5 .101). В данном случае этот тест проверяет нулевую гипотезу о том, что наблюдаемое распределение анализируемого признака не отличается от теоретически ожидаемого нормального распределения. Поскольку вероятность ошибиться, отклонив эту гипотезу оказалась больше 0,05 (Р = 0,29541), мы принимаем, что гипотеза действительно верна. Иными словами, распределение значений индекса уровня безработицы статистически не отличается от нормального распределения.
Рисунок 5.101. Гистограмма распределения значений индекса уровня безработицы и ожидаемая нормальная кривая
Тесты Колмогорова – Смирнова и Шапиро – Уилка
Следует отметить, что мощность теста при проверке нормальности распределения анализируемых данных относительно невысока (другими словами, его применение достаточно часто приводит к ошибочному выводу о нормальности распределения). Поэтому лучше воспользоваться и другими тестами. Их можно найти в уже рассмотренном выше модуле «Descriptive Statistics». После запуска этого модуля необходимо открыть закладку «Normality» и в поле «Distribution» (Распределение) разыскать опции «Kolmogorov-Smirnov and Lilliefors test for normality» (Тест Колмогорова-Смирнова и Лиллифорса на нормальность) и «Shapiro-Wilk’s W test» (W-тест Шапиро-Уилка). Равно как и критерий, эти тесты проверяют нулевую гипотезу об отсутствии различий между наблюдаемым распределением фактора и теоретическим ожидаемым нормальным распределением. Наиболее предпочтительным, особенно при небольших выборках (N= 3 ÷ 50) является использование W- критерия Шапиро-Уилка, поскольку он обладает наибольшей мощностью в сравнении со всеми перечисленными критериями (т.е. чаще выявляет различия между распределениями в тех случаях, когда они действительно есть). Для выбора того или иного теста, достаточно поставить флажок рядом с его названием. После выбора анализируемой переменной (кнопка «Variables») и нажатия кнопки «Histograms» программа создаст гистограмму распределения значений фактора и ожидаемую нормальную кривую (рис. 5 .102). Результаты выбранных тестов на нормальность автоматически располагаются в заголовке этого графика. ПриР> 0,05 можно заключить, что анализируемое распределение не отличается от нормального. В примере с данными об индексе уровня безработицы для теста Шапиро-Уилка получаемР= 0,45749 (рис. 5 .102), что подтверждает сделанный ранее вывод о нормальности распределения этих данных.
Рисунок 5.102 Гистограмма распределения значений индекса уровня безработицы и ожидаемая нормальная кривая по критерию Колмогорова-Смирнова и Шапиро-Уилка