
- •Язык имитационного моделирования gpssWorld
- •Базовые понятия системы имитационного моделирования gpssWorld.
- •Системные числовые атрибуты
- •Логические и условные операторы
- •Формат записи операторов языка gpss
- •Операторы, имитирующие работу динамической категории объектов.
- •Операторы, имитирующие работу аппаратной категории объектов.
- •Операторы, имитирующие работу статистической категории объектов
- •Операторы операционной категории
- •Блок выбора объекта из однородной совокупности объектов по заданному условию
- •Блоки, изменяющие маршрут движения транзактов.
- •Размножение транзактов.
- •Операторы вычислительной категории
- •Операторы, имитирующие работу группирующей категории
- •Операторы, имитирующие работу запоминающей категории
- •Примеры построения модели на языке gpssWorld
- •Пример №1
- •Пример №2
- •Пример №3
- •Пример №4
- •Пример №5
- •Пример №6
- •Редактор форм
- •Введение
- •Создание формы и указание модели
- •Ввод информации о модели
- •Настройка динамического мониторинга
- •Добавление пользовательского объекта мониторинга
- •Построение формы ввода одного эксперимента
- •Корневая панель
- •Команда «Надпись»
- •Команда «Группа»
- •Команда «Элемент управления вкладками»
- •Команда «Скрывающаяся панель»
- •Команда «Изображение»
- •Команда «Секция ввода»
- •Привязка к операнду
- •Связывание элемента диалога и элемента «надпись»
- •Добавление/удаление факторов
- •Команда «Выпадающий список»
- •Команда «Галка»
- •Команда «Кнопка»
- •Форма планирования экспериментов
- •Принципы планирования
- •Добавление факторов
- •Добавление показателей
- •Выбор серии экспериментов
- •Ручной план эксперимента
- •Автоматическое построение плана с использованием шага
- •Работа с exe-модулем
- •Ошибки во время моделирования
- •Анализ результатов
- •Открытие результатов
- •Анализ результатов моделирования одиночного эксперимента
- •Стандартный отчет
- •План полного факторного эксперимента.
- •План дробного факторного эксперимента
- •Планы второго порядка
- •Ортогональный центральный композиционный план
- •Ротатабельный центральный композиционный план
- •Планы Коно
- •Планы Кифера
- •Использование пакета Statistica10 для статистической обработки экспериментальных данных
- •Вычисление основных статистических характеристик
- •Оценка нормальности распределения
- •Необходимость проверки нормальности распределения анализируемых данных
- •Проверка на нормальность распределения анализируемых данных
- •Тесты Колмогорова – Смирнова и Шапиро – Уилка
- •График нормальных вероятностей
- •Корреляционный анализ
- •Коэффициент корреляции Пирсона
- •Коэффициент корреляции Спирмена
- •Факторный анализ
- •Выбор числа факторов
- •Кластерный анализ
- •Стандартизация данных
- •Кластерный анализ
- •Регрессионный анализ
- •Оптимизация
- •Пример моделирования предметной области и анализ результатов
- •Модель процесса сборки пк
- •Разработка модели процесса сборки пк
- •Моделирование процесса сборки пк
- •Настройки модели
- •Корреляционный анализ
- •Регрессионный анализ
- •Задание
- •Задание на лабораторную работу №1
- •Задания на лабораторную работу №2
- •Задание на лабораторную работу №3
- •Варианты заданий
- •Варианты первых заданий
- •Варианты вторых заданий
- •Варианты третьих заданий
Оценка нормальности распределения
Необходимость проверки нормальности распределения анализируемых данных
Как известно, существующие методы статистического анализа можно подразделить на две группы – параметрические и непараметрические. Важным условием, определяющим возможность применения параметрических методов, является подчинение анализируемых данных закону нормального (Гауссова) распределения. В то же время непараметрические методы выполнения этого условия не требуют. Применение параметрических методов анализа для ненормально распределенных признаков приводит к выводам, не соответствующим действительности. Во избежание указанной ошибки, любой анализ признаков должен сопровождаться проверкой нормальности их распределения.
Проверка на нормальность распределения анализируемых данных
Оценить соответствие анализируемых данных нормальному закону можно с помощью модуля «Statistics/Distributionfitting». В диалоговом окне этого модуля (рис. 5 .99) в списке непрерывных распределений (ContinuousDistributions) указывается тип распределения (Normal).
Рисунок 5.99. Диалоговое окно «Distribution fitting»
По нажатию кнопки «OK» будет отображено диалоговое окно настройки процесса оценки нормальности «FittingContinuousDistributions» (рис. 5 .100), где по кнопке «Variable» следует выбрать переменные для анализа (например, ID_UNEMPLAYMENT – индекс уровня безработицы).
Рисунок 5.100. Диалоговое окно «Fitting Continuous Distributions»
Нажав кнопку «Plot
of observed and expected distributions» (График наблюдаемого
и ожидаемого распределений), получим
гистограмму распределения данных о
индексе уровня безработицы и красную
кривую, соответствующую ожидаемому
нормальному распределению (у этого
ожидаемого распределения те же средняя
арифметическая и стандартное отклонение,
что и в анализируемой совокупности
данных) (рис. 5 .101). Глядя на полученный
рисунок, можно сказать, что в целом
распределение значений индекса уровня
безработицы соответствует нормальному.
Это заключение, основанное на визуальном
анализе распределения, имеет и более
строгое подтверждение в виде результатов
теста
(Chi-square test, см. в верхней части графика
на рис. 5 .101). В данном случае этот тест
проверяет нулевую гипотезу о том, что
наблюдаемое распределение анализируемого
признака не отличается от теоретически
ожидаемого нормального распределения.
Поскольку вероятность ошибиться,
отклонив эту гипотезу оказалась больше
0,05 (Р = 0,29541), мы принимаем, что гипотеза
действительно верна. Иными словами,
распределение значений индекса уровня
безработицы статистически не отличается
от нормального распределения.
Рисунок 5.101. Гистограмма распределения значений индекса уровня безработицы и ожидаемая нормальная кривая
Тесты Колмогорова – Смирнова и Шапиро – Уилка
Следует отметить,
что мощность теста
при проверке нормальности распределения
анализируемых данных относительно
невысока (другими словами, его применение
достаточно часто приводит к ошибочному
выводу о нормальности распределения).
Поэтому лучше воспользоваться и другими
тестами. Их можно найти в уже рассмотренном
выше модуле «Descriptive Statistics». После запуска
этого модуля необходимо открыть закладку
«Normality» и в поле «Distribution» (Распределение)
разыскать опции «Kolmogorov-Smirnov and Lilliefors
test for normality» (Тест Колмогорова-Смирнова
и Лиллифорса на нормальность) и
«Shapiro-Wilk’s W test» (W-тест Шапиро-Уилка).
Равно как и критерий
,
эти тесты проверяют нулевую гипотезу
об отсутствии различий между наблюдаемым
распределением фактора и теоретическим
ожидаемым нормальным распределением.
Наиболее предпочтительным, особенно
при небольших выборках (N= 3 ÷ 50) является использование W- критерия
Шапиро-Уилка, поскольку он обладает
наибольшей мощностью в сравнении со
всеми перечисленными критериями (т.е.
чаще выявляет различия между распределениями
в тех случаях, когда они действительно
есть). Для выбора того или иного теста,
достаточно поставить флажок рядом с
его названием. После выбора анализируемой
переменной (кнопка «Variables») и нажатия
кнопки «Histograms» программа создаст
гистограмму распределения значений
фактора и ожидаемую нормальную кривую
(рис. 5 .102). Результаты выбранных тестов
на нормальность автоматически
располагаются в заголовке этого графика.
ПриР> 0,05 можно заключить, что
анализируемое распределение не отличается
от нормального. В примере с данными об
индексе уровня безработицы для теста
Шапиро-Уилка получаемР= 0,45749 (рис. 5 .102),
что подтверждает сделанный ранее вывод
о нормальности распределения этих
данных.
Рисунок 5.102 Гистограмма распределения значений индекса уровня безработицы и ожидаемая нормальная кривая по критерию Колмогорова-Смирнова и Шапиро-Уилка