
- •0. Лекция: Введение
- •1. Лекция: Понятие модели и моделирования:
- •1.1. Общее определение модели
- •1.2. Классификация моделей и моделирования
- •1.2.1. Классификация моделей и моделирования по признаку "характер моделируемой стороны объекта"
- •1.2.2. Классификация моделей и моделирования по признаку "характер процессов, протекающих в объекте"
- •1.2.3. Классификация моделей и моделирования по признаку "способ реализации модели"
- •1.3. Этапы моделирования
- •1.4. Адекватность модели
- •1.5. Требования, предъявляемые к моделям
- •2.1. Дискретные марковские процессы
- •2.2. Моделирование по схеме непрерывных марковских процессов
- •2.3. Схема гибели и размножения
- •2.4. Элементы смо, краткая характеристика
- •2.5. Моделирование смо в классе непрерывных марковских процессов
- •2.5.1. Многоканальная смо с отказами
- •2.5.2. Многоканальная смо с ожиданием
- •2.5.3. Одноканальная смо с ограниченной очередью
- •2.5.4. Одноканальная замкнутая смо
- •2.5.5. Одноканальная смо с конечной надежностью
- •2.6. Метод динамики средних. Сущность и содержание метода
- •2.7. Принцип квазирегулярности
- •2.8. Элементарные модели боя
- •2.8.1. Модель высокоорганизованного боя
- •2.8.2. Высокоорганизованный бой с пополнением группировок
- •2.8.3. Высокоорганизованный бой с упреждением ударов
- •2.8.4. Модель боя с неполной информацией
- •2.8.5. Учет запаздывания в переносе и открытии огня
- •3. Лекция: Статистическое моделирование:
- •3.1. Сущность имитационного моделирования
- •3.2. Общая характеристика метода имитационного моделирования
- •3.3. Статистическое моделирование при решении детерминированных задач
- •3.4. Моделирование равномерно распределенной случайной величины
- •3.5. Моделирование случайной величины с произвольным законом распределения
- •3.6. Моделирование единичного события
- •3.7. Моделирование полной группы несовместных событий
- •3.8. Моделирование совместных независимых событий
- •3.8.1. Определение совместных исходов по жребию
- •3.8.2. Последовательная проверка исходов
- •3.9. Моделирование совместных зависимых событий
- •3.10. Классификация случайных процессов
- •3.11. Способы продвижения модельного времени
- •3.12. Модель противоборства двух сторон
- •3.13. Модель противоборства как процесс блуждания по решетке
- •3.14. Типовая схема имитационной модели с продвижением времени по событиям
- •3.15. Имитационная модель системы массового обслуживания
- •4. Лекция: Планирование экспериментов
- •4.1. Сущность и цели планирования эксперимента
- •4.2. Элементы стратегического планирования экспериментов
- •4.3. Стандартные планы
- •4.4. Формальный подход к сокращению общего числа прогонов
- •4.5. Элементы тактического планирования
- •4.6. Точность и количество реализаций модели при определении средних значений параметров
- •4.6.1. Определение оценки матожидания
- •4.6.2. Определение оценки дисперсии
- •4.7. Точность и количество реализаций модели при определении вероятностей исходов
- •4.8. Точность и количество реализаций модели при зависимом ряде данных
- •4.9. Проблема начальных условий
- •5. Лекция: Обработка результатов имитационного эксперимента
- •5.1. Характеристики случайных величин и процессов
- •5.2. Требования к оценкам характеристик
- •5.3. Оценка характеристик случайных величин и процессов
- •5.4. Гистограмма
- •5.4. Элементы дисперсионного анализа. Критерий Фишера
- •5.6. Критерий Вилькоксона
- •5.7. Однофакторный дисперсионный анализ
- •5.8. Выявление несущественных факторов
- •5.9. Сущность корреляционного анализа
- •5.10. Обработка результатов эксперимента на основе регрессии
- •6. Лекция: Моделирование в gpss World
- •6.1. Основы построения и принципы функционирования языка имитационного моделирования
- •6.2. Построение моделей с устройствами
- •6.2.1. Организация поступления транзактов в модель и удаления транзактов из нее
- •6.2.1.1. Поступление транзактов в модель
- •6.2.1.2. Удаление транзактов из модели и завершение моделирования
- •6.2.1.3. Изменение значений параметров транзактов
- •6.2.2. Занятие и освобождение одноканального устройства
- •6.2.3. Имитация обслуживания посредством задержки во времени
- •6.2.4. Проверка состояния одноканального устройства
- •6.2.5. Методы сбора статистики в имитационной модели
- •6.2.5.1. Регистратор очереди
- •6.2.5.1. Статистические таблицы
- •6.2.6. Методы изменения маршрутов движения транзактов в модели
- •6.2.6.1. Блок transfer
- •6.2.6.2. Блок displace
- •6.2.7. Прерывание функционирования одноканального устройства
- •6.2.7.1. Прерывание в приоритетном режиме
- •6.2.7.2. Прерывание в режиме "захвата"
- •6.2.7.3. Проверка состояния одноканального устройства, функционирующего в приоритетном режиме
- •6.2.8. Недоступность одноканального устройства
- •6.2.8.1. Перевод в недоступное состояние и восстановление доступности
- •6.2.8.2. Проверка состояний недоступности и доступности одноканального устройства
- •6.2.9. Сокращение машинного времени и изменение дисциплин обслуживания методом применения списков пользователя
- •6.2.9.1. Ввод транзактов в список пользователя в безусловном режиме
- •6.2.9.2. Вывод транзактов из списка пользователя в условном режиме
- •6.2.10. Построение моделей систем с многоканальными устройствами и переключателями
- •6.2.10.1. Занятие многоканального устройства и его освобождение
- •6.2.10.2. Перевод многоканального устройства в недоступное состояние и восстановление его доступности
- •6.2.10.3. Проверка состояния многоканального устройства
- •6.2.10.4. Моделирование переключателей
- •6.3. Решение прямой и обратной задач в системе моделирования
- •6.3.1. Постановка прямой и обратной задач
- •6.3.2. Решение прямой задачи
- •6.3.2.1. Блок-диаграмма модели
- •6.3.2.2. Программа модели
- •6.3.2.3. Ввод текста программы модели, исправление ошибок и проведение моделирования
- •6.3.3. Решение обратной задачи
- •6.4. Пример построения моделей с оку, мку и списками пользователя
- •6.4.1. Модель процесса изготовления изделий на предприятии. Прямая задача
- •6.4.1.1. Постановка задача
- •6.4.1.2. Исходные данные
- •6.4.1.3. Задание на исследование
- •6.4.1.4. Уяснение задачи на исследование
- •6.4.1.5. Блок-диаграмма модели
- •6.4.1.6. Программа модели
- •6.4.2. Модель процесса изготовления изделий на предприятии. Обратная задача
- •6.4.2.1. Постановка задачи
- •6.4.2.2. Программа модели
- •6.5. Уменьшение числа объектов в модели
- •6.5.1. Постановка задачи
- •6.5.2. Исходные данные
- •6.5.3. Задание на исследование
- •6.5.4. Блок-диаграмма модели
- •6.5.5. Программа модели
- •6.6. Применение матриц, функций и изменение версий модели
- •6.6.1. Постановка задачи бизнес-процесса
- •6.6.2. Уяснение задачи
- •6.6.3. Программа модели
- •6.7. Моделирование неисправностей одноканальных устройств
- •6.7.1. Постановка задачи
- •6.7.2. Исходные данные
- •6.7.3. Задание на исследование
- •6.7.4. Уяснение задачи
- •6.7.5. Программа модели
- •6.8. Моделирование неисправностей многоканальных устройств
- •6.8.1. Постановка задачи
- •6.8.2. Программа модели
- •7. Лекция: Организация компьютерных экспериментов
- •7.1. Дисперсионный анализ (отсеивающий эксперимент). Прямая задача
- •7.2. Регрессионный анализ (оптимизирующий эксперимент). Прямая задача
- •7.3. Дисперсионный анализ (отсеивающий эксперимент). Обратная задача
- •7.3.1. Постановка задачи
- •7.3.2. Исходные данные
- •7.3.3. Задание на исследование
- •7.3.4. Уяснение задачи на исследование
- •7.3.5. Программа модели
- •7.3.6. Проведение экспериментов
- •8. Лекция: Разработка имитационных моделей в виде приложений с интерфейсом
- •8.1. Применение текстовых объектов и потоков данных
- •8.1.1. Блок open
- •8.1.2. Блок close
- •8.1.3. Блок read
- •8.1.4. Блок write
- •8.1.5. Блок seek
- •8.2. Разработка модели в gpss World
- •8.2.1. Постановка задачи
- •8.2.2. Программа модели
- •8.3. Создание стартовой формы приложения - имитационной модели
- •8.3 Добавление компонент в стартовую форму имитационной модели
- •8.3.1. Добавление полей редактирования
- •8.3.2. Добавление меток
- •8.3.3. Добавление компонент для ввода и вывода данных, представленных в виде таблиц
- •8.3.4. Добавление командных кнопок
- •8.4. События и процедуры обработки событий
- •8.4.1. События
- •8.4.2. Разработка процедур обработки событий для кнопок
- •8.4.3. Разработка процедур обработки событий для полей редактирования
- •8.4.4. Модификация программы имитационной модели
- •8.5. Работа с приложением
5.9. Сущность корреляционного анализа
Часто при исследовании объекта или его модели необходимо наблюдать за характеристиками двух и более случайных величин. Например, за двумя откликами одного эксперимента. При этом может возникнуть вопрос: есть ли связь между этими случайными величинами? Существенна или несущественна эта связь, если она есть?
Корреляционный анализ - это совокупность методов обнаружения зависимости (корреляции) между двумя или более случайными признаками или процессами.
Под корреляцией будем понимать статистическую зависимость между двумя случайными величинами, не имеющую, вообще говоря, строго функционального характера.
Заметим, что корреляционный анализ не позволяет определить вид функциональной связи между случайными величинами, а только наличие или отсутствие предполагаемой связи, например, линейной, параболической, экспоненциальной и т. д. В рамках этого учебного пособия мы ограничимся рассмотрением гипотезы о наличии линейной корреляции.
Определение вида функциональной связи между величинами рассматривается в регрессионном анализе, элементы которого и практическое использование будут рассмотрены в следующем п. 5.10.
Название "корреляционный анализ" происходит от латинского слова correlatio - согласование, связь, соотношение, взаимосвязь. Термин впервые введен Гальтоном (Galton) в 1888 г.
Обычно исследуют парную корреляцию, то есть зависимость между двумя случайными величинами (процессами), хотя возможны и более сложные ситуации, когда необходимо обнаружить наличие или отсутствие связей между тремя или более случайными величинами.
Мы ограничимся исследованием парной корреляции.
Как известно, связь между двумя случайными величинами можно описать с помощью двумерной функции распределения. Однако такое описание часто очень сложно, а для практических целей можно удовлетвориться определением зависимостей средних значений.
Итак, целью имитационного эксперимента является определение характеристик двух случайных величин и . Например:
|
|
Средний балл успеваемости учебной группы по математике |
Средний балл выполнения упражнения по стрельбе |
Рассеивание точки падения заряда по дальности |
Рассеивание точки падения заряда по боковому отклонению |
Вес курсантов (студентов). |
Успеваемость по физподготовке. |
Необходимо проверить: есть ли связь между величинами и ?
Проверка наличия (или отсутствия) связи - корреляции - между случайными величинами выполняется так.
Проводится два эксперимента, каждый - с соответствующей моделью. В каждом эксперименте - наблюдений (напоминаем, что компьютерный эксперимент состоит из наблюдений, а наблюдение - из реализаций (прогонов) модели, число которых рассчитывается с учетом требуемой точности и достоверности получаемых результатов моделирования). В результате экспериментов получаются два множества значений измеряемых параметров и : и , .
Из этих множеств формируются пары:
Каждая пара интерпретируется как координаты случайной точки в системе координат , .
Первичное исследование можно провести графически. Возможны следующие варианты размещения точек на графиках (рис. 5.5).
Корреляция - важное понятие. Научитесь визуально определять по расположению данных, насколько тесно они коррелированны.
Говорят, что две переменные положительно коррелированны, если при увеличении значений одной переменной увеличиваются значения другой переменной (рис. 5.5б).
Рис. 5.5. Графическое исследование корреляции
Две переменные отрицательно коррелированны, если при увеличении одной переменной другая переменная уменьшается (рис. 5.5в).
Отсутствие корреляции - совместного поведения переменных - обнаруживается хаотическим нагромождением точек, исключающим проведение какой-либо аппроксимирующей линии (см. рис. 5.5г).
Но такое качественное исследование недостаточно. Необходимо иметь количественную оценку степени корреляции между величинами и .
Если совместное распределение вероятностей случайных величин и нормальное, то количественной характеристикой степени линейной связи между ними является коэффициент корреляции r (введен Пирсоном (Pearson), 1896 г.):
Если
,
то между
и
линейная
независимость.
Равенство
свидетельствует
о наличии однозначной функциональной
связи между
и
,
то есть
.
При
между
и
существует
стохастическая связь, причем, чем ближе
коэффициент корреляции
к
единице, тем эта связь сильнее.
Стохастическая связь означает, что при
изменении
имеется
лишь тенденция к изменению
.
Коэффициент
корреляции
определяется
по данным эксперимента, следовательно,
можно определить только его оценку
.
В качестве оценки
принят
выборочный коэффициент корреляции:
где
оценки
математических ожиданий и
и
;
-
оценки среднеквадратических
отклонений
и
Выборочный
коэффициент корреляции
,
так же как и теоретический, принимает
значения:
.
Если
,
то наблюдается положительная корреляция
(см. рис.
5.5б).
Если
-
отрицательная корреляция (см. рис.
5.5в).
Если
-
линейная корреляция отсутствует (но не
исключена нелинейная). Если
,
то между случайными величинами существует
жесткая функциональная связь.
Заметим, что рассматриваемый коэффициент корреляции определяет степень линейной связи между случайными величинами и . Эта корреляция наиболее популярна, поэтому часто, когда говорят о корреляции, имеют в виду именно корреляцию Пирсона.
Однако этот линейный коэффициент корреляции не является пригодным для оценки нелинейной связи, если таковая присутствует. При нелинейной зависимости степень связи между случайными величинами устанавливается более сложными характеристиками, например, корреляционным отношением (К. Пирсон).
Числитель
выражения (5.1) иногда называют ковариацией -
.
Если
случайные величины
и
независимы,
они и не коррелированны
.
Но некоррелированность
и
не
всегда свидетельствует об их независимости.
Но если
и
имеют
нормальное распределение, то
условие
является
необходимым и достаточным условием
независимости этих величин.
И еще. Наличие корреляции между случайными величинами и не всегда свидетельствует об их взаимосвязи. Дело в том, что при независимости и каждая из них в отдельности зависит от некоторого случайного фактора , но эта зависимость нами не замечена.
Поэтому хорошим тоном после вычисления корреляций является построение диаграмм рассеяния, которые позволяют понять, действительно ли между двумя исследуемыми переменными имеется связь.
Оценка коэффициента корреляции должна быть определена с требуемыми точностью и достоверностью, которые зависят от числа реализаций модели. Найдем эту связь.
В предположении нормальности распределения можно написать:
С выражение (5.2) мы уже знакомы. Здесь:
- точное значение коэффициента корреляции;
-
среднеквадратическое отклонение
случайной величины
;
- аргумент функции Лапласа .
Обычно среднеквадратическое отклонение неизвестно, поэтому нужно брать ее оценку.
При
больших выборках
оценка
среднеквадратического отклонения
:
Из (5.2) следует:
- абсолютная величина ошибки.
Предварительное
определение
осуществляется
по данным пробного эксперимента в
количестве
реализаций
модели.
На основании изложенного и в силу случайного характера исследуемых величин и мы можем утверждать лишь следующее: истинное значение коэффициента корреляции лежит в пределах
с заданной достоверностью .
В заключение отметим, что если совместное распределение случайных величин и не является нормальным, то оценка коэффициента корреляции может выступать в качестве ориентировочной оценки степени тесноты связи и .
Пример 5.7 [2]. Для оценки конструкции нового крупнокалиберного пулемета было произведено 96 выстрелов по щиту, отстоявшему на расстоянии 300 метров.
Результаты отклонений попаданий от точки прицеливания (боковые , по высоте ) объединены в десятисантиметровые диапазоны и сведены в таблицу (табл. 5.9).
Для оценки конструктивных особенностей пулемета необходимо узнать: есть ли какая-то связь между боковыми отклонениями и отклонениями по высоте.
Решение
Ответ на поставленный вопрос может дать коэффициент корреляции. Предварительно заметим, что группировка измерений в десятисантиметровые диапазоны вносит некоторую ошибку в дальнейшие расчеты, однако можно показать, что при данной группировке ошибка несущественна.
В табл. 5.9 указаны не реальные отклонения, а центры диапазонов (-25…-15, -15…-5, -5…5 и т. д.).
Таблица 5.9. Отклонения от точки прицеливания |
||||||||
|
Боковые отклонения |
Всего |
||||||
-20 |
-10 |
0 |
10 |
20 |
30 |
40 |
||
-50 |
0 |
0 |
1 |
0 |
2 |
0 |
0 |
3 |
-40 |
0 |
1 |
1 |
1 |
2 |
0 |
0 |
5 |
-30 |
1 |
1 |
3 |
5 |
2 |
1 |
0 |
13 |
-20 |
1 |
3 |
7 |
3 |
2 |
2 |
0 |
18 |
-10 |
0 |
2 |
6 |
10 |
3 |
0 |
0 |
21 |
0 |
0 |
1 |
6 |
6 |
6 |
1 |
1 |
21 |
10 |
0 |
0 |
3 |
3 |
3 |
1 |
0 |
10 |
20 |
0 |
1 |
1 |
2 |
1 |
0 |
0 |
5 |
Всего |
2 |
9 |
28 |
30 |
21 |
5 |
1 |
96 |
Для определения коэффициента корреляции понадобятся следующие характеристики:
,
ковариация
.
Все эти характеристики вычисляются по данным измеренных отклонений боковых и по высоте .
Для
примера, расчет
:
Результаты расчета остальных характеристик:
Теперь оценка коэффициента корреляции:
Среднеквадратическое отклонение этой оценки:
Из-за
малого количества выстрелов
оценка
определена
с ошибкой, которая в предположении о
нормальном распределении случайной
величины
и
достоверности, например,
(
)
равна:
Отсюда следует, что истинное значение коэффициента корреляции лежит в пределах:
Обнаружена
небольшая линейная зависимость отклонений
боковых и по высоте. Баллистики, отвергая
непосредственную корреляцию между
отклонениями
и
,
объясняют значение
влиянием
конструктивных особенностей пулемета.
Обнаружена также систематическая ошибка
в прицеле:
,