
- •3 Эксперимент с моделью. Обработка результатов моделирования
- •3.1 Планирование экспериментов
- •3.1.1 Методы теории планирования
- •3.1.2 Стратегическое планирование эксперимента
- •3.2 Статистический анализ результатов моделирования
- •3.2.1 Оценивание вероятностных распределений и их числовых характеристик
- •3.2.2 Проверка адекватности моделей
- •Оценка качества имитационной модели
- •Оценка адекватности
- •3.2.3 Проверка устойчивости и чувствительности
- •3.2.4 Критерии согласия
- •Критерий Стьюдента
- •Критерий Фишера
- •Критерий согласия Колмогорова-Смирнова
- •3.3 Статистическое исследование зависимостей
- •3.3.1 Дисперсионный анализ
- •3.3.2 Корреляционный анализ
- •3.3.3 Регрессионный анализ
Критерий Стьюдента
Этот критерий служит для проверки гипотезы о равенстве средних значений двух нормально распределенных случайных величин Х и Y в предположении, что дисперсии их равны (хотя и неизвестны). Сравниваемые выборки могут иметь разный объем.
В качестве критерия используют величину t:
.
Величина t подчиняется распределению Стьюдента. Критическое значение критерия tкр определяется по таблице для выбранного значения числа α и числа степеней свободы k=n1+n2-2. Если вычисленное по указанной формуле значение t удовлетворяет неравенству t≥tкр, то гипотезу Но отвергают.
Критерий Фишера
Этот
критерий служит для проверки гипотезы
о равенстве дисперсий Dx
и Dy
при условии,
что X
и Y
распределены
нормально. В качестве контрольной
величины используется отношение
дисперсий
(большая
из
дисперсий
должна быть в числителе).
Величина
F
подчиняется
F-распределению
(Фишера) с
степенями свободы. Проверка гипотезы
состоит в следующем.
Для
величины
и величин
по таблице F-распределения
выбирают значения
.
Если
наблюдаемое
F,
вычисленное по выборке, больше этого
критического значения, гипотеза должна
быть отклонена с вероятностью ошибки
α.
Критерий согласия Колмогорова-Смирнова
При использовании этого критерия имеющуюся выборку (y1,…,yn) упорядочивают по возрастанию и строят следующую эмпирическую функцию распределения:
Контрольной является величина:
.
Гипотеза
Но:
отвергается, если вероятность попадания
соответствующего критерия в критическую
область оказывается меньше выбранного
исследователем уровня значимости α.
Критическое значение критерия, как и
предыдущих случаях, находится по таблице.
Разумеется, проведение вручную расчетов, необходимых для проверки статистических гипотез, требует значительных затрат времени и сил. Поэтому многие современные математические пакеты имеют в своем составе средства, позволяющие свести к минимуму число операций, выполняемых пользователем вручную.
3.3 Статистическое исследование зависимостей
Представление результатов моделирования в форме функциональной зависимости показателя эффективности от того или иного фактора является конечной целью моделирования системы. Решение этой задачи может усложняться из–за возникновения взаимовлияния факторов. Поэтому отыскание аналитических зависимостей, связывающих между собой различные параметры, фигурирующие в модели, может быть основано на совместном использовании группы методов математической статистики: дисперсионного, корреляционного и регрессионного анализа.
3.3.1 Дисперсионный анализ
Дисперсионный анализ применяется для решения задачи сравнения средних значений нескольких выборок. Если при проверке окажется, что их математические ожидания отличаются незначительно, то все выборки объединяются в одну, что существенно увеличивает информацию о свойствах исследуемой системы.
Постановка
задачи. Пусть
генеральные совокупности случайных
величин
имеют нормальное распределение и
одинаковую дисперсию. Необходимо по
выборочным средним значениям при
некотором уровне значимости проверить
нулевую гипотезу Н0
о
равенстве математических ожиданий (то
есть о независимости значений y
от значений исследуемого фактора
х).
Решение
задачи для однофакторного дисперсионного
анализа состоит в следующем. Пусть
интересующий нас фактор хj
имеет k
уровней. Для каждого из них получена
выборка значений наблюдаемой переменной
y:
,
где, к
– количество уровней фактора хj.
Оценим влияние фактора х факторной дисперсией Dx
,
где
средне
–
арифметическое
значение y.
Если
генеральная дисперсия
известна,
то для оценки случайности разброса
наблюдений необходимо сравнивать
с
,
используя F
– критерий.
При попадании наблюдаемого критерия
Fэ
в критическую область влияние фактора
х
считается значимым, а разброс значений
х
– неслучайным.
Если генеральная дисперсия неизвестна до проведения машинного эксперимента, то необходимо найти ее оценку.
Пусть
серия наблюдений на i
– том
уровне фактора х
имеет вид
где n
– число
повторных наблюдений на
i
–
том уровне.
Тогда на i-том
уровне среднее значение
а среднее значение по всем уровням
Общая выборочная дисперсия всех наблюдений
При этом разброс значений y определяется суммарным влиянием случайных причин и фактора x.
Задача дисперсионного анализа в том, чтобы разложить общую дисперсию на составляющие связанные со случайными и неслучайными причинами. Оценка генеральной дисперсии, связанной со случайными причинами
а оценка факторной дисперсии определяется выражением
Учитывая, что факторная дисперсия наиболее заметна при анализе средних значений на i-том уровне фактора, а остаточная дисперсия (дисперсия случайности) для средних значений в n раз меньше, чем для отдельных измерений. Тогда более точная оценка выборочной дисперсии
Многофакторный дисперсионный анализ позволяет оценивать влияние на наблюдаемую переменную уже не одного, а произвольного числа факторов и выбрать из группы факторов, участвующих в эксперименте, те, которые действительно влияют на его результат.
Необходимо отметить, что дисперсионный анализ может использоваться для оценки влияния факторов, имеющих как количественный, так и качественный характер, поскольку в уравнении дисперсионного анализа фигурируют не сами факторы, а только их «эффекты». В том случае, если все факторы носят количественный характер, взаимосвязь между ними и наблюдаемой переменной может быть описана с помощью уравнения регрессии.