Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Обработка данных / Томашевский_Имитационное моделирование в среде GPSS_2003.doc
Скачиваний:
189
Добавлен:
31.05.2015
Размер:
13.56 Mб
Скачать

9.6. Дисперсионный анализAnovAв планировании экспериментов

Для определения, является фактор значимым или нет, использу­ется дисперсионный анализ ANOVA(analysisofvariance), который применим только к количественным факторам.Cпомощью него определяются количественные отклонения наблюдений от среднего значения. Если какой-либо фактор не оказывает влияние на отклик, то он является незначимым.Cдругой стороны, если фактор влияет на отклик, то его (фактора) количественное значение сравниваютcоценкой изменчивости наблюдения, то есть со стандартной ошибкой.

Это делается для исключения эффектов, которые являются не более чем случайной флуктуацией.

Неявно в ANOVAиспользуется аддитивная математическая мо­дель, которая определяет компоненты изменения в наблюдениях. Ее называют статистической моделью. Самая простая статистическая модель:

т.е. каждое i-eнаблюдение представляет собой общее среднее по всем опытам μ, и случайную ошибкуeig. Bэтой модели общее среднее не изменяется от опыта к опыту, в отличие от ошибки.

Статистическая модель для анализа данных экспериментов cод­ним фактором А имеет следующий вид:

где αAi – главный эффект фактора А на уровнеi. Все наблюдения на данном уровне обработки анализируются, используя то же самое зна­чение дляαA. Так как в этом эксперименте имеется только один фак гор, число комбинаций обработки определяется числом уровнейIэтого фактора.

Для двух факторов общая модель факторного плана такова:

где αBjглавный эффект фактораВ на уровнеj;взаимодействие фактора А на уровнеi и фактораВ на уровнеj. Сумма эффектов двух факторов не равна сумме их отдельных эффектов из-за взаимодейст­вия между ними. Главный эффект фактора определяет долю участия фактора в значении функции отклика во время перехода егоcнижне­го уровня к верхнему.

Дисперсионный анализ, основанный на статистической модели (9.2), заканчивается построением таблицы ANOVA, в которой анали­зируется влияние факторовА, В, взаимодействие между факторамиAB и случайные помехи наблюдения.

CпомощьюANOVAпроверяется гипотеза об отсутствии влия­ния фактора. Если справедлива гипотеза об отсутствии влияния фак­тора, то считается, что все наблюдения получены из одной генераль­ной совокупности. Для проверки гипотезы используетсяF-распределение Фишера. Критерий Фишера определяет отношение двух выборочных дисперсий. Если фактор существенно влияет на отклик, то значенияF-распределения принимает большие значения иF-cтатистика становится значимой. Таким образом, большие значенияF приводят к отбрасыванию гипотезы об отсутствии влияния фактора, т.е. фактор являетсязначимым.

9.7. Библиотечная процедураAnova

Библиотечная процедура ANOVAсистемыGPSSWorldанали­зирует эксперименты от 1 до 6 факторов, включая взаимодействия 2-го и 3-го порядка между факторами.

На рис. 9.3 [19] представлена таблица ANOVA, полученная вGPSSWorld. Сначала рассмотрим среднюю часть таблицы. Полная сумма квадратов (Total) отделена от компонентов, связанныхcэффектами факторов и их взаимодействиями (А, В,AB). В строкеError(ошибка) приведена остаточная сумма квадратов. Средняя сумма квад­ратов (MeanSquare) остаточного члена используется для оценки стан­дартной ошибки эксперимента (в данном случае это величина 2,5).

Каждая сумма квадратов делится на число степеней свободы для уровней. Из статистических соображений степени свободы – это де­литель, который должен использоваться для получения несмещенной оценки стандартной ошибки. Для наших целей, достаточно представ­лять степени свободы как соответствующий делитель, связанный cсуммой квадратов в таблицеANOVA. СистемаGPSSWorldвсегда вычисляет степени свободы.

Каждый фактор и взаимодействие в статистической модели представлены отдельной строкой в верхней части таблицы ANOVA. В каждой строке указана сумма квадратов и число степеней свободы, связанныеcоценкой факторов и их взаимодействий. Это – основы, из которых получены другие числа. Частное от деления определяет средний квадрат ошибки, и в предпоследнем столбце таблицы выда­етсяF-статистика для этого эффекта.

Сделаем некоторые заключения. Необходимо решить, достаточ­но ли большое значение F-критерия получено для объявления эффек­та значимым. Пороговое значение, которое используется для сравне­ния, называется «критическим значениемF» и помещено справа отF-статистики в той же самой строке. Если полученное значениеF пре­вышает критическое значение, то делаем заключение, что имеем дело со значимым эффектом фактора. Если нет, то считаем, что эффект фактора незначимый и игнорируем любое связанноеc ним изменение в наблюдениях, считая, что оно вызвано случайными помехами. Представленная на рис. 9.3 таблицаANOVAпоказывает, что эффект фактора А значимый, А эффект фактораВ и взаимодействиеAB незна­чимы.

Иногда при выполнении эксперимента невозможно обнаружить эффект даже в том случае, если он фактически существует. Одна из задач эксперимента заключается в том, чтобы сделать это маловероятным. Из таблицы ANOVAвидно, что для получения лучших ре­зультатов необходимо иметь или большуюF-статистику или меньшее значениеF-критерия. Желательно удалить часть суммы квадратов ошибки из-за какого-либо важного эффекта, не включенного в ана­лиз. Если это можно сделать, тоF-статистика будет больше. Для это­го определяют дополнительные факторы, которые должны быть включены в эксперимент.

Puc. 9.3

Для увеличения степени свободы остаточного члена можно ис­пользовать два подхода. Первый просто увеличивает число повторе­ний в эксперименте. Этот подход обычно более дорогой, но может быть весьма эффективным. Второй касается плана эксперимента и статистической модели дисперсионного анализа. Средний квадрат ошибки – фактически остаточный член, оставшийся после удаления других квадратов. Если можно найти приемлемый способ, который позволит большему количеству данных оставаться после удаления эффектов, то получим оценку стандартной ошибки cбольшим числом степеней свободы. Окончательное значениеF-критерия будет умень­шаться при увеличении мощности анализа. При этом фактически иг­норируются некоторые из взаимодействий.

В многофакторных экспериментах для упрощения статистиче­ской модели и уменьшения количества экспериментов игнорируют взаимодействия самого высокого порядка. Например, статистическая модель cдвумя факторами без учета их взаимодействия имеет сле­дующий вид:

Если действительно эффектами этих взаимодействий можно пренебречь, то это позволит использовать дополнительные степени свободы для получения лучших оценки F-статистики. Кроме того, большее число степеней свободы означает также и меньшее значениеF-критерия. Однако необходимо понимать, что удаление членов из статистической модели предполагает, что не существует взаимодей­ствий более высоких порядков.

В GPSSWorldот учета взаимодействий высоких порядков мож­но отказаться, используя третий параметр процедурыANOVA. Ино­гда целесообразней учитывать только одну случайность. В этом случае для улучшения статистических оценок просто добавляются по­вторения наблюдений. Число повторений задается во втором пара­метре процедурыANOVA.

Для работы процедуры ANOVAей необходимо передать имяGPSS-матрицыcсохраненными результатами всех прогонов модели. Можно иметь несколько матриц результатов и для каждой их них вы­полнить эту процедуру. Любые матрицыGPSSWorldмогут иметь максимальную размерность 6, эта величина ограничивает максималь­ное число анализируемых факторов.

Прежде чем начать эксперимент, необходимо инициализировать элементы матрицы в НЕОПРЕДЕЛЕННОЕ (UNSPECIFIED) состоя­ниеcпомощью оператора:

INITIAL MyResuItMatrix,UNSPECIFIED

Этот оператор сообщает программе ANOVA, что эксперимент не был закончен.

Позиция в матрице результатов для каждого результата экспе­римента определена комбинацией уровней обработки, как было пока­зано в таблице 9.1. Например, если в эксперименте рассматривается 3 вида рабочих и два значения их численности (минимальное и макси­мальное) для каждого вида, то результат моделирования для третьего вида cмаксимальной численностью помещается в матрицу результа­тов в позицию [3, 2]. Так как число повторений указывается в третьем индексе матрицы, то результат первого прогона этой комбинации уровней обработки помещается в элемент [3, 2, 1] матрицы результа­тов. Каждое измерение в матрице результатов анализируется библио­течной процедуройANOVA, как фактор. Размерность матрицы ре­зультатов должна быть, по крайней мере, такой же, как и число уров­ней обработок этого фактора или максимальное рассчитанное число повторений. Нет никакого предела для числа уровней обработок фак­торов (вернее, предел накладывается только виртуальной памятью используемого компьютера).

Пример 9.2

В этом примере созданная матрица результатов может содержать результаты эксперимента c4-мя факторами (по числу заданных опе­рандов – В,C,D,E) илиcЗ-мя факторами (операнды В,C,D) и 10-ю повторениями прогонов (последний операнд). Фактор А может иметь до 8-х уровней обработок, факторВ может иметь до 5 и так далее.

Оператор INITIALустанавливает все элементы в матрице в со­стояниеUNSPECIFIED.

При обращении к процедуре ANOVAнадо задать 3 параметра. Первый – имя матрицы результатов, например,MyResults.

Второй необязательный параметр – размерность (индекс) мат­рицы результатов, которую нужно использовать для повторений. Каждый уровень в этой размерности представляет прогон cразличными начальными значениями случайных чисел. ПроцедураANOVAис­пользует информацию, связаннуюcчислом повторений прогонов для оценки стандартной ошибки. Чем больше повторений, тем больше число степеней свободы и тем точнее статистические результаты мо­делирования.

Некоторые экспериментальные планы не используют размер­ность повторения. В том случае второй параметр равен 0.

Третий параметр задает взаимодействия между факторами, ко­торые будут включены в статистическую модель. Если параметр ра­вен 2, то взаимодействия второго порядка будут включены в анализ. Если параметр равен 1, то взаимодействия не будут учитываться. При равенстве значения параметра 3 – взаимодействия 2-го и 3-го поряд­ков будут включены в статистическую модель. Взаимодействия более высоких порядков GPSSWorldне поддерживает. Еще раз отметим, что если при экспериментированииcмоделью не учитываются взаи­модействия между факторами, то это увеличивает число степеней свободы и улучшает оценки стандартной ошибки.

Главная цель процедуры ANOVAсостоит в создании стандарт­ной таблицыANOVA, где указывается окончательнаяF-статистика и ее критическое значение. Кроме того, при вызове процедурыANOVAиз программыPLUSпри завершении процедуры возвращается стан­дартная ошибка.