
- •Рецензенты:
- •Содержание
- •2.5. Программные приложения
- •Часть 1.
- •1.2. Формализация линейной модели наблюдений
- •Контрольные задания
- •2. Полный факторный эксперимент
- •2.1. Определение эксперимента
- •2.2. Определение полного факторного эксперимента
- •2.3. Полный факторный эксперимент 22
- •2.4. Полный факторный эксперимент 23
- •2.4. Полный факторный эксперимент 2k
- •Контрольные задания
- •3. Дробный факторный эксперимент
- •3.1. Определение дробных реплик
- •3.2. Выбор дробных реплик
- •Контрольные задания
- •4. Поиск экстремума функции отклика
- •4.1. Определение стратегии поиска
- •4.2. Метод крутого восхождения
- •4.3. Метод Бокса и Уильсона
- •4.4. Пример расчета крутого восхождения
- •Контрольные задания
- •5. Информационное обеспечение для задач планирования эксперимента
- •Часть 2. Обработка экспериментальных данных
- •6. Обработка статистических данных
- •6.1. Сведения из теории вероятностей
- •6.2. Применение нормального закона для оценки вероятности и проверки гипотез
- •6.3. Значимость оценки
- •1 Область больших положительных отклонений;
- •2 Область больших отрицательных отклонений;
- •3 Область больших по абсолютной величине отклонений (состоит из двух половин); 4 область малых по абсолютной величине отклонений
- •6.4. Формулы и алгоритмы для оценки результатов моделирования
- •Библиографический список
- •Библиографический список
6.3. Значимость оценки
6.3.1. Статистическая проверка гипотезы относительно вероятности. На практике при имитационном моделировании получают эмпирические результаты статистические данных, которые подлежат обработке.
Статистические данные при обработке аппроксимируют известными теоретическими распределениями, т.е. выдвигают гипотезу, то данное теоретическое распределение аппроксимирует эмпирическое распределение. Задача может состоять в определении вероятности (вероятностей) появления события или в поиске наиболее «подходящего» теоретического распределения непрерывной случайной величины. Например, необходимо проверить гипотезу относительно того, что при выполнении имитационного моделирования частость р*=m/N является оценкой вероятности р появления события.
Например,
пусть проверяется настройка станка на
среднюю точку поля допуска. Проведено
N=280
независимых испытаний и интересующее
нас событие появилось m=151
раз. Модель появления независимых
событий
биноминальное распределение. Если
гипотетическая вероятность события
р=1/2,
то математическое ожидание равно
Nр=280(1/2)=140,
а среднеквадратичное отклонение
биноминального распределения определится
из формулы
=8,37,
где q=1-р
вероятность не появления события. Надо
получить ответ на вопрос: можно ли
считать наблюденную частоту 151 достаточно
близкой к теоретической норме 140,
отвечающей гипотезе р=1/2.
Вначале следует выбрать границу допустимых при гипотезе отклонений частот (или частостей) от математического ожидания, как это было показано в предыдущем разделе.
Будет определено критическое отклонение, превышение которого при выдвинутой гипотезе настолько маловероятно, что его можно считать практически невозможным. Если превышение критического отклонения будет наблюдаться, то это указывает на несовместимость выдвинутой гипотезы с наблюдениями и говорят, что наблюденная частость значимо отклоняется от вероятности. Если фактическое отклонение меньше критической границы, то опыт не противоречит выдвинутой гипотезе и наблюденное отклонение можно объяснить случайностью испытаний.
На практике задают уровень значимости , т.е. вероятность практически невозможных отклонений. Эта вероятность обычно не превышает значение 0,05. Область больших отклонений, соответствующую уровню значимости , называют критической областью, а само правило проверки критерием значимости. Критическую границу для отклонений от теоретической нормы можно определить, пользуясь нормальным приближением к биноминальному закону. На рис.6.6 приведены двухсторонние критические границы для проверки гипотезы р=1/2.
Рис. 6.6
Вероятность 0,95 соответствует при нормированном нормальном распределении интервалу (-1,96, +1,96) около центра распределения, т.к. вероятность того, что абсолютная величина нормированного отклонения превысит значение 1,96, равна 0,05, т.е. Р(|A|>1,96)=Р(|m-Nр|>1,96)0,05, где m практическая частота.
Уровень значимости 0,01 соответствует границе 2,58, т.е.
Р(|A|>2,58)=Р(|m-Nр|>2,58)0,01.
Для рассмотренного выше примера настройки станка на среднюю точку поля допуска =8,37 и 5% критическая граница соответствует 1,968,37=16,41, а 1%-критическая граница соответствует 2,588,37=21,59.
Таким образом, область допустимых значений при 5%-критической границы определяется пределами
Nр1,96=14016,41,
а при области допустимых значений при 1%-критической границы определяется пределами Nр2,58=14021,6.
Если выдвинутая гипотеза, что наблюденная частота 151 достаточно близка к теоретической норме 140, отвечающей вероятности р=1/2, верна, то отклонение частоты от теоретической нормы в пяти случаях из 100 может превышать 16,4, и в одном случае из 100 может превышать 21,6. Так как в рассмотренном примере отклонение составило 151-140=11, т.е. оно находится в области допустимых значений, то нет оснований считать гипотезу р=1/2 противоречащей наблюдениям.
6.3.2. Общая задача проверки гипотез. При наличии явлений рассеивания признаков случайной величины требуется провести сравнительную оценку, причем обоснованный вывод может быть получен путем научно поставленного анализа статистических данных.
Данные рассматривают как некоторые выборки, информирующие о поведении случайных величин, и позволяющие делать определенные заключения о законах распределения этих величин.
Существуют некоторые выборки значений случайной величины А. Необходимо сделать заключение о законах распределения случайной величины А. Можно сделать предположение, что тип закона распределения известен, но неизвестны его параметры, т.е. проверка гипотезы сводится к сравнению статистических характеристик, оценивающих параметры выбранных законов распределения.
Для проверки гипотезы согласно критерию выбираются надлежащие уровни значимости (см. разд. 6.3.1) =5%, 2%, 1% и т.д., отвечающие событиям, которые при данном исследовании считаются практически невозможными. Затем определяется критическая область данного критерия, вероятность попадания в которую в точности равна уровню значимости , если гипотеза верна. Значения критерия, лежащие вне критической области, образуют дополнительную к ней область допустимых значений (незаштрихованная область на рис. 6.6).
Если /100 уровень значимости, то вероятность попадания критерия в область допустимых значений при справедливости выдвинутой гипотезы равна 1-/100. Если значение критерия, вычисленное по произведенным наблюдениям (опытам), окажется в критической области, то гипотеза отвергается. Если значение критерия окажется в области допустимых значений, что наблюденное значение критерия не противоречит гипотезе.
Чем меньше уровень значимости, тем меньше вероятность забраковать проверяемую гипотезу, когда она верна, т.е. совершить ошибку первого рода. С уменьшением уровня значимости понижается чувствительность критерия, т.к. расширяется область допустимых значений и увеличивается вероятность совершения ошибки второго рода, т.е. принятия проверяемой гипотезы, когда она не верна. Уровень значимости критерия проверки контролирует лишь ошибки первого рода и не измеряет степень риска, связанного с принятием неверной ошибки.
При заданном уровне значимости можно по разному устанавливать критическую область, гарантирующую этот уровень. Теоретическое определение критических областей было рассмотрено выше. Например, в качестве критерия рассматривается некоторый показатель, распределенный при проверяемой гипотезе нормально с плотностью распределения f(x;a;). В качестве критической области соответствующей уровню значимости =5% можно принять:
- область больших положительных отклонений так, что
Р(tq)=Р(x>a+tq)=0,05,
но
, (6.26)
тогда из таблицы значений нормированной функции Лапласа
определим:
- tq=1,65;
- область больших отрицательных отклонений
Р2(tq)=Р(x<a-tq)=Р(x<a-1,65);
- область больших по абсолютной величине отклонений
Р3(tq)=Р(|x-a|>tq)=0,05,
Определим tq из соотношения
(6.27)
так что tq=1,96;
- область малых по абсолютной величине отклонений
Р4(tq)=Р(|x-a|>tq)=2Ф0(z), (6.28)
так что tq0,063.
Эти области показаны на рис. 6.7.