
- •Общие вопросы моделирования
- •1.1. Прогнозирование расчетных ситуаций
- •1.2. Общие сведения о моделировании систем
- •1.2.1. Виды моделирования
- •1.2.2. Математическое моделирование Виды математических моделей
- •Структурные математические модели
- •Функциональные математические модели
- •1.3. Подготовка данных и обработка результатов моделирования систем
- •1.3.1. Случайные величины, законы их распределения
- •1.3.2. Основные виды теоретических распределений
- •1.3.3. Определение параметров эмпирических распределений
- •1.3.4. Доверительные интервалы. Надежность. Обеспеченность
- •1.3.6. Подбор подходящего теоретического распределения Критерии согласия
- •1.4. Планирование эксперимента
- •1.4.1. Полный факторный эксперимент
- •1.4.2. Дробные реплики
- •1.4.3. Общая схема планирования эксперимента Крутое восхождение
- •Этапы планирования эксперимента
- •1.4.4. Стратегическое и тактическое планирование
- •Стратегическое планирование эксперимента
- •Тактическое планирование
- •1.5. Обработка и анализ результатов моделирования систем
- •1.5.1. Общие положения
- •1.5.2. Метод наименьших квадратов
- •Основы метода
- •Последовательность обработки данных
- •1.5.3. Практические приемы подбора кривых
- •1.5.4. Подбор эмпирических формул по кривым
1.3.6. Подбор подходящего теоретического распределения Критерии согласия
Для подбора подходящего теоретического распределения прежде всего следует построить экспериментальную кривую плотности распределения, после чего визуально выбрать похожую кривую из известных типов теоретических распределений. При построении экспериментальной кривой данные ранжируют в порядке возрастания, разбивают на группы, строят гистограмму, а по ней - экспериментальную кривую. Разумеется, что при наличии оснований отдать предпочтение тому или иному теоретическому закону распределения необходимость в построении экспериментальной кривой отпадает.
Выбрав тип предполагаемого теоретического распределения, выдвигают нулевую гипотезу о взаимном соответствии теоретического и экспериментального распределений, проверяют ее на заданном уровне значимости, используя критерии согласия.
При больших выборках (n >100) предпочтение следует отдавать критерию согласия Пирсона. Иногда этот критерий используют при существенно меньших выборках. Критерий Колмогорова— Смирнова дает хорошие результаты при n>30 и удовлетворительные при 100 > n >10. При n<10 лучшие результаты дает критерий Крамера - фон Мизеса. Эти рекомендации весьма приблизительны, так как каждый из критериев имеет свои сильные и слабые стороны, и относительно выбора между ними можно дать лишь самые общие указания.
Критерий Пирсона (хи-квадрат) применим только к сгруппированным данным. Рекомендуется, чтобы численность каждой группы (интервала) была не меньше 5. Если это не так, то смежные малочисленные группы следует объединять с соседними.
Разбив исходные данные на т интервалов (групп), для каждого интервала вычисляют:
экспериментальные частоты рi* = ni /n, где ni - количество данных, попавших в i-й интервал, п - общее количество данных (объем выборки);
теоретические частоты
,
найденные по таблицам
или формулам для выбранного типа
теоретического распределения;
экспериментальную величину
(1.54)
По таблицам квантилей распределения χ2 при заданном уровне значимости β (обычно 5%) и известном числе степеней свободы f находят теоретическое значение χ2. Число степеней свободы f равно количеству интервалов минус число независимых условий (связей), наложенных на экспериментальные частоты рi*. Примерами таких условий могут быть: равенство 1 суммы всех частот (такое условие накладывается всегда), совпадение статистического среднего с гипотетическим, совпадение дисперсий и т. п. Следовательно f=т–1-r, где т - число интервалов, 1 - отмеченное выше условие, r -число параметров, определяемых из опытных данных. Так, если предполагаемое распределение нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому f=т-1-r=т-1-2=т-3; при распределении по закону Пуассона, содержащему лишь один параметр λ, будем иметь r=1, поэтому f=т-1-2 =т—2. Если дополнительные условия (кроме первого) не наложены, то f = m -1.
При выполнении условия
(1.55)
считается, что при заданном уровне значимости (β=5%) функция распределения согласуется с экспериментальными данными.
Более жесткие требования по уровню значимости следует выдвигать с осторожностью. Увеличение доверительной вероятности уменьшает вероятность того, что незначимое различие будет принято за значимое и правильная функция будет отвергнута. Однако это увеличивает вероятность того, что значимое различие будет принято за незначимое.
Во избежание возможных ошибок первого и второго рода, в особенности, если согласование теоретических и эмпирических частот «слишком хорошее», следует проявлять осторожность. Например, можно повторить опыт, увеличив число наблюдений, воспользоваться другим критерием согласия, вычислить асимметрию и эксцесс и сопоставить их с известными для данного распределения.
Критерий Колмогорова - Смирнова определяется разностью максимальных абсолютных значений статистической функции распределения F* (х) и соответствующей теоретической функции распределения F(x), т. е.
(1.56)
Смирновым Н. В., а затем Колмогоровым А. Н. было доказано, что какой бы вид ни имела функция F(х), при неограниченном возрастании числа независимых наблюдений п вероятность неравенства
(1.57)
стремится к пределу
(1.58)
Для практического использования критерия составлена таблица квантилей, определенных из соотношения k (λа)=α, где функция распределения записана в несколько ином виде:
Схема применения критерия Колмогорова — Смирнова следующая.
По результатам п наблюдений строится (рис.1.18) статистическая функция распределения F* (х).
Рис. 1.18. К использованию критерия Колмогорова
На том же графике наносится предполагаемая теоретическая функция распределения F(x).
Определяется максимальная величина модуля разности ординат D и вычисляется величина λ=D .
С помощью таблицы по заданному уровню значимости β (доверительной вероятности α) находится значение λа. Если λ<λа, то теоретическое и экспериментальное распределения согласуются на заданном уровне значимости.