Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МУ по КП по мод-нию.doc
Скачиваний:
60
Добавлен:
15.03.2016
Размер:
1.06 Mб
Скачать

2.8.1 Статистический анализ

1 - Математическое ожиданиепоказывает те значения, к которым должны стремиться все результаты проведенных опытов.

, (12)

где n - объем выборки, - значение случайной величины.

Пример.

;

,

где n =100 - объем выборки;

X1- начальная концентрация сусла;

X2-температура сусла.

- значение исследуемого параметра, полученное в -ом опыте.

Далее приводятся выводы по рассчитанным математическим ожиданиям по каждому опыту.

2 - Дисперсияявляется числовой характеристикой разброса случайной величины относительно ее математического ожидания и вычисляется по формуле

. (13)

Пример.

Далее приводятся выводы по рассчитанной дисперсии по каждому опыту.

3 - Среднее квадратичное отклонение(стандартное) является мерой стабильности результатов наблюдения и вычисляется по формуле

. (14)

Пример 5.

Далее приводятся выводы по рассчитанным стандартным отклонениям по каждому опыту.

4 - Коэффициент вариациипоказывает насколько полно среднее арифметическое представляет свой вариационный ряд и вычисляется по формуле

. (15)

Пример 6.

Далее приводятся выводы по рассчитанным коэффициентам вариации по каждому опыту.

Результаты статистического анализа сводятся в таблицу (таблица 2.4).

Таблица 2.4 – Результаты вычислений статистического анализа

M[x]

D[x]

σ[x]

K

x1

x2

x1

x2

x1

x2

x1

x2

1

10,4569

101,23564

0,000212

0,000062

0,01459

0,007858

0,1213%

0,1345%

2

3

4

5

6

7

8

9

10

5 – Коэффициент корреляции – указывает тесноту связи между исследуемыми характеристики.

,

если =0, тоXi и Yi не коррелируют, если =±1, то междуXi и Yi существует прямая пропорциональность:

.

6 – Правило «трех сигм» - ошибка измерения заключена между -3σ и +3σ, т.е.

.

7 – Вероятность ошибки измерения

.

8 – Среднеквадратическая ошибка арифметического среднего

.

9 – Т – статистика (t – критерий), определяет значимость коэффициентов уравнения регрессии

j=1, …,k;i=1, …,k.

;,

где l – количество опытов.

; ;

тогда.

2.8.2 Корреляционный анализ устанавливает, насколько тесна связь между двумя и более случайными величинами. Такой анализ сводится к оценке разброса значений случайной величины  (формирующие массив Y) относительно среднего , т.е. к оценке силы корреляционной связи. Существование этих связей и их тесноту можно выразить при наличии линейной связи между исследуемыми характеристиками и нормальности их совместного распределения.

Пусть результаты моделирования получены при N реализациях, а коэффициент корреляции

.

Полученный при этом коэффициент корреляции . При сделанных предположенияхr=0 свидетельствует о взаимной независимости случайных величин  и , исследуемых при моделировании. При имеет место функциональная (нестохастическая) линейная зависимость вида

,

причем, если r>0, то говорят о положительной корреляции, т.е. большие значения одной случайной величины соответствуют большим значениям другой. Случай 0<r<1 соответствует либо наличию линейной корреляции с рассеиванием, либо наличию нелинейной корреляции результатов моделирования.

Корреляционный анализ должен проводиться по всем исследуемым факторам, влияние которых на выходную характеристику считается сущестенным.

Пример 7.

Для случайной пары величин начальной концентрации сусла на входе и конечной концентрации сусла на выходе коэффициент корреляции =0,863148. График корреляции для случайной пары величин конечной концентрации сусла и начальной концентрации сусла представлен на рисунке 2.3 и свидетельствует о линейной зависимости с рассеиванием.

Рисунок 2.3 – График корреляционной зависимости конечной концентрации сусла на выходе от начальной концентрации сусла

2.8.3 Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе работы имитационной модели. Под наилучшим понимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента. С этой целью используется метод наименьших квадратов, описанный в п. 2.4.3, где цель – получить выражение (5) с требуемыми коэффициентами b0 и b1. При этом получается выражение

. (16)

Ошибка ei для каждой экспериментальной точки определяется как расстояние по вертикали от этой точки до линии регрессии (16). Выражение для ошибки будет иметь вид

,

а функция ошибки

,

используя (9) вычисляем коэффициенты.

Мерой ошибки регрессионной модели служит среднеквадратичное отклонение

.

Для нормально распределенных процессов приблизительно 67% точек находятся в пределах одного отклонения σe от линии регрессии и 95% точек - в пределах e. Для проверки точности оценок b0 и b1 регрессионной модели могут быть использованы, например, критерии Фишера (F-критерий) и Стьюдента (t-распределение). Аналогично могут быть оценены коэффициенты уравнения регрессии и для случая нелинейной аппроксимации.

Пример 8.

График регрессии для случайной пары величин начальной и конечной концентрации пива показан на рисунке 2.4. Выражение, описывающее зависимость конечной концентрации пива от начальной концентрации:

Рисунок 2.4 - График регрессии для конечной и начальной концентрации сусла

График регрессии для конечной концентрации сусла и температуры сусла показан на рисунке 2.5.

Рисунок 2.5 - График регрессии для конечной концентрации сусла и

температуры сусла

.

В результате имеем систему уравнений:

Преобразовав систему уравнений получим уравнение линии регрессии:

.

Сравнив данное уравнение с уравнением, полученным при планировании эксперимента, она имеет ту же зависимость.

В нашем случае ошибка регрессионной модели (среднеквадратичное отклонение) равна σ=0,862 и показывает, что в интервал 2σ попадает 91% точек нормально распределенной последовательности.

2.8.4 Дисперсионный анализ используется, когда при обработке и анализе результатов моделирования ставится задача сравнения средних значений выборок.

Допустим, изучаемый фактор Х привел к выборке значений неслучайной величины Y следующего вида: y1, y2, , yk, где k – количество уровней фактора Х.

Влияние фактора Х опишем неслучайной величиной Dx, называемой факторной дисперсией:

,

где - среднее арифметическое величиныY.

Пусть серия наблюдений на уровне yi имеет вид: yi1, yi1, , yin, где n – число повторных наблюдений на i-м уровне. Тогда на i-м уровне среднее значение наблюдений определяется как

,

а среднее значение наблюдений по всем уровням

.

Пример 9.=0,323.

Тогда общая выборочная дисперсия всех наблюдений равна

.

Пример 10. Sв2=0,003.

При этом, разброс значений Y определяется суммарным влиянием случайных причин и фактора Х.

Задача дисперсионного анализа состоит в том, чтобы разложить общую дисперсию D[y] на составляющие, связанные со случайными и неслучайными причинами.

Оценка генеральной дисперсии, связанной со случайными факторами

,

а оценка факторной дисперсии

.

Пример 11. =0,325.

Так как факторная дисперсия наиболее заметна при анализе средних значений на i-м уровне фактора, а остаточная дисперсия (дисперсия случайности) для средних значений в n раз меньше, чем для отдельных измерений, найдем более точную оценку выборочной дисперсии вида

.

Умножив обе части этого выражения на n, получим в правой части выборочную дисперсию Sв2 , имеющую (k-1) степеней свободы. Влияние фактора Х будет значимым, если при заданном  выполняется неравенство

.

В противном случае влиянием фактора Х на результаты моделирования можно пренебречь и считать гипотезу о равенстве средних значений на различных уровнях справедливой.

Таким образом, при помощи дисперсионного анализа можно проверять гипотезу о тождественности выборочной и генеральной дисперсий.

Пример 12. F1-γ=2,68 выбираем из таблиц.

Так как 0,003/0,325=0,01<2,68, то примем, что влияние фактора Х является значимым.

2.8.5 Анализ модели на адекватность. Если результаты моделирования подтверждаются и могут служить основой для прогнозирования процессов, протекающих в исследуемых объектах, то говорят, что модель адекватна объекту. При этом адекватность модели зависит от цели моделирования и принятых критериев.

Задача проверки адекватности модели заключается в построении критерия для проверки нулевой гипотезы Н0.

1 - Критерий согласия Пирсона (критерий 2). Распределение Пирсона. Н0 – о виде распределения.

,

где - количество значений случайной величины, попавших в i-й подинтервал;

- вероятность попадания случайной величины  в i-й подинтервал, вычисленный из теоретического распределения;

d - количество подинтервалов, на которые разбит интервал измерения.

Была выдвинута гипотеза H0 o том, что полученные интервалы времени на набор строк задания подчиняются нормальному закону распределения. По вычисленному U=2, числу степеней свободы k=d-r-1 (r – число параметров теоретического закона распределения) и таблиц (приложение А, таблица А.1) находят вероятность . Если эта вероятность превышает некоторый уровень значимости, то гипотеза Н0 принимается.

2 - Критерий согласия Кокрена (Y - критерий). Распределение Кокрена. Н0 – однородность выборки. Используется следующая формула:

,

где - максимальная из всех дисперсий параллельных опытов;

- оцениваемая дисперсия.

По вычисленному Y, числу степеней свободы k=N-1 и таблиц (приложение А, таблица А.3) находят - табличные значения. Гипотеза Н0 применяется, если при некотором уровне значимости.

3 - Критерий согласия Колмогорова. Н0 – о виде распределения.

В качестве меры распределения случайной величины используется D, вычисленная по формуле

.

Из теоремы Колмогорова следует, что ,и имеет функцию распределения

, z>0.

Если вычисленное на основе экспериментальных данных значение  меньше, чем табличное при выбранном уровне значимости , то гипотезу Н0 принимают. В противном случае расхождение между FЭ(y) и F(y) считается неслучайным и Н0 отвергают.

Данный критерий целесообразно применять в тех случаях, когда известны все параметры теоретической функции распределения.

4 - Критерий согласия Чеснокова. В ситуациях, когда приходится анализировать материалы свободного описания объектов, т.е. выбирать произвольно избирательные качественные критерии, возникает необходимость установить значимость сходства характеристик приписываемых различным объектам. Это реализуется с помощью вычисления дефекта связи D и ее объема C между двумя наборами соответствующих характеристик.

Если К0 – число элементов характеристик, вошедших в оба ряда свойств сравниваемых объектов;

К1 – число элементов, включенных в ряд описания 1-го объекта;

К2 – число элементов, включенных в ряд описания 2-го объекта;

то для вычисления дефекта связи D и объема связи С:

, .

Если , а, то между двумя рядами характеристик существует значимая связь, а сходство рассматриваемых в описании объектов достоверное.

5 - Критерий согласия Фишера (F-критерий). Распределение Фишера. Н0 заключающейся в принадлежности двух выборок одной и той же генеральной совокупности.

Пусть надо сравнить две дисперсии и, полученные результаты при моделировании со степенями свободыk1 и k2, k1=N1-1, k2=N2-1. Причем , для того, чтобы опровергнуть нулевую гипотезу Н0: , надо при уровне значимости указать значимость расхождения между и. При условии независимости выборок, взятых из нормативных совокупностей, в качестве критерия значимости используетсяF-критерий:

.

Вычисляют F, определяют k1 и k2 и при выбранном уровне значимости  по таблицам F-распределений (приложение А, таблица А.4) находят значения границ критической области:

и .

Затем проверяется неравенство: . Если неравенство выполняется, то с доверительной вероятностью гипотеза Н0 принимается.

6 - Критерий согласия Стьюдента (t-критерий). Распределение Госсета. Сравнение средних значений двух независимых выборок, взятых из нормальных совокупностей с неизвестными, но равными дисперсиями D[]=D[], сводится к проверке нулевой гипотезы Н0: .

Для проверки гипотезы необходимо вычислить t:

,

где N1 и N2 – объем выборок для оценки и;

и - оценки дисперсий.

Затем определяется число степеней свободы k и при выбранном уровне значимости  и таблиц (приложение А, таблица А.2) сравнивают t и t. Если |t|<t, то гипотезу Н0 принимают.

7 - Критерий согласия Смирнова. Н0: две выборки принадлежат одной и той же генеральной совокупности. Если выборки независимы между собой и законы распределения совокупностей F() и F(z), из которых извлечены выборки, являются непрерывными функциями своих аргументов  и , то для проверки нулевой гипотезы Н0 можно использовать критерий Смирнова.

По имеющимся результатам вычисляют эмпирические функции распределений Fэ(u) и Fэ(z) и определяют

.

Если при выбранном уровне значимости  выполняется соотношение

,

где N1 и N2 объемы сравниваемых выборок для FЭ(u) и FЭ(z) и проводится сравнение D и D, если D> D, то нулевая гипотеза Н0 о тождественности законов распределений F(u) и F(z) с доверительной вероятностью отвергается.

Тут вы можете оставить комментарий к выбранному абзацу или сообщить об ошибке.

Оставленные комментарии видны всем.