Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Книга по моделированию.doc
Скачиваний:
334
Добавлен:
01.05.2014
Размер:
2.35 Mб
Скачать

Статистическая оценка коэффициентов модели

Необходимым условием для статистического оценивания моделей является возможность сопоставления результатов экспериментирова­ния с моделируемым объектом, с одной стороны, и расчетных данных, полученных с помощью модели, с другой. Наиболее важными являются оценки соответствия модели моделируемому объекту: R2, достоверность коэффициентов, информа­тивность и адекватность.

Оценка R2показывает, какая доля общей дисперсии зависимой переменной (y), определяется ее расчетными значениями.

где – сумма квадратов разницы расчетных и средних экспериментальных значений;

– сумма квадратов разницы экспериментальных и средних экспериментальных значений.

Оценка R2 необходима для определения аппроксимируемости моделью экспериментальных данных. Чем ближе оценкаR2к единице, тем точнее построенная модель аппроксимирует экспериментальные данные. Для медико-биологических исследований обычно необходимо выполнение следующего условия:R20,5. Если это условие не выполняется, то модель усложняется изменением структуры и добавлением новых аргументов.

Достоверность (доверительная граница) коэффициентов.

Определение доверительной границы значений коэффициентов D производится по следующим формулам:

;;,

где дисперсия значения коэффициента;стандартное отклонение;

 дисперсия воспроизводимости. Достоверность определяется по результатамn-кратного повторения опыта в любой точке плана (желательно в средней), либо опытn-раз повторяется в одной из точек плана. Необходимое условие достоверности коэффициента модели.

Оценка информативности модели.

Для определения прогностической ценности модели необходимо проверить гипотезу об информативности модели (Fинф). Она играет важную роль в тех случаях, когда нет возможности поставить дублирующие опыты при неизменных условиях (одинаковые величины независимых переменных). Такая ситуация может возникнуть, например, в процессе моделирования какого-либо интегрального показателя состояния, от комбинированного влияния ряда параметров функционирования различных подсистем организма.

,

где – расчетная дисперсия зависимой переменной:

– остаточная дисперсия, определяющая ошибку воспроизведения моделью реальных (экспериментальных) данных:

;

L– количество коэффициентов модели.

Модель информативна, если Fинф>Fтаблпо таблице Фишера, при числе степеней свободыf1=L– 1,f2 =N–L.

Оценка адекватности модели.

Расчет адекватности модели применяется для оценки разброса в точках эксперимента относительно расчетных значений.

,

где - дисперсия адекватности:

где n– количество повторных опытов.

Дробный факторный эксперимент

Дробный факторный эксперимент (ДФЭ) предназначен для минимизации количества опытов, он представляет собой определенную часть полного факторного эксперимента, где опыты реализуются не во всех 2k вершинах гиперкуба, а лишь в некоторых из них.

Допустим, что нам необходимо провести 4-х факторный эксперимент, по правилам полного факторного эксперимента требуется провести 16 опытов. Предположим, что в силу ряда причин это сделать невозможно. В таком случае используется следующий прием: планируется полный 3-х факторный эксперимент, а четвертый фактор рассматривается как произведение первых 3-ех.

N

x1

x2

x3

x4=x1x2x3

1

-1

-1

-1

-1

2

-1

-1

+1

+1

3

-1

+1

-1

+1

4

-1

+1

+1

-1

5

+1

-1

-1

+1

6

+1

-1

+1

-1

7

+1

+1

-1

-1

8

+1

+1

+1

+1

Соотношение x4 = x1x2x3 – называется генерирующем соотношением, которое показывает, с каким из эффектов смешан данный эффект. Приведенная зависимость показывает, что b4  4 + 123, где коэффициент  является истинным значением коэффициента b, при этом тройным взаимодействием можно пренебречь.

Однако здесь возможны и другие смешанные эффекты. Для определения всех смешанных эффектов используются определяющие контрасты. Для этого необходимо умножить левую и правую части генерирующего соотношения на x4. В связи с тем, что квадрат фактора считаем = +1, то определяющие контрасты будут иметь вид: 1 = x1x2x3x4.

Отсюда можно определить все смешанные эффекты:

x0 = x1x2x3x4 b0  0 + 1234; x1 = x2x3x4 b1  1 + 234;

x2 = x1x3x4 b2  2 + 134; x3 = x1x2x4 b3  3 + 124;

x4 = x1x2x3 b4  4 + 123; x1x2 = x3x4 b12  12 + 34;

x1x3 = x2x4 b13  13 + 24; x1x4 = x2x3 b14  14 + 34;

x2x3 = x1x4 b23  23 + 14; x2x4 = x1x3 b24  24 + 13;

x3x4 = x1x2 b34  34 + 12.

Т.е. введение в план генерирующего соотношения приводит к тому, что в модели учитываются только линейные эффекты воздействующих факторов, а эффекты взаимодействия взаимно уничтожаются. Здесь приведен один из возможных вариантов определяющего контраста, но возможны и другие. Поэтому при использовании ДФЭ необходимо иметь представление о разрешающей способности дробной реплики, т.е. определить какие коэффициенты являются несмешанными оценками соответствующих влияний.

Разрешающая способность дробной реплики определяется по набольшему числу факторов в определяющем контрасте. Она показывает степень точности оценки коэффициентов модели, а значит и соответствующих влияний факторов, определяющих эффективность смешения воздействий.

План, в котором главные эффекты (линейные) смешаны с 2-х факторным воздействием, носят название планов с разрешающей способностью III (по числу факторов в определяющем контрасте, т.е. 1=x1x2x3).

План, в котором нет ни одного главного эффекта, смешанного с другим главным эффектом или с парным взаимодействием, а все парные взаимодействия смешаны друг с другом, носят название планов с разрешающей способностью IV.

План, в котором главные эффекты смешаны с четверными, а парные – с тройными взаимодействиями, носят название планов с разрешающей способностью V.

Расчет количества опытов для проведения дробного факторного эксперимента производится по формуле N=2k-p, где p – указывает во сколько раз, будет сокращено количество опытов по сравнению с полным факторным экспериментом. Если p=1 – это полуреплика от полного факторного эксперимента, т.е. количество опытов сократиться в 2 раза, если p=2 – четверть реплики, количество опытов сокращается в четыре раза и т.д.

Планы с меньшим, чем 4 числом факторов не целесообразно минимизировать, при большем количестве факторов в основном используются дробные факторные эксперименты. Пределом минимизации для ДФЭ, является следующее соотношение:

Планы, в которых N=k+1, называются насыщенными.

Метод минимизации количества факторов за счет исключения из них неинформативных. Метод случайного баланса. (МСБ)

МСБ использует сверхнасыщенные планы. Сверхнасыщенный план – это план, в котором число опытов в матрице планирования меньше числа рассмотренных эффектов. То есть число степеней свободы отрицательно, в число эффектов включаются также и эффекты взаимодействия.

Метод случайного баланса не обоснован теоретически, а носит, в основном, эвристический характер. Основная предпосылка его применения, это среди большого числа рассматриваемых факторов, лишь несколько существенно влияют на процесс. При этом, возможно что эффекты взаимодействия оказывают большее влияние, чем линейные эффекты их составляющие. Конечная цель – построение диаграммы ранжирования.

В данном случае “k” это количество наиболее существенных эффектов.

y: 1) величины кодированных коэффициентов, являющиеся оценками наиболее существенных эффектов;

2) дисперсии отклика после последовательного исключения наиболее информативных параметров.

y

шум

эффекты

x1

x2

xk

Алгоритм реализации метода случайного баланса состоит в следующем:

  1. Построение сверхнасыщенного плана.

  1. группировка исследуемых переменных (факторов) в независимые дробные или полные факторные эксперименты (с одинаковым количеством строк);

  2. рандомизация строк этих планов согласно таблице случайных чисел;

  3. стыковка полученных отдельных подпланов в общую матрицу планирования.

N

x1

x2

x3

x4

x5

x6

x7

x8

x1x2

(L-1)xL

y

1

-

-

-

-

-

+

+

-

+

y1

2

-

-

+

+

+

-

+

-

+

y2

3

-

+

-

+

-

-

-

-

-

y3

4

-

+

+

-

-

+

-

+

-

y4

5

+

-

-

+

+

+

-

-

-

y5

6

+

-

+

-

+

+

+

+

-

y6

7

+

+

-

-

-

-

+

+

+

y7

8

+

+

+

+

+

-

-

+

+

y8

Здесь объединены несколько дробных четырех факторных планов с генерирующем соотношениемx4=x1x2x3. Строки второго плана получены по таблице случайных чисел из первого плана, а именно: первая строка второго плана соответствует четвертой строке первого плана, вторая строка – это 6-ая в первом плане, третья строка второго плана – первая строка первого плана и т.д.

  1. Выделение существенных переменных.

Считается, что фактор xiсущественен, если при переходе его с одного уровня, например (-) на другой (+) происходит смещение центра распределения величиныyна значимую величину.

Для визуального выделения значимых факторов по результатам эксперимента строят «диаграмму рассеяния».

Например, выделим первый столбец (x1) и условно зададим значенияy.

В

y

результате элемент диаграммы рассеяния дляx1будет выглядеть следующим образом:

N

x1

y

1

-

6

2

-

4

12

3

-

3

10

4

-

8

8

5

+

1

6

2

6

+

1

4

0

7

+

8

2

8

+

6

эффекты

x1

-1

+1

Обозначим: R– количество «выделившихся» точек, которые расположены выше (ниже) концов интервала изменения значенияyдругого уровня фактора,R= 2+2=4.

Затем находим разность медиан (медиана это средняя точка распределения, т.е. с каждой стороны от нее одинаковое количество точек).

В качестве критерия визуальной (качественной) оценки значимости фактора (эффекта) можно использовать произведение этих двух величин:

, для данного примераg = 4 . 4 = 16.

Таким образом, производится факторный анализ всех основных эффектов. И в результате сравнения выделятся наиболее значимые эффекты.

  1. Количественная оценка выделенных эффектов.

Для количественной оценки выделенных Hэффектов и проверки их значимости из матрицы планирования следует отобрать соответствующиеHстолбцов, которые после объединения образуют новую матрицуH*N, гдеN– число неповторяющихся строк.

Допустим, что в результате визуального анализа диаграммы рассеяния были выделены эффекты x1иx1x2. Выделяем соответствующие 2 столбца исходной матрицы и формируем новую 2-х факторную матрицу планирования эксперимента.

N

x1

x1x2

y

1

-

-

y3; y4

2

-

+

y1; y2

3

+

-

y5;y6

4

+

+

y7;y8

Далее производится расчет соответствующих коэффициентов.

  1. Минимизация числа факторов.

Снятие эффектов значимых факторов, для выявления более слабых, производится следующим образом: вычитается 2biиз всех значенийy, для которых соответствующий факторxiнаходится на уровне +1 если значениеyс отрицательным знаком 2biприбавляется. В результате получаются новые значения функции откликаy’ для проведения следующего этапа поиска значимых факторов. Далее весь цикл повторяется вновь, но уже без предыдущих выделенных эффектов. Процесс останавливается когда, где- находится по таблице Фишера.

Пример.

  1. Построение плана.

    N

    x1

    x2

    x3

    x4

    x5

    x6

    x7

    x8

    y

    y’

    1

    -1

    -1

    -1

    -1

    -1

    +1

    +1

    -1

    2

    2

    2

    -1

    -1

    +1

    +1

    +1

    -1

    +1

    -1

    8

    4.25

    3

    -1

    +1

    -1

    +1

    -1

    -1

    -1

    -1

    4

    4

    4

    -1

    +1

    +1

    -1

    -1

    +1

    -1

    +1

    6

    2.25

    5

    +1

    -1

    -1

    +1

    +1

    +1

    -1

    -1

    9

    2.75

    6

    +1

    -1

    +1

    -1

    +1

    +1

    +1

    +1

    12

    2

    7

    +1

    +1

    -1

    -1

    -1

    -1

    +1

    +1

    10

    3.75

    8

    +1

    +1

    +1

    +1

    +1

    -1

    -1

    -1

    14

    4

  2. Выделение существенных переменных.

Построение диаграммы рассеяния.

14

12

10

8

6

4

2

x1

-1

+1

-1

+1

x2

+1

x3

-1

Для x1:R=8;;g=8*6=48.

x2:R=2;;g=2*0.5=1.

x3:R=4;;g=4*3.5=14.

Аналогично находятся значения gдля всех остальных факторов. Из приведенных факторов, как наиболее значимые, можно выделитьx1иx3.

  1. Количественная оценка выделенных эффектов.

На основе выбранных факторов производится построение новой 2-х факторной матрицы планирования эксперимента.

N

x1

x2

y

1

-1

-1

2; 4

3

2

-1

+1

8; 6

7

3

+1

-1

9; 10

9.5

4

+1

+1

12; 14

13

Далее производится расчет коэффициентов b:

;

  1. Минимизация числа факторов.

Вычитаются 2b1(b3) из всех значенийy, для которых соответствующий факторx1(x3) находится на уровне +1.

N

y’

1

2

2

3

4

4

5

6

7

8

Далее цикл повторяется. Процесс останавливается, когда F<Fтабл.

Методы последовательного планирования.

Метод крутого восхождения.

В основе метода лежат последовательное построение и реализация простых линейных планов. После каждого такого эксперимента вычисляется вектор направления движения к оптимальной области. В направлении этого вектора строятся несколько одиночных опытов. По результатам их анализа выбирается новая область для построения очередного плана, после реализации, которого рассчитывается новый вектор движения. Схематично эта процедура представлена на рисунке.

x2

вектор 1

ВЕКТОР 2

x2

x1

x1

Пространство факторов (x1 и x2) представлено в виде линий равного уровня,

xi0-основной уровень i-го фактора исходного плана, xi-интервал варьирования фактора.

Алгоритм реализации метода

  1. Выбрать основной уровень для каждого фактора (хi0) и интервалы варьирования (±хi). Провести спланированный эксперимент. В данном случае, как показано на схеме, опыты ставятся в вершинах прямоугольника по схеме 2К (к – количество факторов). Рассчитать коэффициенты (Ьi) в кодированном виде.

  2. Задать шаг (приращение) для xi в направлении искомого вектора. Например, шаг () для x1 можно выбрать равным его интервалу варьирования 1=x1.

  3. Вычислить шаги (приращения) для остальных факторов, основываясь на 1 по формуле:

    1. Поставить серию экспериментов (точечных) в направлении вектора, задавая каждый новое значение раз для каждого фактора добавлением соответствующего значения . На первом шаге начальное значение фактора равно его основному уровню.

    2. Выбрать такую точку на векторе, в которой результаты эксперимента дают максимальную величину у. В области этой точки, взяв ее в качестве основного уровня нового плана, поставить второй спланированный эксперимент и рассчитать вектор. Далее процедура повторяется, как было описано в п.п. 2 – 5. Эксперименты прекращаются после того, как значение у перестанет возрастать (убывать).

Симплекс планирование.

Симплексом в k-мерном пространстве называют выпуклый многогранник имеющийk+ 1 вершину, каждая из которых определяется пересечениемkгиперплоскостей данного пространства. Примером симплекса в 2-х мерном пространстве, служит треугольник.

При планировании эксперимента обычно используют регулярные симплексы. Симплекс называется регулярным, если расстояния между его вершинами равны.

В экспериментальной практике симплексные планы наиболее широко используются для решения задач оптимизации на стадии движения к почти стационарной области. Для оптимизации используется следующее важное свойство симплекса: против любой из его вершин Aiрасположена только одна грань, на которой можно построить новый симплекс, отличающегося от прежнего расположением новой вершиныAj, тогда как остальные вершины обоих симплексов совпадают. Последовательным отбрасыванием вершин производится перемещение исходного симплекса в факторном пространстве.

Метод последовательного симплекс планирования состоит в следующем. Планируют исходную серию опытов так, чтобы точки соответствующие условиям проведения опытов, образовывали регулярный симплекс в факторном пространстве. После проведения опытов определяется наихудшее значение у, и соответствующая ему вершина симплекса зеркально отображается в исследуемом факторном пространстве.

Ставится опыт в новой вершине, и полученное новое значение у сопоставляется с остальными значениями у (без учета отброшенного наихудшего значения) старого симплекса. Вновь наихудшая вершина симплекса зеркально отображается, и таким образом осуществляется движение симплекса в k-мерном пространстве к искомому экстремуму функции у. Движение симплекса останавливается, когда значение у в новой вершине симплекса оказывается снова наихудшим по сравнению с остальными значениями y.

Принцип применения симплекс планирования состоит в следующем.

На первом этапе производится расчет координат вершин симплекса по формуле:

,

где хi0 – основной уровень фактора (среднее значение), xi – интервал варьирования фактора, xikod – кодированные значения координат вершин симплекса.

Значения xikod можно выбрать из следующей таблицы:

Определение координаты наихудшей точки определяется по формулам:

, j = 1, 2, …,k

где j-я координата новой вершины, полученной в результате отражения,j-я координата наихудшей вершиныi;j-я координата центра противоположной грани.

где j-е координаты оставшихся вершин;n– количество вершин, исключая наихудшую.

Пример.

Предположим заданы некоторые входные значения, а именно

Параметры

Факторы

x1

x2

x3

Основной уровень

1.5

15

115

Интервал варьирования

0.5

5

15

Из предложенной таблицы выбираются соответствующие кодированные значения для расчета координат вершин симплекса.

Значения координат вершин симплекса

Номер вершины

Координаты

x1

x2

x3

1

0.5

0,29

0,2

2

– 0.5

0,29

0,2

3

0

– 0,58

0,2

4

0

0

– 0,61

Посредством указанной выше формулы рассчитываются координаты вершин симплекса.

;;

Аналогичным образом производится расчет координат остальных вершин симплекса, результаты расчета приведены в таблице.

Значения координат вершин симплекса

Номер вершины

Координаты

x1

x2

x3

1

1,75

16,45

118

2

1,25

16,45

118

3

1,5

12,1

118

4

1,5

15

105,85

Проведя эксперименты предположим, что наихудшая вершина №2, тогда:

;

;

.

Таким образом, имеем новый симплекс с вершинами 1, 3, 4, 5, далее все вновь повторяется, пока не будет достигнута точка оптимума.