Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
m1061.pdf
Скачиваний:
115
Добавлен:
15.11.2022
Размер:
20.13 Mб
Скачать

2. МНОГОФАКТОРНЫЕ МАТЕМАТИЧЕСКИЕ МОДЕЛИ НА ОСНОВЕ БАЗ ДАННЫХ НАБЛЮДЕНИЙ (ИСПЫТАНИЙ). ПРОГРАММА «MODELL»

Строительство зданий и сооружений представляет собой сложную стохастическую систему, в которой происходят многообразные и многочисленные организационно-технологические сбои. Причинами сбоев является множество дестабилизирующих производство факторов. Установление зависимости влияния какого-либо фактора на результаты определенного строительного процесса возможно путем построения математических моделей на основе баз данных наблюдения (испытаний) производственных процессов

2.1. Шаговый регрессионный метод

Для построения многофакторных математических моделей используется шаговый регрессионный метод [11]. Шаговый регрессионный метод начинается с построения простой корреляционной матрицы и включения в регрессионное уравнение переменной, наиболее коррелируемой с откликом, для включения в уравнение выбирается переменная с наибольшей величиной квадрата частного коэффициента корреляции и так далее.

Для проверки введенных на раннем шаге переменных, на предмет их взаимосвязи с другими переменными, на каждом шаге вычисляется частный F критерий (критерий Фишера) для каждой переменной уравнения и сравнивается с заранее избранной процентной точкой соответствующего F – распределения. Это позволяет оценить вклад переменной в предположении, что она введена в модель последней, независимо от момента ее фактического введения. Переменная, дающая незначительный вклад, исключается из модели. Этот процесс продолжается до тех пор, пока не будут рассмотрены все переменные.

Общий Fкритерий служит для определения статистической значимости модели, рассматриваемой на каждом этапе. Рассчитывается следующим образом:

F = Среднийквадрат,обусловленный регрессией .

Среднийквадрат,обусловленныйостатком

Для сравнения влияния и установления относительной важности каждого из факторов используется нормирование коэффициентов регрессии:

bi = ai Sxi /Syi , (2.1)

где bi коэффициент уравнения регрессии после нормирования; ai коэффициент уравнения регрессий до нормирования;

Sxi средняя квадратичная ошибка переменной Хi; Syi средняя квадратичная ошибка отклика Yi.

19

Нормирование коэффициентов регрессии возможно лишь при случайных переменных Хi.

Далее для полученной модели строится вектор ошибок и проверяется соответствие его закону нормального распределения, что является необходимым условием для использования критериев t и F при получении доверительных интервалов.

Проверка принадлежности вектора ошибок закону нормального распределения осуществляется с помощью критерия согласия Пирсо-

на χ2. Для чего строится эмпирическое распределение вектора ошибок, определяется значение χ2, и, в соответствии с выбранным уровнем надёжности критерия α (чаще всего выбирается α=0,05 [95%] или α=0,01 [99%]), по таблицам определяется теоретическое значение χ2α.

Если χ2 = χ2α, то нет основания отвергать гипотезу о нормальности распределения вектора ошибок.

Для проверки неадекватности модели используют средний квадрат

ошибки S2, как оценку величины σ2, предполагая, что модель правильна. Если эти величины отличаются на порядок и более, делается вывод о неадекватности модели.

Проверка значимости уравнения регрессии (для нулевой гипотезы Но: в1 = в2 =... = 0) производится с помощью отношения средних квадратов SS(Rо)/(р – 1), которое рассматривается как распределенная случайная величина F – 1,v), где SS(R/во) сумма квадратов с учетом поправки на оценку коэффициента модели во ; р число степеней свободы регрессии; v = n – р число степеней свободы вектора ошибок; n количество вариантов для которых строится модель.

Для «статистически значимого» уравнения регрессии дисперсионное отношение должно превосходить теоретическое значение F – 1,

v, 1) с заданным уровнем значимости α.

Число наблюдений равно числу расчётов в соответствующей задаче. Уровень риска β для доверительного интервала обозначает веро-

ятность α совершения ошибки первого рода и используется для

расчета доверительных интервалов уровня 1 α коэффициентов регрессии. Доля объясненной вариации в % это квадрат коэффициента множественной корреляции, R2. Средний отклик означает среднее арифметическое всех наблюдаемых значений отклика (переменной Y). Стандартная ошибка в процентах от среднего отклика это мера величины стандартного отклонения остатков относительно среднего отклика рассчитывается как отношение стандартного отклонения остатков к среднему отклику.

Построение многофакторных математических моделей производится с использованием программы «Modell»

20

Программа «Modell» написана на алгоритмическом языке Delphi для персональных ЭВМ РС AТ. Программное обеспечение предусматривает также проверку принадлежности наборов показателей отдельного опыта данной выборке с целью поиска и исключения выбросов.

Исходные данные программы «Modell» приведены в таблице 2.1.

Таблица 2.1. Исходные данные

 

 

Наименование показателя

Обозначение

Поле

 

 

Имя модели

Название модели

Namem

 

 

Имя таблицы опытов (от 1 до 25 символов)

Таблица опытов

Tabl

 

 

Количество опытов в таблице

Записи

Nz

 

 

Количество факторов (от 2 до 99)

Факторы

Nf

 

 

Количество выбросов (от 0 до 10000)

Выбросы

Nw

 

 

Степень полинома (от 1 до 5)

Степень

Ip

 

 

Уровень риска (1–99%, 5–95%)

Уровень риска

Risk

 

 

Доля стандартных отклонений остатков

Отклонения

Sigma

 

 

(1–1 σ, 2–2 σ, 3–3σ)

 

 

 

 

 

Нормировать исходные данные (0 – нет, 1 да)

Нормирование

Norma

 

 

Выводить данные по корреляционному анализу

Корреляция

Korel

 

 

(0 – нет, 1 – да)

 

 

 

 

 

Выводить данные по дисперсионному анализу

Дисперсия

Disp

 

 

(0 – нет, 1 да)

 

 

 

 

 

Выводить матрицу исходных данных (0 – нет, 1 да)

Разность

Razn

 

 

 

Факторы выборки приведены в таблице 2.2.

 

 

 

 

Таблица 2.2. Факторы

 

 

 

 

Наименование показателя

Обозначение

 

Поле

 

 

Имя поля таблицы опытов с заданным фактором

Фактор

 

Pole

 

 

Условное обозначение фактора

Обозначение

 

Znak

 

 

Признак включения фактора в модель

Признак

 

Priz

 

 

- 1 – не включается;

 

 

 

 

 

0

зависимый фактор (должен быть один в модели);

 

 

 

 

 

1

фактор включается по F-критерию;

 

 

 

 

 

2

фактор обязательно будет включён в модель;

 

 

 

 

 

3

в модель будут включены все степени и произве-

 

 

 

 

 

дения данного фактора.

 

 

 

 

 

Введенная подстановка

Подстановка

 

Podst

 

 

1

подстановка не вводится;

 

 

 

 

 

2

вводится подстановка X = 1 / X;

 

 

 

 

 

3

вводится подстановка X = Sqrt(X);

 

 

 

 

 

4

вводится подстановка X = Ln(X).

 

 

 

 

Приведем пример построения математической модели (регрессионного уравнения) по программе «Modell» на основе исходных данных таблицы 2.3

21

Таблица 2.3. Исходные данные

Номер опыта

Факторы

 

Номер опыта

 

Факторы

 

Y

 

X

 

Y

 

X

1

10,98

 

35,3

14

9,57

 

39,1

2

11,13

 

29,7

15

10,94

 

46,8

3

12,51

 

30,8

16

9,58

 

48,5

4

8,40

 

58,8

17

10,09

 

59,3

5

9,27

 

61,4

18

8,11

 

70,0

6

8,73

 

71,3

19

6,83

 

70,0

7

6,36

 

74,4

20

8,88

 

74,5

8

8,50

 

76,7

21

7,68

 

72,1

9

7,82

 

70,7

22

8,47

 

58,1

10

9,14

 

57,5

23

8,86

 

44,6

11

8,24

 

46,4

24

10,36

 

33,4

12

12,19

 

28,9

25

11,08

 

28,6

13

11,88

 

28,1

 

 

 

 

По данным таблицы 2.3 построено регрессионное уравнение

Y = + 13,62298–0,07982869 * X. (2.2)

Листинг работы программы «Modell» приведен в приложении П3.

2.2. Построение доверительных интервалов. Программа «Diagram»

Часто при построении многофакторных математических моделей требуется оценить и отобразить графически доверительный интервал, которому с заданной вероятностью принадлежит найденное решение. Рассмотрим эту проблему на простейшей задаче.

Пусть у нас имеется большое количество предметов, с нормальным распределением некоторых характеристик (например, полный склад однотипных овощей, размер и вес которых варьируется). Мы желаем знать средние характеристики всей партии товара, но у нас нет ни времени, ни желания измерять и взвешивать каждый овощ. Как определить характеристики партии овощей выборочной проверкой?

Если бы мы промерили весь склад овощей (это множество элементов принято называть генеральной совокупностью), то мы узнали бы со всей доступной нам точностью среднее значение веса всей партии. Назовем это среднее значение Хср. ген генеральным средним. Нормальное распределение определяется полностью, если известно его

среднее значение и отклонение σ. Правда, пока мы ни Хср. ген, ни σ генеральной совокупности не знаем, но мы можем взять некоторую выборку, замерить нужные нам значения и посчитать для этой выборки как среднее значение Хср. выб, так и среднее квадратическое отклонение

Sвыб.Известно, что если наша выборочная проверка содержит большое количество элементов (обычно n больше 30), и они взяты действитель-

но случайным образом, то σ генеральной совокупности почти не будет отличаться от Sвыб.

22

Кроме того, для случая нормального распределения мы можем пользоваться следующими формулами:

С вероятностью 95%

X ср.ген = X ср.выб ±1,96

σ

 

, (2.3)

 

 

 

 

n

 

 

 

 

С вероятностью 99%

X ср.ген = X ср.выб ± 2,58

σ

 

, (2.4)

 

 

 

 

n

 

 

 

 

В общем виде c вероятностью Р(t)

X ср.ген = X ср.выб ± t

σ

 

, (2,5)

 

 

 

 

n

 

 

 

 

Связь значения t со значением вероятности Р(t), с которой мы желаем знать доверительный интервал, можно взять из таблицы 2.4.

Таблица 2.4. Зависимость значения t от вероятности Р(t)

Р(t)

0,683

0,950

0,954

0,990

0,997

t

1,0

1,96

2,0

2,58

3,0

Таким образом, мы определили, в каком диапазоне находится среднее значение для генеральной совокупности (с заданной вероятностью).

Если у нас нет достаточно большой выборки, то мы не можем

утверждать, что генеральная совокупность имеет σ = Sвыб. Кроме того, в этом случае проблематична близость выборки к нормальному распре-

делению. В этом случае также пользуются Sвыб вместо σ в формуле:

Xср.ген = Xср.выб ± t

Sвыб

, (2,6)

 

 

n

но значение t для фиксированной вероятности Р(t) будет зависеть от количества элементов в выборке n. Чем больше n, тем ближе будет полученный доверительный интервал к значению, даваемому формулой (2.5). Значения t в этом случае берутся из другой таблицы 2.5.

Таблица 2.5. Значения t-критерия Стьюдента для вероятности 0,95 и 0,99

n

 

Р

n

 

P

 

 

 

 

 

 

 

0,95

 

0,99

 

0,95

 

0,99

2

12,71

 

63,66

18

2,11

 

2,90

3

4,30

 

9,93

19

2,10

 

2,88

4

3,18

 

5,84

20

2,093

 

2,861

5

2,78

 

4,60

25

2,064

 

2,797

6

2,57

 

4,03

30

2,045

 

2,756

7

2,45

 

3,71

35

2,032

 

2,720

23

8

2,37

3,50

40

2,022

2,708

9

2,31

3,36

45

2,016

2,692

10

2,26

3,25

50

2,009

2,679

11

2,23

3,17

60

2,001

2,662

12

2,20

3,11

70

1,996

2,649

13

2,18

3,06

80

1,991

2,640

14

2,16

3,01

90

1,987

2,633

15

2,15

2,98

100

1,984

2,627

16

2,13

2,95

120

1,980

2,617

17

2,12

2,92

200

1,960

2,576

Пример. Из работников фирмы случайным образом отобрано 30 человек. По выборке оказалось, что средняя зарплата (в месяц) составляет 10 тыс. рублей при среднем квадратическом отклонении 3 тыс. рублей. С вероятностью 0,99 определить среднюю зарплату в фирме.

Решение: По условию имеем n=30, Хср=10000, S=3000, Р=0,99. Для нахождения доверительного интервала воспользуемся формулой (2.6), соответствующей критерию Стьюдента. По таблице для n = 30 и Р = 0,99 находим t=2,756, следовательно,

10000 2,756 300030 < Xср.ген <10000 + 2,756 300030

т. е. искомый доверительный интервал 8491 < Хср. ген < 11509.

Итак, вероятностью 0,99 можно утверждать, что интервал (8491; 11509) содержит внутри себя среднюю зарплату в фирме.

Программное обеспечение «Diagram» предназначено для построения графиков и доверительных интервалов уравнения регрессии. В таблицах 2.6–2.9 приведены исходные данные программы.

Таблица 2.6. Исходные данные по модели

П о к а з а т е л ь

Обозначение

Поле

Наименование графика

Имя

Name

Количество линий на графике, шт.

N

N

Таблица выборки

Выборка

Tabl1

Многофакторная математическая модель

МММ

M

Наименование оси X

Ось X

OsX

Наименование оси Y

Ось Y

OsY

Таблица 2.7. Исходные данные по таблице

П о к а з а т е л ь

Обозначение

Поле

Наименование графика

Имя

Name

Количество линий на графике, шт.

N

N

Таблица выборки

Выборка

Tabl1

Таблица факторов графика

Фактор

Tabl3

Наименование оси X

Ось X

OsX

Наименование оси Y

Ось Y

OsY

24

Таблица 2.8. Исходные данные по диаграмме

П о к а з а т е л ь

Обозначение

Поле

Наименование графика

Имя

Name

Количество линий на графике, шт.

N

N

Таблица диаграммы

Диаграмма

Tabl2

Наименование оси X

Ось X

OsX

Наименование оси Y

Ось Y

OsY

Таблица 2.9. Исходные данные по интервалу

П о к а з а т е л ь

Обозначение

Поле

Наименование графика

Имя

Name

Таблица выборки

Выборка

Tabl1

Таблица факторов графика

Фактор

Tabl3

Многофакторная математическая модель

МММ

M

Наименование оси X

Ось X

OsX

Наименование оси Y

Ось Y

OsY

Уровень риска, %

Риск

Risk

Пример построения графика регрессионного уравнения и доверительных интервалов по программе «Diagramm» на основе данных таблицы 2.3, рассмотренных в пункте 2.1 содержится в приложении П4.

25

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]