Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Имитационное моделирование экономических процессов

.pdf
Скачиваний:
274
Добавлен:
01.05.2014
Размер:
6.69 Mб
Скачать

Опыт показывает, что в целях проверки всей системы вычисле­ ний полезно остаточную х;умму квадратов вычислять дважды, поль­ зуясь формулами (7.9) и (7.12).

Сама величина SR недостаточно удобна для определения степени разброса экспериментальных точек относительно уравнения регрес­ сии, так как она зависит от N. Поэтому обычно пользуются остаточ­ ной дисперсией, которая характеризует разброс, отнесенный к одной точке измерения,

где/-число степеней свободы;f=N-k~\.

Так, если у = Ь^,то/=Н-\; если же у = Ь^ + Ь^х^ ,iof=N-\

и т.д. Для вычисления каждого коэффициента bt требуется минимум одна точками. Оставшиеся точки могут рассматриваться как свобод­ ные, и к их числу относят остаточную сумму квадратов SR. Если число опытов равно числу коэффициентов, т.е. N= к-^\,го уравне­ ние регрессии пройдет через все Л'^ точек и разброса вообще не будет

(SR = 0).

Если s^ мало, то, следовательно, уравнение регрессии достаточ­

но точно характеризует процесс; если s^ велико, то или в уравнении регрессии не учтены какие-то существенные факторы х,, или непра­ вильно выбрана степень полинома. При этом если на основе прове­ дения аналогичных экспериментов известна ошибка опьгга о^ , т.е.

ошибки измерения и влияние неконтролируемых факторов z/ , то можно найти ^-отношение:

F = -^

(7.13)

и проверить гипотезу об адекватности представления результатов полиномом заданной степени d.

В математической статисвш» F-распределение используется для проверки равенства дисперсий в двух сериях опытов. Остановимся несколько подробнее на этом понятии. В выражении для дисперсии

sl = \hyu-yf

J и=\

251

в числителе находится сумма квадратов случайных, нормально рас­ пределенных чисел (по предпосылке регрессионного анализа) с ма­ тематическим ожиданием, равным нулю является математиче­ ским ожиданием для >»„). Эта сумма сама есть случайное число, так как для каждой новой серии опьггов N можно получать другое зна­ чение Sy • Такое случайное число имеет свой закон распределения,

который зависит от числа степеней свободы. Этот закон получил название у^ (хи-квадрат). ^'-отношение есть отношение двух случай­ ных величин, каждая из которьк подчинена закону х^:

поэтому F также является случайной величиной, она подчинена так назьшаемому закону i^-распределения. Плотность распределения этой величины определяется выражением

{f^^f^Ft'^f^-f^

(7.14)

 

где

 

rf^i."/2I

 

С = - 1 2 ) . /0 . 5Л . /0 . 5/,;

 

( # I 2 J

где Г(а) - гамма-функция от аргумента а;

 

fbfi - степени свободы соответственно для $

и j ^ .

У\

Уг

Случайная величина F является отношением двух положитель­

ных величин, характер WR (FJufi) представлен на рис. 7.3 при фик­ сированных значениях/] и ^ . На практике непосредственно выра­ жение (7.14) не применяют, а используют таблицы, которые приво­ дятся в пособиях по математической «татистике (см. приложение 3).

Чтобы проверить гипотезу о равенстве дисперсий (j^ = ^2

т.е.

У1 Уг

 

F=\), нужно задаться областью недопустимьк значений F, которую

считаем неприемлемой. Только тогда можно судить о том, будет ли полученное числовое значение F слишком большим или малым.

252

За эту критическую область принимают два интервала: интервал больших значений F > Fj и интервал малых значений 0<F<F\ (см. рис. 7.3). Причем точки Fi и Fi подбираются так, чтобы вьшолнялись равенства для соответствующих вероятностей:

P[F>F2] = q/2, P[F<Fi] = q/2.

где q - уровень значимости (он часто задается в процентах).

WAF,fuf2> '

Рис 7.3. Вид F-распределения

Если полученное значение F окажется вне интервала (Fi, Fj), то гипотеза о равенстве ^ = ^2 отбрасывается. Причем правильность

этого решения будет гарантирована с достоверностью (1 - q). В 100^ процентах случаев гипотеза будет отвергаться напрасно. С увеличе­ нием q как бы налагаются более жесткие условия на совпадение ре­ зультатов, и естественно, что гипотеза будет отвергаться чаще. Уменьшение q означает меньшую требовательность. Поскольку для сравнения дисперсий можно брать и обратное отношение

л ~

то получается, что F\ соответствует jr^. В итоге оказывается доста­ точно вычислить одну границу интервала, а именно Fj, при этом в

253

числителе берут большее значение sj,. В таблицах дается одна вели­ чина FT, С которой сравнивается полученное расчетное значение Fp.

Пример 7.1. Использование F-отношения. Рассмотрим результа­ ты моделирования инвестиционного процесса по двум вариантам бизнес-планов инвестиционного проекта. Оба варианта в конечном итоге приводят к получению одного и того же показателя чистого приведенного дохода NPV. По варианту 1 было проведено /ii = 10 опытов с имитационной моделью, а по варианту 2 проведено П2= 15 опытов. Обе серии опытов, естественно, имеют какое-то отклонение от требуемого значения NPV. Дисперсии были подсчитаны, и оказа­

лось, что j ^ = 9,6 млн руб., j2

=5,7 млн руб. Откуда

Уг

Уг

 

Fp

_2

5,7 ' •

 

SУ1

 

Степень свободы для j

^ равна/i = 10 - 1 = 9, а для s\ она рав­

на^ = 15 - 1 = 14. Уравнение регрессии в этом примере имеет вид У = Ьц, где Ьа - искомое среднее значение «чистого» приведенного дохода, т.е. NPVue зависит от управляющих факторов х,. На основе полученного значения F = 1,68 требуется сделать вывод о том, оди­ накова ли степень неопределенности (и риска) у вариантов 1 и 2. Разница в величинах s^ и s^ может бьггь как результатом разной

неопределенности (различного риска), так и следствием случайно­ сти. Зададам уровень значимости q = 10%. Для/i = 9 и ^ = 14 из таб­ лицы (см. приложение 3) найдем Fr= 2,65. Поскольку Fp < Fj, значе­ ние Fp= 1,68 при ^ = 10% является незначимым, т.е. предположение о равенстве дисперсий (а следовательно, и одинаковой неопределен­ ности в^иантов бизнес-планов) не противоречит результатам серий опытов. Если бы получилось Fp > 2,65, то гипотезу об одинаковой неопределенности нужно бьшо бы отбросить, при этом в 10% случа­ ев гипотеза была бы отброшена напрасно.

Аналогичным образом, используя отношение (7.13), можно убедаться в правильности выбора степени полинома d. Если априори есть достаточно оснований для выбора d, то остаточную дисперсию

Sy можно рассматривать как оценку дисперсии, характеризующей ошибку эксперимента.

254

Кроме точности уравнения регрессии в целом большое значение имеет точность в определении самих коэффициентов регрессии. Ко­ эффициентами, значение которых соизмеримо с погрешностью их определения, очевидно, следует пренебречь.

Дисперсии Л , характеризующие ошибки в определении коэф-

фициентов регрессии (в каждой новой серии опытов для одного и того же уравнения регрессии будут получаться различные значения одних и тех же коэффициентов Ь, из-за влияния помех Zj), также можно определить с помощью преобразования матриц. Определим вектор ошибок:

А 6]

5-р = АЬ-

АЬ,

где р - теоретическое значение коэффициентов.

Вычислим математическое ожидание:

I Л/{(5-р)(В-Р)*)=М- Аб2 х|дЙ1 Дб2 ••• A6;t|

A^lA^l ДА1Д62 - Ab^Abk

Ab2Abi Д^зД^з ••• Ab2Abi(

Abj^Abx Ab)(Ab2 ... AbifAb/f

Черта над элементами матрицы означает усреднение по всем се­ риям опытов. Введем следующие обозначения:

^=M{B},A = Y-M{Y}.

Поскольку

то

М{В}:=(Х*Х)-^Х*М{Е}.

2 5 5

Случайными являются величины уиЬ,ах измеряется точно, по­ этому 1х*Ху^ иХ*- константы.

Сделаем следующие преобразования:

М{(Д-р)(5-р)} =

 

 

-1„*-

 

= M{[(x*xf^X*(Y-M{Y})M(x*xf^^*(Y-(M{Y})]}=

(7.15)

= м{1(х*х)

-1„*

- ! „ •

 

^*АМ(Х*Х)

X д]} =

 

= Щ(Х*Х)~'^*АА*Х(Х*Х)~'} = (Х*Х)~^^1 •

При получении результата (7.15) использованы следующие свойства матрицы:

поэтому

[t-x)i'-[WT'=tv]--(.-;r)-'.

Поясним также преобразования

АУ1

М^'А }= М-Ау2 X|AJI Ау2 ... AyJi

АУ1

О

О

О

Ajf

... О = alE,

ОО ... Ayj

где Е - единичная матрица.

В соответствии с предпосылками регрессионного анализа (см. разд. 7.2) все Ayf равны, а усредненные произведения Aj;,..2 А^..-^2 =0. при / ^j (см. первую предпосылку, независимость у^).

256

Переходя к обычной форме записи, из вьфажения (7.15) получаем

ст1 =Ciioj,

S? =Ciisl,

(7-16)

"i

"i

 

где c„ - коэффициенты (будут определены позднее).

Зная si , можно установить доверительные границы для коэф­ фициентов Ь,. Введем случайную величину

%

где Р/ - теоретическое значение коэффициента.

Поскольку Ь, получается из Jlинeйнoй комбинации Уи, а уи имеет нормальное распределение по условиям регрессионного анализа, то разность Ь, - Р, также распределена по нормальному закону. Величи­ на t, являющаяся отношением нормально распределенной случайной

величины к случайной величине, распределенной по ух^ , имеет плотность так назьшаемого ^-распределения:

1

r(0,5(l+/))f

'2"»

W,(t,f) = VV

Г(0,5/)

1+i-

V

f)

Данное распределение напоминает по характеру нормальное распределение при/= 1 и переходит в него при/-» ао (рис. 7.4). Ве­ роятность того, что случайная величина t примет значение \t\>tq,

будет равна q. Величина q называется уровнем значимости величи­ ны t (рис. 7.5). Если зададимся значением q = 10% и найдем в табли­ це tqif) (см. приложение 4), то сможем утверждать, что в 90% слу­ чаев истинное значение коэффициента р, будет лежать в'пределах

bi-tq(J)Sf,.^ubi + tgif)Si,.. (7.17)

Коэффициент Ь, незначим, если

257

W,(tJ) '^ / = const

Рис. 7.4. Вид ^pacп^eдeлeния

В математической статистике нельзя дать абсолютно утверди­ тельного ответа ни по одному из параметров. Можно только с опре­ деленной степенью достоверности указьшать пределы, в которых находится значение параметра. Так, в данном случае степень досто­ верности равна 0,9.

Величина tq{f) возрастает с уменьшением q и уменьшается с

увеличением/ Это естественно: увеличение степени достоверноста (уменьшение q) вызывает увеличение диапазона возможного значе­ ния параметра (см. рис. 7.5). Увеличение/означает увеличение чис­ ла испытаний, т.е. более точное определение параметров процесса, поэтому с ростом/диапазон разброса параметра tgif) уменьшается.

Доверительные границы по соотношению (7.17) можно устано­ вить только для случая ортогонального планирования,' когда диаго­ нальные элементы обратной матрицы с„ определяются независимо:

_ 1 _

си = («•)

258

W,(t,f) '^ /= const

-ta

Рис. 7.5. Пример использования ^-распределения для определения интервала достоверности

Если матрица не диагональная (для неортогонального планиро­ вания), то в вычислении с,/ участвуют все элементы матрицы (ЛХ). При изменении числа переменных к, естественно, си получают дру­ гое значение. Поэтому определение дисперсии для каждого коэффи­ циента Ь, становится возможным только при фиксировании значений остальных коэффициентов.

Рассмотрим пример на получение и анализ уравнения регрессии. Пример 7.2. Неортогональное планирование эксперимента. Для того чтобы лучше представлять, как идет процесс решения, зададим сами функцию двух переменных хи хг, и полученные значения функции в заданных точках «засорим» шумами. По этим «засоренньпй» точкам, которые будут имитировать экспериментальные точ­ ки, будем искать нами же заданнь1й полином (в действительности же

вид полинома и даже его степень бывают неизвестны):

Ti(JCi,X2) = 10 + 4 + 6 ^ , + 3 ,

'•^2

'.V1.X2 •

Значения функции лС^Ь'^г) и измеренные значения >'„ представ­ лены в табл. 7.1.

259

Таблица 7.1

 

 

Значения функции П('^1>'^2)

 

 

 

и

1

2

3

4

5

6

7

8

9

Х\

0

0

0

1

2

1

2

0

-1

Х2

0

1

2

0

0

1

2

-1

-1

rix^.Xj)

10

16

22

14

18

23

42

4

3

Уь

10

17

20

14

18

24

40

3

3

Дл

0

1

-2

0

0

1

-2

-1

0

yJ

0

1

4

0

0

I

4

1

0

В ряде случаев бывает известна ошибка опыта. В данном приме­ ре можно принять за ошибку опыта разность мезеду Уи и r\(xi,X2). Тогда

c^y = ^hyl

= ^ = l,22: c^=Ul;/=^^=9.

^«=1

^

Забудем теперь об уравнении для TI(XI,X2) и начнем искать уравнение регрессии в линейной форме [см. формулу (7.2)], так как полином нулевой степени явно не обеспечит адекватности:

5? = *0'^о+*1-^1+*2^2. ^"2;

 

XQ

Xi

Х2

 

1

0

0

 

1

0

1

 

1

0

2

Х =

1

1

0

 

1

2

0

 

1

1

1

 

1

2

2

 

1

0

- 1

 

1

-1

-1

Система точек неортогональна:

9

260