Имитационное моделирование экономических процессов
.pdfОпыт показывает, что в целях проверки всей системы вычисле ний полезно остаточную х;умму квадратов вычислять дважды, поль зуясь формулами (7.9) и (7.12).
Сама величина SR недостаточно удобна для определения степени разброса экспериментальных точек относительно уравнения регрес сии, так как она зависит от N. Поэтому обычно пользуются остаточ ной дисперсией, которая характеризует разброс, отнесенный к одной точке измерения,
где/-число степеней свободы;f=N-k~\.
Так, если у = Ь^,то/=Н-\; если же у = Ь^ + Ь^х^ ,iof=N-\
и т.д. Для вычисления каждого коэффициента bt требуется минимум одна точками. Оставшиеся точки могут рассматриваться как свобод ные, и к их числу относят остаточную сумму квадратов SR. Если число опытов равно числу коэффициентов, т.е. N= к-^\,го уравне ние регрессии пройдет через все Л'^ точек и разброса вообще не будет
(SR = 0).
Если s^ мало, то, следовательно, уравнение регрессии достаточ
но точно характеризует процесс; если s^ велико, то или в уравнении регрессии не учтены какие-то существенные факторы х,, или непра вильно выбрана степень полинома. При этом если на основе прове дения аналогичных экспериментов известна ошибка опьгга о^ , т.е.
ошибки измерения и влияние неконтролируемых факторов z/ , то можно найти ^-отношение:
F = -^ |
(7.13) |
и проверить гипотезу об адекватности представления результатов полиномом заданной степени d.
В математической статисвш» F-распределение используется для проверки равенства дисперсий в двух сериях опытов. Остановимся несколько подробнее на этом понятии. В выражении для дисперсии
sl = \hyu-yf
J и=\
251
в числителе находится сумма квадратов случайных, нормально рас пределенных чисел (по предпосылке регрессионного анализа) с ма тематическим ожиданием, равным нулю {у является математиче ским ожиданием для >»„). Эта сумма сама есть случайное число, так как для каждой новой серии опьггов N можно получать другое зна чение Sy • Такое случайное число имеет свой закон распределения,
который зависит от числа степеней свободы. Этот закон получил название у^ (хи-квадрат). ^'-отношение есть отношение двух случай ных величин, каждая из которьк подчинена закону х^:
.Л
поэтому F также является случайной величиной, она подчинена так назьшаемому закону i^-распределения. Плотность распределения этой величины определяется выражением
{f^^f^Ft'^f^-f^ |
(7.14) |
|
|
где |
|
rf^i."/2I |
|
С = - 1 2 ) . /0 . 5Л . /0 . 5/,; |
|
( # I 2 J
где Г(а) - гамма-функция от аргумента а; |
|
fbfi - степени свободы соответственно для $ |
и j ^ . |
У\ |
Уг |
Случайная величина F является отношением двух положитель |
|
ных величин, характер WR (FJufi) представлен на рис. 7.3 при фик сированных значениях/] и ^ . На практике непосредственно выра жение (7.14) не применяют, а используют таблицы, которые приво дятся в пособиях по математической «татистике (см. приложение 3).
Чтобы проверить гипотезу о равенстве дисперсий (j^ = ^2 |
т.е. |
У1 Уг |
|
F=\), нужно задаться областью недопустимьк значений F, которую |
|
считаем неприемлемой. Только тогда можно судить о том, будет ли полученное числовое значение F слишком большим или малым.
252
За эту критическую область принимают два интервала: интервал больших значений F > Fj и интервал малых значений 0<F<F\ (см. рис. 7.3). Причем точки Fi и Fi подбираются так, чтобы вьшолнялись равенства для соответствующих вероятностей:
P[F>F2] = q/2, P[F<Fi] = q/2.
где q - уровень значимости (он часто задается в процентах).
WAF,fuf2> '
Рис 7.3. Вид F-распределения
Если полученное значение F окажется вне интервала (Fi, Fj), то гипотеза о равенстве ^ = ^2 отбрасывается. Причем правильность
этого решения будет гарантирована с достоверностью (1 - q). В 100^ процентах случаев гипотеза будет отвергаться напрасно. С увеличе нием q как бы налагаются более жесткие условия на совпадение ре зультатов, и естественно, что гипотеза будет отвергаться чаще. Уменьшение q означает меньшую требовательность. Поскольку для сравнения дисперсий можно брать и обратное отношение
л ~
то получается, что F\ соответствует jr^. В итоге оказывается доста точно вычислить одну границу интервала, а именно Fj, при этом в
253
числителе берут большее значение sj,. В таблицах дается одна вели чина FT, С которой сравнивается полученное расчетное значение Fp.
Пример 7.1. Использование F-отношения. Рассмотрим результа ты моделирования инвестиционного процесса по двум вариантам бизнес-планов инвестиционного проекта. Оба варианта в конечном итоге приводят к получению одного и того же показателя чистого приведенного дохода NPV. По варианту 1 было проведено /ii = 10 опытов с имитационной моделью, а по варианту 2 проведено П2= 15 опытов. Обе серии опытов, естественно, имеют какое-то отклонение от требуемого значения NPV. Дисперсии были подсчитаны, и оказа
лось, что j ^ = 9,6 млн руб., j2 |
=5,7 млн руб. Откуда |
|
Уг |
Уг |
|
Fp |
_2 |
5,7 ' • |
|
SУ1 |
|
Степень свободы для j |
^ равна/i = 10 - 1 = 9, а для s\ она рав |
|
на^ = 15 - 1 = 14. Уравнение регрессии в этом примере имеет вид У = Ьц, где Ьа - искомое среднее значение «чистого» приведенного дохода, т.е. NPVue зависит от управляющих факторов х,. На основе полученного значения F = 1,68 требуется сделать вывод о том, оди накова ли степень неопределенности (и риска) у вариантов 1 и 2. Разница в величинах s^ и s^ может бьггь как результатом разной
неопределенности (различного риска), так и следствием случайно сти. Зададам уровень значимости q = 10%. Для/i = 9 и ^ = 14 из таб лицы (см. приложение 3) найдем Fr= 2,65. Поскольку Fp < Fj, значе ние Fp= 1,68 при ^ = 10% является незначимым, т.е. предположение о равенстве дисперсий (а следовательно, и одинаковой неопределен ности в^иантов бизнес-планов) не противоречит результатам серий опытов. Если бы получилось Fp > 2,65, то гипотезу об одинаковой неопределенности нужно бьшо бы отбросить, при этом в 10% случа ев гипотеза была бы отброшена напрасно.
Аналогичным образом, используя отношение (7.13), можно убедаться в правильности выбора степени полинома d. Если априори есть достаточно оснований для выбора d, то остаточную дисперсию
Sy можно рассматривать как оценку дисперсии, характеризующей ошибку эксперимента.
254
Кроме точности уравнения регрессии в целом большое значение имеет точность в определении самих коэффициентов регрессии. Ко эффициентами, значение которых соизмеримо с погрешностью их определения, очевидно, следует пренебречь.
Дисперсии Л , характеризующие ошибки в определении коэф-
фициентов регрессии (в каждой новой серии опытов для одного и того же уравнения регрессии будут получаться различные значения одних и тех же коэффициентов Ь, из-за влияния помех Zj), также можно определить с помощью преобразования матриц. Определим вектор ошибок:
А 6]
5-р = АЬ-
АЬ,
где р - теоретическое значение коэффициентов.
Вычислим математическое ожидание:
I Л/{(5-р)(В-Р)*)=М- Аб2 х|дЙ1 Дб2 ••• A6;t|
A^lA^l ДА1Д62 - Ab^Abk
Ab2Abi Д^зД^з ••• Ab2Abi(
Abj^Abx Ab)(Ab2 ... AbifAb/f
Черта над элементами матрицы означает усреднение по всем се риям опытов. Введем следующие обозначения:
^=M{B},A = Y-M{Y}.
Поскольку
то
М{В}:=(Х*Х)-^Х*М{Е}.
2 5 5
Случайными являются величины уиЬ,ах измеряется точно, по этому 1х*Ху^ иХ*- константы.
Сделаем следующие преобразования:
М{(Д-р)(5-р)} =
|
|
-1„*- |
|
= M{[(x*xf^X*(Y-M{Y})M(x*xf^^*(Y-(M{Y})]}= |
(7.15) |
||
= м{1(х*х) |
-1„* |
- ! „ • |
|
^*АМ(Х*Х) |
X д]} = |
|
|
= Щ(Х*Х)~'^*АА*Х(Х*Х)~'} = (Х*Х)~^^1 •
При получении результата (7.15) использованы следующие свойства матрицы:
поэтому
[t-x)i'-[WT'=tv]--(.-;r)-'.
Поясним также преобразования
АУ1
М^'А }= М-Ау2 X|AJI Ау2 ... AyJi
АУ1 |
О |
О |
О |
Ajf |
... О = alE, |
ОО ... Ayj
где Е - единичная матрица.
В соответствии с предпосылками регрессионного анализа (см. разд. 7.2) все Ayf равны, а усредненные произведения Aj;,..2 А^..-^2 =0. при / ^j (см. первую предпосылку, независимость у^).
256
Переходя к обычной форме записи, из вьфажения (7.15) получаем
ст1 =Ciioj, |
S? =Ciisl, |
(7-16) |
"i |
"i |
|
где c„ - коэффициенты (будут определены позднее).
Зная si , можно установить доверительные границы для коэф фициентов Ь,. Введем случайную величину
%
где Р/ - теоретическое значение коэффициента.
Поскольку Ь, получается из Jlинeйнoй комбинации Уи, а уи имеет нормальное распределение по условиям регрессионного анализа, то разность Ь, - Р, также распределена по нормальному закону. Величи на t, являющаяся отношением нормально распределенной случайной
величины к случайной величине, распределенной по ух^ , имеет плотность так назьшаемого ^-распределения:
1 |
r(0,5(l+/))f |
'2"» |
|
W,(t,f) = VV |
Г(0,5/) |
1+i- |
|
V |
f) |
||
Данное распределение напоминает по характеру нормальное распределение при/= 1 и переходит в него при/-» ао (рис. 7.4). Ве роятность того, что случайная величина t примет значение \t\>tq,
будет равна q. Величина q называется уровнем значимости величи ны t (рис. 7.5). Если зададимся значением q = 10% и найдем в табли це tqif) (см. приложение 4), то сможем утверждать, что в 90% слу чаев истинное значение коэффициента р, будет лежать в'пределах
bi-tq(J)Sf,.^ubi + tgif)Si,.. (7.17)
Коэффициент Ь, незначим, если
257
W,(tJ) '^ / = const
Рис. 7.4. Вид ^pacп^eдeлeния
В математической статистике нельзя дать абсолютно утверди тельного ответа ни по одному из параметров. Можно только с опре деленной степенью достоверности указьшать пределы, в которых находится значение параметра. Так, в данном случае степень досто верности равна 0,9.
Величина tq{f) возрастает с уменьшением q и уменьшается с
увеличением/ Это естественно: увеличение степени достоверноста (уменьшение q) вызывает увеличение диапазона возможного значе ния параметра (см. рис. 7.5). Увеличение/означает увеличение чис ла испытаний, т.е. более точное определение параметров процесса, поэтому с ростом/диапазон разброса параметра tgif) уменьшается.
Доверительные границы по соотношению (7.17) можно устано вить только для случая ортогонального планирования,' когда диаго нальные элементы обратной матрицы с„ определяются независимо:
_ 1 _
си = («•)
258
W,(t,f) '^ /= const
-ta
Рис. 7.5. Пример использования ^-распределения для определения интервала достоверности
Если матрица не диагональная (для неортогонального планиро вания), то в вычислении с,/ участвуют все элементы матрицы (ЛХ). При изменении числа переменных к, естественно, си получают дру гое значение. Поэтому определение дисперсии для каждого коэффи циента Ь, становится возможным только при фиксировании значений остальных коэффициентов.
Рассмотрим пример на получение и анализ уравнения регрессии. Пример 7.2. Неортогональное планирование эксперимента. Для того чтобы лучше представлять, как идет процесс решения, зададим сами функцию двух переменных хи хг, и полученные значения функции в заданных точках «засорим» шумами. По этим «засоренньпй» точкам, которые будут имитировать экспериментальные точ ки, будем искать нами же заданнь1й полином (в действительности же
вид полинома и даже его степень бывают неизвестны):
Ti(JCi,X2) = 10 + 4 + 6 ^ , + 3 , |
|
'•^2 |
'.V1.X2 • |
Значения функции лС^Ь'^г) и измеренные значения >'„ представ лены в табл. 7.1.
259
Таблица 7.1
|
|
Значения функции П('^1>'^2) |
|
|
|
||||
и |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Х\ |
0 |
0 |
0 |
1 |
2 |
1 |
2 |
0 |
-1 |
Х2 |
0 |
1 |
2 |
0 |
0 |
1 |
2 |
-1 |
-1 |
rix^.Xj) |
10 |
16 |
22 |
14 |
18 |
23 |
42 |
4 |
3 |
Уь |
10 |
17 |
20 |
14 |
18 |
24 |
40 |
3 |
3 |
Дл |
0 |
1 |
-2 |
0 |
0 |
1 |
-2 |
-1 |
0 |
yJ |
0 |
1 |
4 |
0 |
0 |
I |
4 |
1 |
0 |
В ряде случаев бывает известна ошибка опыта. В данном приме ре можно принять за ошибку опыта разность мезеду Уи и r\(xi,X2). Тогда
c^y = ^hyl |
= ^ = l,22: c^=Ul;/=^^=9. |
^«=1 |
^ |
Забудем теперь об уравнении для TI(XI,X2) и начнем искать уравнение регрессии в линейной форме [см. формулу (7.2)], так как полином нулевой степени явно не обеспечит адекватности:
5? = *0'^о+*1-^1+*2^2. ^"2;
|
XQ |
Xi |
Х2 |
|
1 |
0 |
0 |
|
1 |
0 |
1 |
|
1 |
0 |
2 |
Х = |
1 |
1 |
0 |
|
1 |
2 |
0 |
|
1 |
1 |
1 |
|
1 |
2 |
2 |
|
1 |
0 |
- 1 |
|
1 |
-1 |
-1 |
Система точек неортогональна:
9
260
