![](/user_photo/_userpic.png)
книги / Математические методы принятия решений
..pdfОценим, как изменится среднее число измерений при учете по грешности наблюдений.
В традиционных методах определено, что среднее число наблю дений, когда истинна гипотеза Н\, равно гц:
щ = — ((1 —a) In А + а In В),
Z
где z = In P(z|<*>l) p(x|w 2)'
Если истинна гипотеза Я 2, то
1
п2 = -(р 1 п Л + (1-р)1пВ ).
Z
В рассматриваемом случае, когда известны интервальные оцен ки а и р, необходимо взять верхние границы In А и In В и соответ ственно верхние или нижние границы а и р . Тогда новое среднее число измерений будет
П1н —
= |
у [(1 - « + A a)(ln А + |
+ (а + A a)(ln В - ^ ! ) ] |
= |
|
= |
-J [(1 —а + Д а) р р + Д а(1п А + In В) — |
(а + Д а)| + |
||
|
|
|
+ Й1. |
(9.7) |
Здесь первое слагаемое в квадратных скобках — поправка к средне му числу наблюдений.
Рассмотрим
г. - in **> ■ > |
в z + |
(9.8) |
р(х I С02) + Лр2 |
|
р(х I £01 ) р(х | 6>2) |
Поскольку мы оцениваем среднее значение (результат многократ ных наблюдений), то можно считать, что при
Api _ |
Арг |
p(l|ü)i) |
р(х I <02) ’ |
т. е. при одинаковой относительной погрешности для условных функций плотности распределения вероятностей, знаменатель дро би в формуле (9.7) при определении п\н не изменяется. Поэтому будем считать, что не меняется и zH. (Это не означает, что не будут меняться другие параметры, определяемые из условия (9.8).)
Среднее число наблюдений (если верна гипотеза Д 2, с учетом интервальных оценок а, р, А и В) находится по формуле
П2„ = 7 [ф + AP)(lnА + |
+ (1 - P + Ap)(lnВ - |
^ ) ] = |
||||
|
= п2+ 1 [(р - Др- 1) |
+ АР ln(ÆB) + ^ |
(Р + ДР)], |
|||
где |
А А /А |
и |
Д В /В |
находят |
из предположения, что |
погрешно |
сти |
A A , |
А В , |
Да, |
Др независимы и подчиняются |
нормально |
му закону распределения с дисперсиями, соответственно равны ми (ДЛ)2, (А В )2, (Д а)2, (Др)2.
По формулам переноса ошибок получим
§9.10. Сравнение зон неопределенности. Общий алгоритм принятия решений
Как было показано, поскольку в реальных условиях невозможно провести измерение без погрешностей, процедуру методов после довательного принятия решений используют и в процессе принятия решений по выборке фиксированного объема. Представляет ин терес сравнить зоны неопределенности, полученные в процессах принятия решений по выборке фиксированного объема и в по следовательных методах. Другими словами, не является ли зона неопределенности (нулевая зона) при анализе выборки фиксиро ванного объема столь незначительной, что ее учет представляет только теоретический интерес.
Одномерный случай
Пусть некоторый признак объекта х распределен по нормально му закону с математическим ожиданием т\ и дисперсией о\ для ги потезы Но и с математическим ожиданием m 2 и дисперсией о\ для гипотезы Н\. При равных вероятностях гипотез Но и Н\ решаю
щая граница хо имеет вид
яо = у ("М + m2).
В этом случае дисперсия определяется по формуле
D(z0) = [a2(mi) + о2(тп2)],
где a2(fhi) — дисперсия оценки математического ожидания fhi, г = = 1,2. При одинаковых дисперсиях a2(fh\) = о2{тг) = а(т) имеем
а ( т )
о(хо ): vT
Во многих случаях, когда инструментальная погрешность изме рения не является определяющей, оценкой математического ожида ния нормального закона распределения является среднее арифмети ческое результатов наблюдений х :
т = Х = ^ Х г ,
г=1 отсюда получаем среднее квадратическое отклонение
а ( т ) = о(х) =
где о2(х) — дисперсия наблюдаемых значений х.
Ширина зоны неопределенности в этом случае будет такой
2ta(fh) _ \/2to(x) yjï ~ у/п
где t — квантиль нормального распределения, определяемая довери тельной вероятностью, t = 1, 2,...
В методе последовательного принятия решений, когда решение принимается по среднему значению х, ширина полосы неопреде ленности в случае нормального распределения признака с матема тическими ожиданиями mi и m 2 для разных гипотез и с одинако выми дисперсиями а2 для обеих гипотез при числе наблюдений, равном п, определяется выражением
о2 А
где А и В —соответственно останавливающие верхние и нижние границы:
Здесь а и р — ошибки первого и второго рода.
Пусть \т\ —шг| = ко. Тогда ширина полосы неопределенности
определяется по формуле |
|
L - f |
1п( 1 - ? ' - Р > . |
кп |
ра |
Чем больше разность математических ожиданий т \ и m 2, т. е. чем больше к, тем меньше а и р и тем уже полоса неопределен ности. Найдем конкретные значения ширины полосы неопреде
ленности для равновероятных |
гипотез. |
Пусть |
\rrii —mj\ = 4о; |
|
тогда а = р = (1 —0,95)/2 = 0,025. |
При |
|mi —7712I = 2о получим |
||
ошибки а = р = (1 —0,68)/2 = 0,16. |
В первом случае ширина по |
|||
лосы неопределенности будет « |
1,5а/п, во втором |
«г 2о/п. |
Приведенные результаты показывают, что зоны неопределенно сти в задачах принятия решений при фиксированном объеме вы борки и в последовательных методах соизмеримы, поскольку о(х) наиболее часто совпадает с ст. Причем отношение ширин полос в этих методах принятия решений равно
V 2 to (x )k n |
y /2 tk y /n |
s j n o In ( 1 - « ) ( ! — P) ~ |
1/n . |
ln (1 - « ) ( ! ~ P ) |
|
«P |
«P |
Следовательно, в процессе принятия решения при фиксиро ванном объеме выборки ширина зоны неопределенности может быть даже больше, чем в методе последовательного принятия ре шений.
Двумерный случай
Рассмотрим задачу принятия решений по двум признакам х и у, имеющим распределение Гаусса. Для простоты будем считать, что решающая граница — прямая линия.
Уравнение линейной решающей функции приводилось в §6.3:
XTK ~1(MI - м2) - у (Mi + м2у к - \ м х- М2) + In |
= 0, |
||
где |
ж—текущий вектор; |
Mj —вектор математического |
ожидания |
для |
г-й гипотезы, г = 1,2; |
К — ковариационная матрица, одинако |
вая для обеих гипотез; Р(о>*) — вероятность г-й гипотезы, i= 1, 2. В рассматриваемом случае при равновероятных гипотезах и еди ничной ковариационной матрице уравнение решающей прямой
имеет вид
х{т Хх - т 2х) + у(тп\у - т 2у) - у (m2lx - т \х + т \у - т \у) = 0.
Здесь mix, miy — математические ожидания соответственно коорди нат х и у для г-й гипотезы, г = 1, 2.
В процессе наблюдений необходимо найти оценки rhij и их дисперсии D(ihij), а также оценки и дисперсии оценок элементов ковариационной матрицы К (если они не исключены из рассмот рения).
Представим уравнение прямой в традиционном виде:
у = 00 + 0JX,
где
ТП1х mix ТП1у ТП2у
Интервальную оценку прямой (интервальную оценку значе ний у) можно найти, пользуясь формулой
здесь D(0) выражается через rhij и D(mÿ). Последняя формула определяет дисперсию значений у для любого значения х, тем са мым и интервальные оценки решающей границы.
В методе последовательного принятия решений в двумерном случае, когда признаки независимы и подчиняются нормально му закону распределения с математическими ожиданиями М\ = = (7П|Х, т \у ) и М 2 = ( т 2х, т 2у) и общей ковариционной матрицей
К = ^ J Q , после проведения первого измерения (х\,У ^ выРа*
жение In Xi будет иметь следующий вид:
In Xi = In р(хи у\ |<Jl) p(xu yi |u 2)
|
_ s(_ |
m lx+ m 2x\ |
|
|
^ |
тту_+тМ ) |
|||
уТ71\х ~ |
ТП2х ) у Х \ |
J |
J |
\ т ,\у |
™ 2 у ) \ У \ |
2 |
) |
||
После п наблюдений х \9у \9. .. 9х п, уп получим |
|
|
|||||||
|
|
|
п |
p jx u y il <j>l) |
|
|
|
||
|
|
|
|
|
|
|
|||
|
|
lnXn = £ l n |
|
|
|
|
|
||
или |
|
|
<=1 |
p(xi,yi\u2y |
|
|
|
||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
(Щ \ х |
m2x) |
S |
Xi - -=- (m ix + |
rn2x) |
|
|
|
|
|
ln Xn — |
|
Li=l |
z |
__________ . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(miy |
m2y) |
' n |
2/< - |
n |
|
|
|
|
|
S |
x (m i» + |
|
|||
|
|
|
|
|
|
,i=l |
|
___________J |
|
Рассматриваем |
неравенства |
ln Xn ^ ln A и |
ln Xn ^ ln В и |
при |
нимаем решение о прекращении или продолжении наблюдений. Несмотря на то, что выражения получились более громоздкими, чем в одномерном случае, их структура не изменилась: останав ливающие границы будут представлять собой две параллельные прямые.
Границы зоны неопределенности, полученные в процессе при нятия решений по выборке фиксированного объема, когда решаю щая функция есть прямая линия, описываются гиперболами. Ши рина зоны неопределенности зависит от значений признаков х и у. Если х = х и у = у, то ширина зоны будет минимальной. По ме ре удаления от точки с координатами (х, у) зона неопределенности
будет резко увеличиваться. |
|
|
Для других видов решающих функций у = f { x \ |
x m) от слу |
|
чайных значений признаков |
х \ ,х 2, . ..,ж т интервальная оценка |
|
также находится с помощью |
вычисления дисперсии |
значений у. |
Дисперсия D(y) может быть определена по формуле
г=1 j=2 j>i
где D(xj, X j ) — корреляционный момент для случайных величин Х{
И X j .
Итак, показано, что в любом методе принятия решений из-за погрешностей исходных данных образуется область неопределен ности с останавливающими границами: верхними DB(x) и нижни ми D„(x). Это могут быть или границы интервальных оценок ре шающих функций, или обычные останавливающие границы, полу чающиеся в методе последовательного принятия решений. Пусть разность решающих границ между г- и j -областями D(x) = D;(x) — —Dj(x) равна нулю; тогда для любой задачи принятия решений (для последовательных методов или при фиксированном объеме выбор ки) справедлив следующий алгоритм:
1)если истинные значения точки наблюдения «выше» грани цы DB(x), то х ~ oii;
2)если истинные значения точки наблюдения «ниже» грани цы D„(x), то х ~ (ùj\
3)если истинные значения точки наблюдения расположены «между» границами DB(x) и D„(x), то следует продолжить наблю дения.
Глава 10
ПОСТРОЕНИЕ ПРОГНОЗОВ
§ 10.1. Особенности процедуры прогнозирования
Процедуры построения прогнозов используются почти во всех областях знания, в том числе в экономике, социологии, технике, об разовании и т. д. Процесс построения прогноза можно представить
ввиде двух взаимно связанных задач:
1)построение модели исследуемого явления;
2)оценка основных характеристик (параметров) модели по ба зовым данным и получение по этой модели интервальной оценки прогноза.
Как правило, эти задачи дополняют друг друга, процесс постро ения прогноза часто бывает итерационным, состоящим в оценке параметров модели по базовым данным, и полученные интерваль ные оценки прогноза могут послужить основанием для измене ния исходной модели и последующего пересчета прогноза. В за даче расчета прогноза особое внимание должно быть уделено учету погрешностей исходных данных при оценке характеристик (пара метров) модели и процедуре получения интервальных оценок про гнозов.
Решение первой задачи базируется на использовании физиче ских законов, законов развития общества, а часто и на интуиции, вторая задача может быть решена методами математической стати стики. Таким образом, если в силу законов природы, технических закономерностей и законов общественного развития может быть получена модель явления, то основная проблема получения досто верного прогноза переносится на выбор математического метода.
В процессе построения модели какого-либо явления опираются, как правило, на наиболее устойчивые события. Например, наилуч шим условием для построения модели и последующего прогноза является постоянство процесса или параметров модели. Поэтому
при построении модели наряду с интегральными методами и эле ментарными функциями используют конечные разности такого по рядка, при котором процесс считается стационарным. Однако сле дует иметь в виду, что погрешности значений конечных разностей намного больше, чем погрешности значений исходных данных, по которым получены конечные разности.
Модели бывают концептуальные, физические или математиче ские (иначе: феноменологические, эмпирические и аналитические), в зависимости от того, какой аспект явления в данном случае наи более существен, от методов, которые можно использовать при построении модели, от количества и качества имеющейся инфор мации.
Относительная простота вида модели является главной характе ристикой модели. Во многих случаях для того, чтобы модель была применима, ее сложность должна находиться в определенном соот ветствии со сложностью описываемого объекта. Если физический механизм явления полностью ясен, можно составить математиче ское выражение, точно описывающее это явление. Часто для полу чения таких описаний (моделей) необходимы подробные сведения о явлении, которых может не быть, тогда приходится прибегать к построению эмпирической модели. Оба эти случая представляют собой крайности. Обычно используемые модели занимают проме жуточное положение между ними. В частности, можно использо вать некоторые теоретические представления для указания подхо дящего класса математических функций, для которых могут быть эмпирически подобраны число и параметры моделей по экспери ментальным данным.
Теоретический анализ не только помогает выбрать подходящий вид модели, но и получить хорошие оценки числовых значений ее параметров. Эти значения затем проверяют, анализируя реальные данные. Результат такой проверки служит, в свою очередь, основа нием для пересмотра модели.
Итерационный подход к построению моделей включает в себя следующие этапы.
1. На основе теории и практических сведений о явлении выби рается класс моделей с учетом тех целей, для которых создается модель.
2.Разрабатываются простейшие методы идентификации под классов этих моделей. Процесс идентификации может быть исполь зован для получения предварительных оценок параметров моделей.
3.Пробная модель подгоняется к экспериментальным данным, оцениваются ее параметры. Предварительные оценки, полученные на этапе идентификации, теперь можно использовать как начальные значения в более точных итеративных методах оценивания пара метров.
4.Диагностические проверки позволяют выявить возможные дефекты выбранной модели и диагностировать их причины. Если такие дефекты не выявлены, модель можно использовать. Если об наружено какое-либо несоответствие оценок параметров модели, то итеративные циклы идентификации, оценок и диагностической проверки повторяют до тех пор, пока не будет найден подходящий вид модели.
Впрактике широко используют параметрические модели, когда общий вид модели известен, а оцениваются только параметры мо дели. Это повысило интерес к задачам оценивания параметров при построении таких моделей по экспериментальным данным.
При построении модели необходимо стремиться ответить на следующие вопросы:
1)как оценить качество модели?
2)как учесть всю имеющуюся информацию?
3)в чем состоит оптимальная стратегия получения недостаю щей информации?
4)что делать с нелинейностями?
5)можно ли аппроксимировать сложную систему простой мо делью?
Ответы на эти вопросы зависят от конкретного класса систем. На практике отыскание подходящей модели может быть достаточно сложной задачей.
Математическую модель системы называют детерминирован ной, если входящие в нее описания воздействия и параметры мо дели являются постоянными, или детерминированными, функци ями переменных состояния и времени. Математическую модель системы называют статистической (стохастической), если функ ции, описывающие воздействия, и параметры модели являются