Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Математические методы принятия решений

..pdf
Скачиваний:
3
Добавлен:
13.11.2023
Размер:
22.94 Mб
Скачать

Оценим, как изменится среднее число измерений при учете по­ грешности наблюдений.

В традиционных методах определено, что среднее число наблю­ дений, когда истинна гипотеза Н\, равно гц:

щ = — ((1 —a) In А + а In В),

Z

где z = In P(z|<*>l) p(x|w 2)'

Если истинна гипотеза Я 2, то

1

п2 = -(р 1 п Л + (1-р)1пВ ).

Z

В рассматриваемом случае, когда известны интервальные оцен­ ки а и р, необходимо взять верхние границы In А и In В и соответ­ ственно верхние или нижние границы а и р . Тогда новое среднее число измерений будет

П1н —

=

у [(1 - « + A a)(ln А +

+ (а + A a)(ln В - ^ ! ) ]

=

=

-J [(1 —а + Д а) р р + Д а(1п А + In В) —

(а + Д а)| +

 

 

 

+ Й1.

(9.7)

Здесь первое слагаемое в квадратных скобках — поправка к средне­ му числу наблюдений.

Рассмотрим

г. - in **> ■ >

в z +

(9.8)

р(х I С02) + Лр2

 

р(х I £01 ) р(х | 6>2)

Поскольку мы оцениваем среднее значение (результат многократ­ ных наблюдений), то можно считать, что при

Api _

Арг

p(l|ü)i)

р(х I <02) ’

т. е. при одинаковой относительной погрешности для условных функций плотности распределения вероятностей, знаменатель дро­ би в формуле (9.7) при определении п\н не изменяется. Поэтому будем считать, что не меняется и zH. (Это не означает, что не будут меняться другие параметры, определяемые из условия (9.8).)

Среднее число наблюдений (если верна гипотеза Д 2, с учетом интервальных оценок а, р, А и В) находится по формуле

П2„ = 7 + AP)(lnА +

+ (1 - P + Ap)(lnВ -

^ ) ] =

 

= п2+ 1 [(р - Др- 1)

+ АР ln(ÆB) + ^

(Р + ДР)],

где

А А /А

и

Д В /В

находят

из предположения, что

погрешно­

сти

A A ,

А В ,

Да,

Др независимы и подчиняются

нормально­

му закону распределения с дисперсиями, соответственно равны­ ми (ДЛ)2, (А В )2, (Д а)2, (Др)2.

По формулам переноса ошибок получим

§9.10. Сравнение зон неопределенности. Общий алгоритм принятия решений

Как было показано, поскольку в реальных условиях невозможно провести измерение без погрешностей, процедуру методов после­ довательного принятия решений используют и в процессе принятия решений по выборке фиксированного объема. Представляет ин­ терес сравнить зоны неопределенности, полученные в процессах принятия решений по выборке фиксированного объема и в по­ следовательных методах. Другими словами, не является ли зона неопределенности (нулевая зона) при анализе выборки фиксиро­ ванного объема столь незначительной, что ее учет представляет только теоретический интерес.

Одномерный случай

Пусть некоторый признак объекта х распределен по нормально­ му закону с математическим ожиданием т\ и дисперсией о\ для ги­ потезы Но и с математическим ожиданием m 2 и дисперсией о\ для гипотезы Н\. При равных вероятностях гипотез Но и Н\ решаю­

щая граница хо имеет вид

яо = у ("М + m2).

В этом случае дисперсия определяется по формуле

D(z0) = [a2(mi) + о2(тп2)],

где a2(fhi) — дисперсия оценки математического ожидания fhi, г = = 1,2. При одинаковых дисперсиях a2(fh\) = о2{тг) = а(т) имеем

а ( т )

о(хо ): vT

Во многих случаях, когда инструментальная погрешность изме­ рения не является определяющей, оценкой математического ожида­ ния нормального закона распределения является среднее арифмети­ ческое результатов наблюдений х :

т = Х = ^ Х г ,

г=1 отсюда получаем среднее квадратическое отклонение

а ( т ) = о(х) =

где о2(х) — дисперсия наблюдаемых значений х.

Ширина зоны неопределенности в этом случае будет такой

2ta(fh) _ \/2to(x) yjï ~ у/п

где t — квантиль нормального распределения, определяемая довери­ тельной вероятностью, t = 1, 2,...

В методе последовательного принятия решений, когда решение принимается по среднему значению х, ширина полосы неопреде­ ленности в случае нормального распределения признака с матема­ тическими ожиданиями mi и m 2 для разных гипотез и с одинако­ выми дисперсиями а2 для обеих гипотез при числе наблюдений, равном п, определяется выражением

о2 А

где А и В соответственно останавливающие верхние и нижние границы:

Здесь а и р — ошибки первого и второго рода.

Пусть \т\ шг| = ко. Тогда ширина полосы неопределенности

определяется по формуле

 

L - f

1п( 1 - ? ' - Р > .

кп

ра

Чем больше разность математических ожиданий т \ и m 2, т. е. чем больше к, тем меньше а и р и тем уже полоса неопределен­ ности. Найдем конкретные значения ширины полосы неопреде­

ленности для равновероятных

гипотез.

Пусть

\rrii mj\ = 4о;

тогда а = р = (1 —0,95)/2 = 0,025.

При

|mi —7712I = 2о получим

ошибки а = р = (1 —0,68)/2 = 0,16.

В первом случае ширина по­

лосы неопределенности будет «

1,5а/п, во втором

«г 2о/п.

Приведенные результаты показывают, что зоны неопределенно­ сти в задачах принятия решений при фиксированном объеме вы­ борки и в последовательных методах соизмеримы, поскольку о(х) наиболее часто совпадает с ст. Причем отношение ширин полос в этих методах принятия решений равно

V 2 to (x )k n

y /2 tk y /n

s j n o In ( 1 - « ) ( ! — P) ~

1/n .

ln (1 - « ) ( ! ~ P )

«P

«P

Следовательно, в процессе принятия решения при фиксиро­ ванном объеме выборки ширина зоны неопределенности может быть даже больше, чем в методе последовательного принятия ре­ шений.

Двумерный случай

Рассмотрим задачу принятия решений по двум признакам х и у, имеющим распределение Гаусса. Для простоты будем считать, что решающая граница — прямая линия.

Уравнение линейной решающей функции приводилось в §6.3:

XTK ~1(MI - м2) - у (Mi + м2у к - \ м х- М2) + In

= 0,

где

ж—текущий вектор;

Mj —вектор математического

ожидания

для

г-й гипотезы, г = 1,2;

К — ковариационная матрица, одинако­

вая для обеих гипотез; Р(о>*) — вероятность г-й гипотезы, i= 1, 2. В рассматриваемом случае при равновероятных гипотезах и еди­ ничной ковариационной матрице уравнение решающей прямой

имеет вид

х{т Хх - т 2х) + у(тп\у - т 2у) - у (m2lx - т \х + т \у - т \у) = 0.

Здесь mix, miy — математические ожидания соответственно коорди­ нат х и у для г-й гипотезы, г = 1, 2.

В процессе наблюдений необходимо найти оценки rhij и их дисперсии D(ihij), а также оценки и дисперсии оценок элементов ковариационной матрицы К (если они не исключены из рассмот­ рения).

Представим уравнение прямой в традиционном виде:

у = 00 + 0JX,

где

ТП1х mix ТП1у ТП2у

Интервальную оценку прямой (интервальную оценку значе­ ний у) можно найти, пользуясь формулой

здесь D(0) выражается через rhij и D(mÿ). Последняя формула определяет дисперсию значений у для любого значения х, тем са­ мым и интервальные оценки решающей границы.

В методе последовательного принятия решений в двумерном случае, когда признаки независимы и подчиняются нормально­ му закону распределения с математическими ожиданиями М\ = = (7П|Х, т \у ) и М 2 = ( т 2х, т 2у) и общей ковариционной матрицей

К = ^ J Q , после проведения первого измерения (х\,У ^ выРа*

жение In Xi будет иметь следующий вид:

In Xi = In р(хи у\ |<Jl) p(xu yi |u 2)

 

_ s(_

m lx+ m 2x\

 

 

^

тту_+тМ )

уТ71\х ~

ТП2х ) у Х \

J

J

\ т ,\у

™ 2 у ) \ У \

2

)

После п наблюдений х \9у \9. .. 9х п, уп получим

 

 

 

 

 

п

p jx u y il <j>l)

 

 

 

 

 

 

 

 

 

 

 

 

lnXn = £ l n

 

 

 

 

 

или

 

 

<=1

p(xi,yi\u2y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Щ \ х

m2x)

S

Xi - -=- (m ix +

rn2x)

 

 

 

 

ln Xn —

 

Li=l

z

__________ .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(miy

m2y)

' n

2/< -

n

 

 

 

 

 

S

x (m i» +

 

 

 

 

 

 

 

,i=l

 

___________J

Рассматриваем

неравенства

ln Xn ^ ln A и

ln Xn ^ ln В и

при­

нимаем решение о прекращении или продолжении наблюдений. Несмотря на то, что выражения получились более громоздкими, чем в одномерном случае, их структура не изменилась: останав­ ливающие границы будут представлять собой две параллельные прямые.

Границы зоны неопределенности, полученные в процессе при­ нятия решений по выборке фиксированного объема, когда решаю­ щая функция есть прямая линия, описываются гиперболами. Ши­ рина зоны неопределенности зависит от значений признаков х и у. Если х = х и у = у, то ширина зоны будет минимальной. По ме­ ре удаления от точки с координатами (х, у) зона неопределенности

будет резко увеличиваться.

 

 

Для других видов решающих функций у = f { x \

x m) от слу­

чайных значений признаков

х \ ,х 2, . ..,ж т интервальная оценка

также находится с помощью

вычисления дисперсии

значений у.

Дисперсия D(y) может быть определена по формуле

г=1 j=2 j>i

где D(xj, X j ) — корреляционный момент для случайных величин Х{

И X j .

Итак, показано, что в любом методе принятия решений из-за погрешностей исходных данных образуется область неопределен­ ности с останавливающими границами: верхними DB(x) и нижни­ ми D„(x). Это могут быть или границы интервальных оценок ре­ шающих функций, или обычные останавливающие границы, полу­ чающиеся в методе последовательного принятия решений. Пусть разность решающих границ между г- и j -областями D(x) = D;(x) — —Dj(x) равна нулю; тогда для любой задачи принятия решений (для последовательных методов или при фиксированном объеме выбор­ ки) справедлив следующий алгоритм:

1)если истинные значения точки наблюдения «выше» грани­ цы DB(x), то х ~ oii;

2)если истинные значения точки наблюдения «ниже» грани­ цы D„(x), то х ~ (ùj\

3)если истинные значения точки наблюдения расположены «между» границами DB(x) и D„(x), то следует продолжить наблю­ дения.

Глава 10

ПОСТРОЕНИЕ ПРОГНОЗОВ

§ 10.1. Особенности процедуры прогнозирования

Процедуры построения прогнозов используются почти во всех областях знания, в том числе в экономике, социологии, технике, об­ разовании и т. д. Процесс построения прогноза можно представить

ввиде двух взаимно связанных задач:

1)построение модели исследуемого явления;

2)оценка основных характеристик (параметров) модели по ба­ зовым данным и получение по этой модели интервальной оценки прогноза.

Как правило, эти задачи дополняют друг друга, процесс постро­ ения прогноза часто бывает итерационным, состоящим в оценке параметров модели по базовым данным, и полученные интерваль­ ные оценки прогноза могут послужить основанием для измене­ ния исходной модели и последующего пересчета прогноза. В за­ даче расчета прогноза особое внимание должно быть уделено учету погрешностей исходных данных при оценке характеристик (пара­ метров) модели и процедуре получения интервальных оценок про­ гнозов.

Решение первой задачи базируется на использовании физиче­ ских законов, законов развития общества, а часто и на интуиции, вторая задача может быть решена методами математической стати­ стики. Таким образом, если в силу законов природы, технических закономерностей и законов общественного развития может быть получена модель явления, то основная проблема получения досто­ верного прогноза переносится на выбор математического метода.

В процессе построения модели какого-либо явления опираются, как правило, на наиболее устойчивые события. Например, наилуч­ шим условием для построения модели и последующего прогноза является постоянство процесса или параметров модели. Поэтому

при построении модели наряду с интегральными методами и эле­ ментарными функциями используют конечные разности такого по­ рядка, при котором процесс считается стационарным. Однако сле­ дует иметь в виду, что погрешности значений конечных разностей намного больше, чем погрешности значений исходных данных, по которым получены конечные разности.

Модели бывают концептуальные, физические или математиче­ ские (иначе: феноменологические, эмпирические и аналитические), в зависимости от того, какой аспект явления в данном случае наи­ более существен, от методов, которые можно использовать при построении модели, от количества и качества имеющейся инфор­ мации.

Относительная простота вида модели является главной характе­ ристикой модели. Во многих случаях для того, чтобы модель была применима, ее сложность должна находиться в определенном соот­ ветствии со сложностью описываемого объекта. Если физический механизм явления полностью ясен, можно составить математиче­ ское выражение, точно описывающее это явление. Часто для полу­ чения таких описаний (моделей) необходимы подробные сведения о явлении, которых может не быть, тогда приходится прибегать к построению эмпирической модели. Оба эти случая представляют собой крайности. Обычно используемые модели занимают проме­ жуточное положение между ними. В частности, можно использо­ вать некоторые теоретические представления для указания подхо­ дящего класса математических функций, для которых могут быть эмпирически подобраны число и параметры моделей по экспери­ ментальным данным.

Теоретический анализ не только помогает выбрать подходящий вид модели, но и получить хорошие оценки числовых значений ее параметров. Эти значения затем проверяют, анализируя реальные данные. Результат такой проверки служит, в свою очередь, основа­ нием для пересмотра модели.

Итерационный подход к построению моделей включает в себя следующие этапы.

1. На основе теории и практических сведений о явлении выби­ рается класс моделей с учетом тех целей, для которых создается модель.

2.Разрабатываются простейшие методы идентификации под­ классов этих моделей. Процесс идентификации может быть исполь­ зован для получения предварительных оценок параметров моделей.

3.Пробная модель подгоняется к экспериментальным данным, оцениваются ее параметры. Предварительные оценки, полученные на этапе идентификации, теперь можно использовать как начальные значения в более точных итеративных методах оценивания пара­ метров.

4.Диагностические проверки позволяют выявить возможные дефекты выбранной модели и диагностировать их причины. Если такие дефекты не выявлены, модель можно использовать. Если об­ наружено какое-либо несоответствие оценок параметров модели, то итеративные циклы идентификации, оценок и диагностической проверки повторяют до тех пор, пока не будет найден подходящий вид модели.

Впрактике широко используют параметрические модели, когда общий вид модели известен, а оцениваются только параметры мо­ дели. Это повысило интерес к задачам оценивания параметров при построении таких моделей по экспериментальным данным.

При построении модели необходимо стремиться ответить на следующие вопросы:

1)как оценить качество модели?

2)как учесть всю имеющуюся информацию?

3)в чем состоит оптимальная стратегия получения недостаю­ щей информации?

4)что делать с нелинейностями?

5)можно ли аппроксимировать сложную систему простой мо­ делью?

Ответы на эти вопросы зависят от конкретного класса систем. На практике отыскание подходящей модели может быть достаточно сложной задачей.

Математическую модель системы называют детерминирован­ ной, если входящие в нее описания воздействия и параметры мо­ дели являются постоянными, или детерминированными, функци­ ями переменных состояния и времени. Математическую модель системы называют статистической (стохастической), если функ­ ции, описывающие воздействия, и параметры модели являются

Соседние файлы в папке книги