Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебники ТПР / Учебник ТПР_5.3.doc
Скачиваний:
147
Добавлен:
17.06.2016
Размер:
389.12 Кб
Скачать

Примером такой игры может быть задача о планировании проведения ремонта корабельной асу.

Пример 4.

Пусть установлено, что автоматизированная система управления находится в одном из двух возможных состояний:

1 - система выработала свой технический ресурс до ремонта;

2 - система не выработала свой ресурс.

Пусть также известно распределение вероятностей состояния системы:

= 0,6; = 0,4.

Для планирования ремонта возможны четыре различных способа действий:

x1- не проводить плановый ремонт;

x2- провести межпоходовый ремонт;

x3- провести текущий ремонт;

x4- провести средний ремонт.

Потери (в условных единицах), которые возникают при этом, сведены в матрицу потерь вида

В эти потери включается стоимость ремонта, а также убытки, связанные с происходящими отказами в АСУ.

При выборе принципа минимаксанаходимс ценой игрыg31= 7.

При выборе принципа Байеса

= 0,610 + 0,44 = 7,6;=0,68 + 0,45 = 6,8;

= 0,67 + 0,46 = 6,6;= 0,67 + 0,48 = 7,4.

Таким образом, действием, обеспечивающим минимальные потери, будет действие х3.

Статистические игры с экспериментами

Чтобы уменьшить неопределенность относительно состояния природы, проводится эксперимент, в ходе которого наблюдается некоторая случайная величина z, характеризующая состояние природы . Возможные значения этой случайной величиныzk  Z образуют выборочное пространство :

 = <Z,,f>,

где f(zk /j),– плотность распределения вероятности исхода экспериментаzkпри данном состоянии природыj.

Зная значения zkи знаяf(zk /j), можно получить информацию относи­тельно состояния природы , которая в свою очередь поможет создать общую стратегию игры, определяющую выбор действия (хода)xi для каж­догоzk. Выбор такой стратегии эквивалентен выбору решающей функцииd, определяющей альтернативуxi, которую нужно выбрать при всех возможных значенияхzk:d(zk) =xi.

Предположим, например, что множество возможных вариантов действий (ходов) Х = <x1,x2, x3>, а пространс­тво исходов экспериментаZ= {z1,z2,z3,z4}. Решающая функция задана перечислением для каждогоxiподмножеств из пространс­тва (множества) возможных исходов экспериментаZl. Такой функцией может быть семейство:

Z1= {z1,z2} для выбораx1;

Z2= {z3} для выбораx2;

Z3= {z4} для выбораx3.

Эта решающая функция, вместе с другими возможными решающими функциями, задает пространство (множество) решающих функций D. Для задания таких решающих функций будем использовать индексы приd, которые указывают на индексiдействия (хода)хiв случае исходаzk. Мощность множестваZопределяет количество индексов (позиций). Так, для задачи, приведенной в примере 4,d1123означает, что при исходах экспериментаz1,z2,z3,z4 выбираются соответственноx1,x1,x2, x3.

Теорию принятия решений в условиях статистической неопределенности можно считать наукой о том, как выбрать решающую функцию из пространства (множества) решающих функций D.

Два основных раздела математической статистики:оцениваниеипроверка гипотез– являютсячастными случаями сформулированной общей задачи принятия решений в условиях неопределённости.

При оценивании считают, что множество возможных действий Х равно множеству возможных состояний природы (обычно это числовая ось или ее подмножество). Т. к. в данном случае принятие решения состоит в выборе наилучшего варианта действий с точки зрения потерь, т.е. в оценке потерь при каждом возможном варианте и выборе такого варианта, при котором потери минимальны.

Вид функции потерьLзависит отособенностей моделируе­мой задачи, но наиболеетипичными являются:

L(, z) = |–d(z)| илиL(, z) = (–d(z))2.

Решающая функция, называемаяпроцедурой оцениваниявидаd: Z R1, оценивает параметр «состояние природы» – значения случайной величины– по данным исхода эксперимента z, т. е. отображает множество Z возможных исходов эксперимента, характеризующих состояния природы, на числовую ось R1.

Так, например,

d1(z) = 1/n(z1+...+zn) = оценивает ма­тематическое ожидание случайной величины;

d2(z) =оценивает дисперсию этой величины.

Проверка гипотез при помощи эксперимента

При проверке гипотезпространство параметровпредс­тавляется в виде объединения двух непересекающихся подмно­жеств:0(подмно­жество благоприятных состояний природы) и1(подмно­жество не благоприятных состояний природы):01 = и01=.

Множество возможных решений состоит только из двух аль­тернатив х0иx1, определяемых таким образом, что действиех0 состоит в принятии гипотезы Н0:0, а действиеx1– в принятии гипотезы Н1:1. Под значениемпонимается фактическое состояние природы.

Функция потерь зависит от подмножеств возможных состояний природы 0и1. Например, при проверке простых гипотез можно предположить, чтоG(х0,0) =G(х1,1) = 0, т.е. гипотеза выбрана без ошибок.G(х0,1) иG(х1,0) оценивает потери при ошибках первого рода (не правильное отнесение фактического благоприятного состояния природы к подмно­жеству не благоприятных состояний природы) и второго рода (не правильное отнесение фактического не благоприятного состояния природы к подмно­жеству благоприятных состояний природы).

Решающая функция d(z) разбивает множество (пространство) Z возможных исходов эксперимента на пространствоS, называемое областью принятия гипотезы и его дополнение Z\S, называемое критической областью:

Размеры критической области определяются значимостью результатов проверки гипотезы, наличием априорной информации, характером проверяемой гипотезы.

Пусть, например, о случайной величине известно, что она подчиняется нормальному закону распределения с известным среднеквадратическим отклонением. Для дополнения этой априорной информации о природе был проведен эксперимент, в результате которого получена случайная выборкаZобъемаn. Необходимо проверитьгипотезу Н0о том, что среднее значение выборки равно математическому ожиданию случайной величиныМ(). Случайную величинуZприведем к стандартизированному виду:

.

Если гипотеза Н0верна, то величинаZСТимеет стандар­тизированное нормальное распределение снулевым математичес­ким ожиданиемМ() = 0 (или математичес­ким ожиданием, смещенным от нуля на величинуМ() > 0) иединичной дисперсией 2=1 (или дисперсией, равной единице измерения случайной величины). Альтернативной будет гипотеза Н1о том, что это неверно.

Для вычисления области принятия гипотезы и критической области задается уровень значимости  – вероятность ошибоч­ного отклонения гипотезы Н0. Наиболее употребительны значения =0,05; =0,01; =0,001.

Интервал [ZСТ1;ZСТ2], в котором Р(ZСТ1 < ZСТ < ZСТ2) = 1–, определяет область принятия гипотезы с соответствующим уров­нем значимости(доверительный интервал). ИнтервалыZСТ >ZСТ2 иZСТ < ZСТ1 опреде­ляют критическую область (ограничивающую область принятия гипотезы Н0 с обеих сторон), в которойZСТможет находиться лишь с вероятностью. Возможно задание односторонних об­ластей, при котором область принятия гипотезы ограничивается только с одной стороны.

Для определения областей принятия и отклонения гипотез используют таблицы нормального распределения для разных значений .

Пример 5.

Пусть, например, на предприятии изготовляются логические блоки, в паспорте которых указано среднее время наработки на отказ 800 часов, со стандартным отклонением 120 часов. Опыт эксплуатации 20 блоков при нормальных условиях эксплуатации обеспечивает=700 ч. Можно ли утверждать, что предприятие правильно определило значение Т0= 800 часов?

В качестве нулевой гипотезы Н0примем М()=800 ч. Альтернативная гипотеза Н1: М() < 800 ч. Выберем уровень значимости= 0,05 и определим стандартизированную форму случайной величины

При 5% уровне значимости и односторонней проверке гипотезы из таблиц нормального распределения следует, что = 1,65. Таким образом, областью принятия гипотезы Н0является интервал [– 1,65; +].

Поскольку –3,72 [– 1,65; +], то гипотеза Н0отклоняется. Принимается гипо­теза Н1, состоящая в том, что данные логические блоки менее надежны, чем указано в паспортных данных. Вероятность того, что эта гипотеза принята ошибочно:=0,05.

Если проводится дополнительный эксперимент, то говорят остатистических играх с проведением единичного экспериментаили остатистических играх с последовательными выборками.Отличие этих двух классов игр состоит в том, что:

  • для игр с единичным экспериментом(первого класса) – количество испытаний и порядок (последовательность) их проведения определен заранее.

  • В играх с последовательными выборками(второго класса) после каждого последовательного испытания исследователь - статистик принимает решение о про­должении или прекращении эксперимента.