Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Ответы

.pdf
Скачиваний:
21
Добавлен:
05.06.2015
Размер:
620.81 Кб
Скачать

22. Понятие матричной игры

23. Смешанные стратегии

24. Оптимальные смешанные стратегии

25. Минимаксные стратегии

В матричной игре задана матрица размерности m , где – количество ходов первого игрока, а – количество ходов второго. В общем виде таблица выглядит таким образом:

Здесь – значения выигрыша или проигрыша, к примеру, это число означает, сколько рублей первый игрок отдаст второму в случае выбора этой ячейки (или наоборот, второй первому, если число отрицательное).

Игра заключается в том, что каждый из игроков делает выбор номера хода (строки/столбца), не зная выбора хода другого игрока, а затем на пересечении столбца и строки соответствующих номеров объявляется выигрыш. Имеется несколько стратегий выбора хода:

Минимаксная стратегия подразумевает суммирование всех значений в каждому ходу и выборе среди них самого полезного. К примеру, первому игроку выгодно иметь отрицательное значение выигрыша (в этом случае второй отдает ему столько рублей, сколько выпало в ячейке). Он производит суммирования по каждому ряду:

{

Выбрав ( ), мы получим минимаксную стратегию, которую и будем применять во всех случаях. Эта стратегия имеет смысл при одной игре, при повторении рекомендуется использовать оптимальную смешанную стратегию. Пусть у нас дана таблица, тогда, как видно, минимаксной стратегией будет выбор второго хода ( ).

-5

Смешанной стратегией называется такая, в которой напротив каждого хода выставляется соответствующее ему значение вероятности. К примеру, у второго

игрока имеется три хода:

и

. Пусть вероятность первого хода будет равна

( )

, вероятность второго

( )

, а вероятность третьего ( )

.

Тогда их можно отобразить в виде графика:

 

 

 

 

 

20

 

 

0

0.2

0.6

1

 

P1

P2

P3

Для выбора хода воспользуемся генератором случайных чисел. Если на генераторе выпадет от 0 до 0.2, воспользуемся первым ходом, если от 0.2 до 0.6 – воспользуемся вторым, а если от 0.6 до 1 – воспользуемся третьим.

Оптимальной смешанной стратегией называется такая, в которой напротив каждого хода выставляется оптимальное соответствующее ему значение вероятности, определенное по заданному критерию оптимальности.

Игра с нулевой суммой (антагонистическая игра) – некооперативная игра для двух игроков, выигрыши которых противоположены.

Седловая точка – элемент матрицы, который одновременно является минимальным элементом в соответствующей строке и максимальным в соответствующем столбце, или наоборот. В играх с ненулевой суммой является равновесием Нэша – типом решений двух игроков, в котором ни один не может увеличить выигрыш, изменив свое решение в одностороннем порядке, когда другой не меняет решения.

Пример 1. Игра с нулевой суммой - «Орлянка». Первый игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она спрятана. Если он не угадывает — он платит первому одну денежную единицу, если угадывает — первый платит ему одну денежную единицу. В данной игре каждый участник имеет две стратегии: «орел» и «решка». Множество ситуаций в игре состоит из четырех элементов.

Пример 2. Дилемма заключенных. Два преступника пойманы за совершение преступления. У следствия не хватает доказательств их виновности и преступникам предлагают сделку: «если сознаешься и подтвердишь участие товарища в преступлении, то выйдешь на свободу, а товарищ получит 7 лет лишения свободы».

Если оба преступника сознаются, то каждый получит 5 лет Если оба не сознаются, то каждый получит по 1 году.

Преступники сидят в разных камерах и не могут общаться, но они знают, что каждому сделано такое предложение.

 

2-й сознался

2-й не сознался

1-й сознался

5:5

0:7

1-ый не сознался

7:0

1:1

Седловая точка – оба сознаются – существует и дает 5 лет каждому.

Оптимальное решение – не сознаваться – дает 1 год. При этом не является седловой точкой.

21

26. Понятие доверительного интервала

27. Пример построения доверительного интервала

Доверительный интервал – совокупность двух случайных величин и , которые являются функциями от выборочного значения, причем при любых подобных значениях , а также вероятность нахождения истинного значения между ними не зависит от этого значения. Доверительный интервал с вероятностью,

называемой доверительной, накрывает истинное значение .

 

 

 

Например, пусть имеется оценка ̂ для неизвестного параметра ,

причем ̂

,

где ошибка

случайна и ее функция распределения

( ) известна. Тогда выберем

неслучайные значения

и аргумента

такие, что вероятность попадания ошибки

в интервал между ними равна выбранной величине

( )

( ). Рассчитаем в

данном случае границы доверительного интервала:

 

 

 

 

(

)

(

̂

)

(̂

 

̂

)

.

 

Величины

̂

и

̂

являются

доверительными

границами

для

 

 

параметра .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

t1

 

 

 

 

 

 

 

 

ξн

ξв

θ

 

 

 

 

 

 

 

С вероятностью Pд в

 

 

 

 

 

 

 

 

этом интервале лежит θ

 

 

 

 

 

Величина

 

называется уровнем значимости. Если

при

достаточно

большом значении

функции и

незначительно отличаются друг от друга, то

можно считать,

что

значение

параметра

 

хорошо

определено

по

экспериментальным данным.

Доверительный интервал – частный случай доверительного множества, т.е. множества, которое имеет случайную границу и с выбранной вероятностью

накрывает неизвестное значение векторного параметра , и величина

не зависит

от значения .

 

22

000. Недостатки теоремы Пирсона (всего 3)

Проверяются только простые гипотезы. На практике такое редко встречается (вид и параметры закона распределения не всегда определены);

проверяются только две гипотезы;

нет обоснования выбора величин вероятностей ошибок 1-го и 2-го рода. Однако сложные гипотезы можно свести к простым с помощью Вальдовской редукции.

23

001. Применение критических областей в доверительных множествах

Доверительное множество - множество, которое имеет случайную границу и с выбранной вероятностью накрывает неизвестное значение векторного параметра , и величина не зависит от значения . Доверительное множество определяется в

пространстве возможных значений параметра .

Алгоритм построения доверительного множества основан на использовании

понятия критической области для простой параметрической гипотезы.

 

Теорема.

 

 

 

– критическая область размера для испытания простой гипотезы:

;

a – данное значение;

– вероятность ошибки первого рода;

зависит от значения а;

 

– область, дополнительная к области

;

 

 

x – возможный результат эксперимента.

 

 

Тогда множество значений a: ( ) {

} есть (

) – доверительное

множество для параметра при данном значении x.

 

Здесь подразумевается, что доверительная вероятность равна

.

Геометрической иллюстрацией может служить доверительный интервал для

математического ожидания

(n=1,

), который задается неравенствами:

̂

и

̂

.

 

Если параметрическая гипотеза

может быть принята (послеопытное значение

x не попадает в критическую область), то это значение а принадлежит доверительной области. Зависимость критической области от значения а определена неравенствами и .

Поэтому, чтобы значение x попало в критическую область, нужно значение а сдвинуть вправо от x на величину большую, чем значение | |, либо влево на величину большую, чем значение | |.

24

Дополнительные вопросы

 

МНК и теорема Маркова-Гаусса. Схема одинаковая, а в чем отличие?

Дано:

, результат измерения

, т.е. измерение со случайной

ошибкой, матожидание которой нулевое. Имеется таблица результатов

эксперимента.

Нужно найти оценки ̂ для

такие, чтобы дисперсия оказалась

 

 

̂

 

минимальной.

Оказывается, вектор оптимальной оценки ̂ ( ) (

)

 

 

̂

 

совпадает с тем, что мог бы быть найден методом наименьших квадратов, который к статистике не имеет отношения.

Таким образом, отличия:

введена концепция случайной ошибки;

модель объекта жестко закреплена;

теорема позволяет предсказать точность оценивания, МНК – нет.

Определение функции распределения Функция распределения - функция, характеризующая распределение случайного

вектора .

( )

(

), то есть ее значение в точке равно вероятности

события {

}. Нужно понимать, что – это заданный вектор (например, {1;2}), а

значение

не определено до проведения эксперимента.

Что такое параметрическая гипотеза Параметрическая гипотеза - предположение, которое касается неизвестного

значения параметра распределения (параметр может быть многомерным). Предположение, при котором вид распределения неизвестен, называется непараметрической гипотезой.

Параметрической

гипотезой

(

) называют утверждение, заключающееся

в

принадлежности

значения

неизвестного параметра

области

, где

-

всевозможные значений параметра ,

.

 

 

 

Определение ковариации Ковариация – матожидания произведения центрированных случайных величин,

мера их линейной зависимости:

( )

[(

[ ]) (

[ ])]. Если X,Y

независимы, то

( )

, хотя обратное не всегда верно.

 

25