
Ответы
.pdf
22. Понятие матричной игры
23. Смешанные стратегии
24. Оптимальные смешанные стратегии
25. Минимаксные стратегии
В матричной игре задана матрица размерности m , где – количество ходов первого игрока, а – количество ходов второго. В общем виде таблица выглядит таким образом:
Здесь – значения выигрыша или проигрыша, к примеру, это число означает, сколько рублей первый игрок отдаст второму в случае выбора этой ячейки (или наоборот, второй первому, если число отрицательное).
Игра заключается в том, что каждый из игроков делает выбор номера хода (строки/столбца), не зная выбора хода другого игрока, а затем на пересечении столбца и строки соответствующих номеров объявляется выигрыш. Имеется несколько стратегий выбора хода:
Минимаксная стратегия подразумевает суммирование всех значений в каждому ходу и выборе среди них самого полезного. К примеру, первому игроку выгодно иметь отрицательное значение выигрыша (в этом случае второй отдает ему столько рублей, сколько выпало в ячейке). Он производит суммирования по каждому ряду:
∑
∑
{∑
Выбрав ( ), мы получим минимаксную стратегию, которую и будем применять во всех случаях. Эта стратегия имеет смысл при одной игре, при повторении рекомендуется использовать оптимальную смешанную стратегию. Пусть у нас дана таблица, тогда, как видно, минимаксной стратегией будет выбор второго хода ( ).
-5
Смешанной стратегией называется такая, в которой напротив каждого хода выставляется соответствующее ему значение вероятности. К примеру, у второго
игрока имеется три хода: |
и |
. Пусть вероятность первого хода будет равна |
|||
( ) |
, вероятность второго |
( ) |
, а вероятность третьего ( ) |
. |
|
Тогда их можно отобразить в виде графика: |
|
|
|||
|
|
|
20 |
|
|

0 |
0.2 |
0.6 |
1 |
|
P1 |
P2 |
P3 |
Для выбора хода воспользуемся генератором случайных чисел. Если на генераторе выпадет от 0 до 0.2, воспользуемся первым ходом, если от 0.2 до 0.6 – воспользуемся вторым, а если от 0.6 до 1 – воспользуемся третьим.
Оптимальной смешанной стратегией называется такая, в которой напротив каждого хода выставляется оптимальное соответствующее ему значение вероятности, определенное по заданному критерию оптимальности.
Игра с нулевой суммой (антагонистическая игра) – некооперативная игра для двух игроков, выигрыши которых противоположены.
Седловая точка – элемент матрицы, который одновременно является минимальным элементом в соответствующей строке и максимальным в соответствующем столбце, или наоборот. В играх с ненулевой суммой является равновесием Нэша – типом решений двух игроков, в котором ни один не может увеличить выигрыш, изменив свое решение в одностороннем порядке, когда другой не меняет решения.
Пример 1. Игра с нулевой суммой - «Орлянка». Первый игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она спрятана. Если он не угадывает — он платит первому одну денежную единицу, если угадывает — первый платит ему одну денежную единицу. В данной игре каждый участник имеет две стратегии: «орел» и «решка». Множество ситуаций в игре состоит из четырех элементов.
Пример 2. Дилемма заключенных. Два преступника пойманы за совершение преступления. У следствия не хватает доказательств их виновности и преступникам предлагают сделку: «если сознаешься и подтвердишь участие товарища в преступлении, то выйдешь на свободу, а товарищ получит 7 лет лишения свободы».
Если оба преступника сознаются, то каждый получит 5 лет Если оба не сознаются, то каждый получит по 1 году.
Преступники сидят в разных камерах и не могут общаться, но они знают, что каждому сделано такое предложение.
|
2-й сознался |
2-й не сознался |
1-й сознался |
5:5 |
0:7 |
1-ый не сознался |
7:0 |
1:1 |
Седловая точка – оба сознаются – существует и дает 5 лет каждому.
Оптимальное решение – не сознаваться – дает 1 год. При этом не является седловой точкой.
21

26. Понятие доверительного интервала
27. Пример построения доверительного интервала
Доверительный интервал – совокупность двух случайных величин и , которые являются функциями от выборочного значения, причем при любых подобных значениях , а также вероятность нахождения истинного значения между ними не зависит от этого значения. Доверительный интервал с вероятностью,
называемой доверительной, накрывает истинное значение . |
|
|
|
|||||||
Например, пусть имеется оценка ̂ для неизвестного параметра , |
причем ̂ |
, |
||||||||
где ошибка |
случайна и ее функция распределения |
( ) известна. Тогда выберем |
||||||||
неслучайные значения |
и аргумента |
такие, что вероятность попадания ошибки |
||||||||
в интервал между ними равна выбранной величине |
( ) |
( ). Рассчитаем в |
||||||||
данном случае границы доверительного интервала: |
|
|
|
|
||||||
( |
) |
( |
̂ |
) |
(̂ |
|
̂ |
) |
. |
|
Величины |
̂ |
и |
̂ |
являются |
доверительными |
границами |
для |
|||
|
|
|||||||||
параметра . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t2 |
|
|
|
|
|
|
|
|
|
|
|
t1 |
|
|
|
|
|
|
|
|
ξн |
ξв |
θ |
|
|
|
|
|
|
|
|
С вероятностью Pд в |
|
|
|
|
|
||
|
|
|
этом интервале лежит θ |
|
|
|
|
|
||
Величина |
|
называется уровнем значимости. Если |
при |
достаточно |
||||||
большом значении |
функции и |
незначительно отличаются друг от друга, то |
||||||||
можно считать, |
что |
значение |
параметра |
|
хорошо |
определено |
по |
экспериментальным данным.
Доверительный интервал – частный случай доверительного множества, т.е. множества, которое имеет случайную границу и с выбранной вероятностью
накрывает неизвестное значение векторного параметра , и величина |
не зависит |
от значения . |
|
22
000. Недостатки теоремы Пирсона (всего 3)
Проверяются только простые гипотезы. На практике такое редко встречается (вид и параметры закона распределения не всегда определены);
проверяются только две гипотезы;
нет обоснования выбора величин вероятностей ошибок 1-го и 2-го рода. Однако сложные гипотезы можно свести к простым с помощью Вальдовской редукции.
23
001. Применение критических областей в доверительных множествах
Доверительное множество - множество, которое имеет случайную границу и с выбранной вероятностью накрывает неизвестное значение векторного параметра , и величина не зависит от значения . Доверительное множество определяется в
пространстве возможных значений параметра .
Алгоритм построения доверительного множества основан на использовании
понятия критической области для простой параметрической гипотезы. |
|
|
Теорема. |
|
|
|
– критическая область размера для испытания простой гипотезы: |
; |
a – данное значение;
– вероятность ошибки первого рода;
зависит от значения а;
|
– область, дополнительная к области |
; |
|
|
x – возможный результат эксперимента. |
|
|
Тогда множество значений a: ( ) { |
} есть ( |
) – доверительное |
|
множество для параметра при данном значении x. |
|
||
Здесь подразумевается, что доверительная вероятность равна |
. |
Геометрической иллюстрацией может служить доверительный интервал для
математического ожидания |
(n=1, |
), который задается неравенствами: |
||
̂ |
и |
̂ |
. |
|
Если параметрическая гипотеза |
может быть принята (послеопытное значение |
x не попадает в критическую область), то это значение а принадлежит доверительной области. Зависимость критической области от значения а определена неравенствами и .
Поэтому, чтобы значение x попало в критическую область, нужно значение а сдвинуть вправо от x на величину большую, чем значение | |, либо влево на величину большую, чем значение | |.
24
Дополнительные вопросы |
|
||
МНК и теорема Маркова-Гаусса. Схема одинаковая, а в чем отличие? |
|||
Дано: |
∑ |
, результат измерения |
, т.е. измерение со случайной |
ошибкой, матожидание которой нулевое. Имеется таблица результатов
эксперимента. |
Нужно найти оценки ̂ для |
такие, чтобы дисперсия оказалась |
|
|
|
̂ |
|
минимальной. |
Оказывается, вектор оптимальной оценки ̂ ( ) ( |
) |
|
|
|
̂ |
|
совпадает с тем, что мог бы быть найден методом наименьших квадратов, который к статистике не имеет отношения.
Таким образом, отличия:
введена концепция случайной ошибки;
модель объекта жестко закреплена;
теорема позволяет предсказать точность оценивания, МНК – нет.
Определение функции распределения Функция распределения - функция, характеризующая распределение случайного
вектора . |
( ) |
( |
), то есть ее значение в точке равно вероятности |
события { |
}. Нужно понимать, что – это заданный вектор (например, {1;2}), а |
||
значение |
не определено до проведения эксперимента. |
Что такое параметрическая гипотеза Параметрическая гипотеза - предположение, которое касается неизвестного
значения параметра распределения (параметр может быть многомерным). Предположение, при котором вид распределения неизвестен, называется непараметрической гипотезой.
Параметрической |
гипотезой |
( |
) называют утверждение, заключающееся |
в |
||
принадлежности |
значения |
неизвестного параметра |
области |
, где |
- |
|
всевозможные значений параметра , |
. |
|
|
|
Определение ковариации Ковариация – матожидания произведения центрированных случайных величин,
мера их линейной зависимости: |
( ) |
[( |
[ ]) ( |
[ ])]. Если X,Y |
||
независимы, то |
( ) |
, хотя обратное не всегда верно. |
|
25