Ответы
.pdf
22. Понятие матричной игры
23. Смешанные стратегии
24. Оптимальные смешанные стратегии
25. Минимаксные стратегии
В матричной игре задана матрица размерности m , где – количество ходов первого игрока, а – количество ходов второго. В общем виде таблица выглядит таким образом:
Здесь – значения выигрыша или проигрыша, к примеру, это число означает, сколько рублей первый игрок отдаст второму в случае выбора этой ячейки (или наоборот, второй первому, если число отрицательное).
Игра заключается в том, что каждый из игроков делает выбор номера хода (строки/столбца), не зная выбора хода другого игрока, а затем на пересечении столбца и строки соответствующих номеров объявляется выигрыш. Имеется несколько стратегий выбора хода:
Минимаксная стратегия подразумевает суммирование всех значений в каждому ходу и выборе среди них самого полезного. К примеру, первому игроку выгодно иметь отрицательное значение выигрыша (в этом случае второй отдает ему столько рублей, сколько выпало в ячейке). Он производит суммирования по каждому ряду:
∑
∑
{∑
Выбрав ( ), мы получим минимаксную стратегию, которую и будем применять во всех случаях. Эта стратегия имеет смысл при одной игре, при повторении рекомендуется использовать оптимальную смешанную стратегию. Пусть у нас дана таблица, тогда, как видно, минимаксной стратегией будет выбор второго хода ( ).
-5
Смешанной стратегией называется такая, в которой напротив каждого хода выставляется соответствующее ему значение вероятности. К примеру, у второго
игрока имеется три хода:  | 
	и  | 
	. Пусть вероятность первого хода будет равна  | 
|||
( )  | 
	, вероятность второго  | 
	( )  | 
	, а вероятность третьего ( )  | 
	.  | 
|
Тогда их можно отобразить в виде графика:  | 
	
  | 
	
  | 
|||
  | 
	
  | 
	
  | 
	20  | 
	
  | 
	
  | 
0  | 
	0.2  | 
	0.6  | 
	1  | 
  | 
	P1  | 
	P2  | 
	P3  | 
Для выбора хода воспользуемся генератором случайных чисел. Если на генераторе выпадет от 0 до 0.2, воспользуемся первым ходом, если от 0.2 до 0.6 – воспользуемся вторым, а если от 0.6 до 1 – воспользуемся третьим.
Оптимальной смешанной стратегией называется такая, в которой напротив каждого хода выставляется оптимальное соответствующее ему значение вероятности, определенное по заданному критерию оптимальности.
Игра с нулевой суммой (антагонистическая игра) – некооперативная игра для двух игроков, выигрыши которых противоположены.
Седловая точка – элемент матрицы, который одновременно является минимальным элементом в соответствующей строке и максимальным в соответствующем столбце, или наоборот. В играх с ненулевой суммой является равновесием Нэша – типом решений двух игроков, в котором ни один не может увеличить выигрыш, изменив свое решение в одностороннем порядке, когда другой не меняет решения.
Пример 1. Игра с нулевой суммой - «Орлянка». Первый игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она спрятана. Если он не угадывает — он платит первому одну денежную единицу, если угадывает — первый платит ему одну денежную единицу. В данной игре каждый участник имеет две стратегии: «орел» и «решка». Множество ситуаций в игре состоит из четырех элементов.
Пример 2. Дилемма заключенных. Два преступника пойманы за совершение преступления. У следствия не хватает доказательств их виновности и преступникам предлагают сделку: «если сознаешься и подтвердишь участие товарища в преступлении, то выйдешь на свободу, а товарищ получит 7 лет лишения свободы».
Если оба преступника сознаются, то каждый получит 5 лет Если оба не сознаются, то каждый получит по 1 году.
Преступники сидят в разных камерах и не могут общаться, но они знают, что каждому сделано такое предложение.
  | 
	2-й сознался  | 
	2-й не сознался  | 
1-й сознался  | 
	5:5  | 
	0:7  | 
1-ый не сознался  | 
	7:0  | 
	1:1  | 
Седловая точка – оба сознаются – существует и дает 5 лет каждому.
Оптимальное решение – не сознаваться – дает 1 год. При этом не является седловой точкой.
21
26. Понятие доверительного интервала
27. Пример построения доверительного интервала
Доверительный интервал – совокупность двух случайных величин и , которые являются функциями от выборочного значения, причем при любых подобных значениях , а также вероятность нахождения истинного значения между ними не зависит от этого значения. Доверительный интервал с вероятностью,
называемой доверительной, накрывает истинное значение .  | 
	
  | 
	
  | 
	
  | 
|||||||
Например, пусть имеется оценка ̂ для неизвестного параметра ,  | 
	причем ̂  | 
	,  | 
||||||||
где ошибка  | 
	случайна и ее функция распределения  | 
	( ) известна. Тогда выберем  | 
||||||||
неслучайные значения  | 
	и аргумента  | 
	такие, что вероятность попадания ошибки  | 
||||||||
в интервал между ними равна выбранной величине  | 
	( )  | 
	( ). Рассчитаем в  | 
||||||||
данном случае границы доверительного интервала:  | 
	
  | 
	
  | 
	
  | 
	
  | 
||||||
(  | 
	)  | 
	(  | 
	̂  | 
	)  | 
	(̂  | 
	
  | 
	̂  | 
	)  | 
	.  | 
	
  | 
Величины  | 
	̂  | 
	и  | 
	̂  | 
	являются  | 
	доверительными  | 
	границами  | 
	для  | 
|||
  | 
	
  | 
|||||||||
параметра .  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	
  | 
	t2  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	
  | 
	
  | 
	t1  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
  | 
	
  | 
	
  | 
	ξн  | 
	ξв  | 
	θ  | 
	
  | 
	
  | 
	
  | 
	
  | 
|
  | 
	
  | 
	
  | 
	С вероятностью Pд в  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
  | 
	
  | 
	
  | 
	этом интервале лежит θ  | 
	
  | 
	
  | 
	
  | 
	
  | 
	
  | 
||
Величина  | 
	
  | 
	называется уровнем значимости. Если  | 
	при  | 
	достаточно  | 
||||||
большом значении  | 
	функции и  | 
	незначительно отличаются друг от друга, то  | 
||||||||
можно считать,  | 
	что  | 
	значение  | 
	параметра  | 
	
  | 
	хорошо  | 
	определено  | 
	по  | 
|||
экспериментальным данным.
Доверительный интервал – частный случай доверительного множества, т.е. множества, которое имеет случайную границу и с выбранной вероятностью
накрывает неизвестное значение векторного параметра , и величина  | 
	не зависит  | 
от значения .  | 
	
  | 
22
000. Недостатки теоремы Пирсона (всего 3)
Проверяются только простые гипотезы. На практике такое редко встречается (вид и параметры закона распределения не всегда определены);
проверяются только две гипотезы;
нет обоснования выбора величин вероятностей ошибок 1-го и 2-го рода. Однако сложные гипотезы можно свести к простым с помощью Вальдовской редукции.
23
001. Применение критических областей в доверительных множествах
Доверительное множество - множество, которое имеет случайную границу и с выбранной вероятностью накрывает неизвестное значение векторного параметра , и величина не зависит от значения . Доверительное множество определяется в
пространстве возможных значений параметра .
Алгоритм построения доверительного множества основан на использовании
понятия критической области для простой параметрической гипотезы.  | 
	
  | 
|
Теорема.  | 
	
  | 
	
  | 
  | 
	– критическая область размера для испытания простой гипотезы:  | 
	;  | 
a – данное значение;
– вероятность ошибки первого рода;
зависит от значения а;
  | 
	– область, дополнительная к области  | 
	;  | 
	
  | 
  | 
	x – возможный результат эксперимента.  | 
	
  | 
	
  | 
Тогда множество значений a: ( ) {  | 
	} есть (  | 
	) – доверительное  | 
|
множество для параметра при данном значении x.  | 
	
  | 
||
Здесь подразумевается, что доверительная вероятность равна  | 
	.  | 
||
Геометрической иллюстрацией может служить доверительный интервал для
математического ожидания  | 
	(n=1,  | 
	), который задается неравенствами:  | 
||
̂  | 
	и  | 
	̂  | 
	.  | 
	
  | 
Если параметрическая гипотеза  | 
	может быть принята (послеопытное значение  | 
|||
x не попадает в критическую область), то это значение а принадлежит доверительной области. Зависимость критической области от значения а определена неравенствами и .
Поэтому, чтобы значение x попало в критическую область, нужно значение а сдвинуть вправо от x на величину большую, чем значение | |, либо влево на величину большую, чем значение | |.
24
Дополнительные вопросы  | 
	
  | 
||
МНК и теорема Маркова-Гаусса. Схема одинаковая, а в чем отличие?  | 
|||
Дано:  | 
	∑  | 
	, результат измерения  | 
	, т.е. измерение со случайной  | 
ошибкой, матожидание которой нулевое. Имеется таблица результатов
эксперимента.  | 
	Нужно найти оценки ̂ для  | 
	такие, чтобы дисперсия оказалась  | 
|
  | 
	
  | 
	̂  | 
	
  | 
минимальной.  | 
	Оказывается, вектор оптимальной оценки ̂ ( ) (  | 
	)  | 
|
  | 
	
  | 
	̂  | 
	
  | 
совпадает с тем, что мог бы быть найден методом наименьших квадратов, который к статистике не имеет отношения.
Таким образом, отличия:
введена концепция случайной ошибки;
модель объекта жестко закреплена;
теорема позволяет предсказать точность оценивания, МНК – нет.
Определение функции распределения Функция распределения - функция, характеризующая распределение случайного
вектора .  | 
	( )  | 
	(  | 
	), то есть ее значение в точке равно вероятности  | 
события {  | 
	}. Нужно понимать, что – это заданный вектор (например, {1;2}), а  | 
||
значение  | 
	не определено до проведения эксперимента.  | 
||
Что такое параметрическая гипотеза Параметрическая гипотеза - предположение, которое касается неизвестного
значения параметра распределения (параметр может быть многомерным). Предположение, при котором вид распределения неизвестен, называется непараметрической гипотезой.
Параметрической  | 
	гипотезой  | 
	(  | 
	) называют утверждение, заключающееся  | 
	в  | 
||
принадлежности  | 
	значения  | 
	неизвестного параметра  | 
	области  | 
	, где  | 
	-  | 
|
всевозможные значений параметра ,  | 
	.  | 
	
  | 
	
  | 
	
  | 
||
Определение ковариации Ковариация – матожидания произведения центрированных случайных величин,
мера их линейной зависимости:  | 
	( )  | 
	[(  | 
	[ ]) (  | 
	[ ])]. Если X,Y  | 
||
независимы, то  | 
	( )  | 
	, хотя обратное не всегда верно.  | 
	
  | 
|||
25
