Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Тульский Государственный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекция 3. Байесовский подход и Акинатор

.pdf

Скачиваний:

Добавлен:

10.05.2015

Размер:

225.32 Кб

Скачать

☆

1 / 21 2 > Следующая >>>

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Байесовский подход и Акинатор

Спецкурс “Прикладной регрессионный анализ”

Что такое (кто такой) Акинатор?

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Можно найти по адресу http://akinator.com;

Расширенный вариант игры “20 вопросов”;

Специализируется на персонажах;

Как правило, угадывает, и очень быстро;

По всей видимости, обучается на ответах пользователей.

Что мы хотим сделать?

Байесовский подход и Акинатор

Мы хотим сделать своего Акинатора;

Введение

Ликбез

Можно поддерживать дерево, в котором внутренние узлы вопросы, а листья ответы. Однако:

Выбор		Дерево нужно перебалансировать;
заданным		Дерево нужно перебалансировать;
персонажа по
ответам на		Существуют вопросы, на которые нет
вопросы		однозначного ответа;
		однозначного ответа;
Стратегия		Если не нашли соответствия в базе, нельзя
выбора		Если не нашли соответствия в базе, нельзя
вопросов		попробовать “ткнуть пальцем в небо”, выбрав
Итоги		самого похожего персонажа.

Вместо этого мы воспользуемся байесовским подходом!

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Собственная информация

Пусть X дискретная случайная величина, P(X = xi) = pi. Собственной информацией значения xi называется величина

I(xi) = log 1 = log pi; pi

В зависимости от основания логарифма измеряется в битах, натах, хартли;

Смысл: много ли мы узнали, когда нам сказали, что случайная величина X приняла значение xi;

Свойства:

Собственная информация случайная величина;

Неотрицательность: I(xi) 0;

Монотонность: I(x1) > I(x2) при p1 < p2.

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Энтропия

Энтропией дискретной случайной величины X называется математическое ожидание собственной

информации:

X X

H(p1; p2; : : : ; pn; : : :) = piI(xi) = pi log pi;

i i

Является своего рода мерой “неопределенности” случайной величины;

Смысл: много ли мы (в среднем) узнаем, когда нам говорят, что случайная величина X приняла какое-то значение.

Как и собственная информация, измеряется в битах, натах, хартли;

Для непрерывной случайной величины существует понятие дифференциальной энтропии.

Примеры

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

0.7
0.6
0.5
0.4
0.3
0.2
0.1
0	2	3	4	5	6
1	2	3	4	5	6

0.7

0.6

0.5

0.4

0.3

0.2
0.1
0	2	3	4	5	6
1	2	3	4	5	6

Итоги

На левом рисунке H = 1:7356, на правом H = 2:5789.

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Некоторые свойства энтропии

Непрерывность по pi;

Нет зависимости от порядка значений:

H(p1; p2; : : :) = H(p2; p1; : : :);

Максимум достигается на равномерном распределении:

Hn(p1; : : : ; pn) Hn	n; : : : ;		n		= log n;
	1		1

Для равномерного распределения энтропия растет с ростом числа исходов:

Hn	n; : : : ;		n	< Hn+1	n + 1; : : : ;		n + 1		;
	1		1		1		1

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Условная энтропия

Обозначим через H(X j Y = yi) энтропию распределения P(X j Y = yi);

Энтропией X при условии Y называется величина

H(X j Y) = H(X j Y = yi)P(Y = yi);

Смысл: какова (в среднем) неопределенность X, если мы знаем Y.

Легко убедиться, что если X и Y независимы, то

H(X j Y) = H(X).

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Байесовский подход для выбора персонажа

Давайте пока считать, что мы уже задали какое-то число вопросов, получили ответы и теперь хотим узнать, кто из персонажей мог быть загадан;

Пусть C обозначает загаданного персонажа, а выражение hQ; Ai означает “был задан вопрос Q и на него был получен ответ A”;

Фактически, нам нужно найти

P(C j hQ1; A1i; : : : ; hQn; Ani);

Применим теорему Байеса:

P(C j hQ1; A1i; : : : ; hQn; Ani) =

P(hQ1; A1i; : : : ; hQn; Ani j C)P(C)

= PC0 P(hQ1; A1i; : : : ; hQn; Ani j C0)P(C0):

Байесовский подход и Акинатор

Введение

Ликбез

Выбор персонажа по заданным ответам на вопросы

Стратегия

выбора

вопросов

Итоги

Предыдущие игры и априорное распределение

Давайте также считать, что мы уже играли в эту игру много раз и знаем, кто кого загадывал и как

на какие вопросы отвечал;

Тогда P(C), априорная вероятность того, что загадали какого-то персонажа, может быть вычислена как доля игр, в которых был загадан этот персонаж, среди всех игр;

Простая интерпретация: при прочих равных нужно называть более популярного персонажа, т.к. больше шансов, что мы отгадаем;

А что делать с P(hQ1; A1i; : : : ; hQn; Ani j C)?

1 / 21 2 > Следующая >>>

Соседние файлы в папке Лекции

#
10.05.20154.1 Кб37._Лекция_5.pdf
#
10.05.20154.1 Кб39._Лекция_6.pdf
#
10.05.20151.62 Mб94Лекции.docx
#
10.05.2015546.94 Кб64Лекция 1. Вероятностные модели в задачах машинного обучения.pdf
#
10.05.2015341.56 Кб65Лекция 2. Байесовский подход.pdf
#
10.05.2015225.32 Кб53Лекция 3. Байесовский подход и Акинатор.pdf
#
10.05.20152.78 Mб41Лекция_6.pdf