- •Часть I. Общие положения
- •Глава 3. Априорная неопределенность и возможные способы
- •3.2. Неполное статистическое описание данных наблюдения. Параметрическое описание априорной неопределенности
- •Эмпирический подход в задачах с априорной неопределенностью. Обучение
- •3.3.1 Простое обучение
- •3.3.2. «Рабочеподобное» обучение
- •Часть II. Методы синтеза информационных систем в условиях
- •4.2. Существенная и несущественная априорная неопределенность
- •4.3. Понятие оптимальности в условиях априорной неопределенности
- •4.3.1. Равномерно наилучшее решение
- •4.3.2. Принцип асимптотической оптимальности
- •4.3.3. Минимаксиминный принцип (минимакс минимального среднего риска)
- •4.3.4. Принцип минимума усредненного риска
- •4.3.5. Минимаксный принцип
- •4.4. Соотношения между правилами решения, полученными на основе различных принципов предпочтения
- •4.5. Использование достаточных статистик
- •Глава 5. Минимаксный подход
- •5.1. Минимаксное правило решения при наличии априорной неопределенности относительно параметров X
- •5.2. Полное незнание априорного распределения
- •5.3. Ограниченные сведения о множестве допустимых значений
- •5.4. Ограниченные сведения о статистических характеристиках
- •Г л а в а 6. Адаптивный байесов подход
- •6.1. Общие положения
- •6.2. Адаптивный байесов подход при параметрической априорной неопределенности
- •6.3. Случаи, когда множества решений u и параметров l непрерывны
- •6.4. Соответствие адаптивного байесова правила решения принципам оптимальности в условиях априорной неопределенности
- •6.4.1. Принцип предпочтения, связанный с равномерно наилучшим правилом решения
- •6.4.2. Принцип асимптотической оптимальности
- •6.4.3. Минимаксиминный принцип
- •6.4.4. Принцип минимакса
- •6.5. Принцип минимума усредненного риска
- •6.5.1. Случай одинаковой совокупности параметров при разных значениях
- •6.5.2. Случай разных совокупностей параметров при разных значениях
- •6.6. Выводы
3.3.2. «Рабочеподобное» обучение
Этот
несколько необычный термин используется
для случая, когда эмпирические данные
являются
итогом серии действий, каждое из которых
происходит в ситуации, соответствующей
значению
и
сопровождается получением некоторой
совокупности данных наблюдения и
принятием решения
,
причем
выбирается из того же
множества
решений U,
что
и решение
в рабочей ситуации. При таком
способе
получения эмпирических данных может
встретиться несколько характерных
случаев.
1).
Потери для всех
определяются той же функцией потерь,
что и в рабочей ситуации, но несущественны,
а сами решения
выбираются независимо от нас. Это
соответствует использованию чужого
опыта в ситуациях, аналогичных интересующей
нас рабочей ситуации, о котором мы
получаем информацию, но за который в
каждом случае принятия решения
расплачивается кто-то другой.
Очевидно,
что этот случай не отличается принципиально
от простого обучения, поскольку
платить за последствия приходится
только один раз - в рабочей ситуации.
Может измениться только содержание
информации, заключенной в
.
Наряду
с рассмотренным ранее, каждая из
составляющих
может содержать в себе решение
и величину потерь
,
соответствующую этому решению и значению
параметра
(известному либо нет), характеризующему
-ю
ситуацию. Эти сведения довольно
содержательны с точки зрения возможности
решения задач синтеза систем, когда
априори функция потерь
,то
есть критерий качества системы, не
задана или известна неполностью.
Эмпирические данные {
}
для
различных
позволяют
с
той
или иной степенью полноты восстановить
зависимость функции потерь или
апостериорного риска от своих аргументов
для принятия оптимального решения
в рабочей ситуации. В отношении постановки
задачи отыскания правила решения в этом
случае имеет место все сказанное в п.
3.3.1 в.
2).
Для всех
и
в рабочей ситуации решения
и
выбираются
независимо, причем решение
выбирается из условия минимума ожидаемых
потерь для функции
,а
решение
-
для функции
.
Функции
могут быть как одинаковыми с
,так
и различными. Независимый выбор решений
означает требование локальной
оптимальности для каждого элемента
серии
и рабочей ситуации. Любая из составляющих
может иметь то же содержание, что в п.
1, то есть наряду с данными
подобными х,
содержать сведения о
,
и
.
Довольно
часто совокупность {
}
представляет собой упорядоченную
последовательность. В этом случае
каждое очередное решение
может зависеть от всех
,
подобно
тому,
как решение
в рабочей ситуации может использовать
х
и
.
3).
Следующим характерным случаем является
такой, когда последовательность
решений
и решение
в рабочей ситуации объединены единой
целью, количественным выражением которой
является функция потерь
,
и требуется минимизировать общий риск,
соответствующий этой функции потерь.
При этом решения
и
уже не могут приниматься независимо, а
выбор частных решений
в
процессе набора эмпирических
данных
должен обеспечивать как уменьшение
риска в каждой
-й
ситуации, так и его минимальное
значение в конечной рабочей ситуации.
Обычно
серия
представляет
в этом случае упорядоченную
последовательность, что соответствует
возможности выбора решения
,
зависящего от всех предыдущих значений
и
соответственно
.
Составляющие эмпирической последовательности
могут иметь ту же природу, что и выше, а
сама последовательность решений
представляет собой многошаговый
процесс, описанный в §2.7.
Два наиболее типичных случая задания меры потерь соответствуют аддитивной функции потерь, когда
(3.3.6)
и
функции
потерь, не зависящей от {
},
то есть
.
(3.3.7)
Последняя
сосредоточивает все внимание при выборе
решений
в
процессе набора эмпирических данных
на обеспечении минимальных потерь в
рабочей ситуации. Естественно, что для
функции потерь (3.3.7)
зависимость
в выборе решений
будет
только тогда, когда эмпирические
данные действительно имеют ценность,
то есть существует априорная
неопределенность, связанная с незнанием
или неполным знанием функции
правдоподобия
и
априорного распределения
,
или имеется статистическая зависимость
между х
и {
}.
В
противном случае, как следует из
общих выражений гл. 2, многошаговый
процесс принятия решений распадается
на отдельные независимые шаги
и
выбор последовательности решений {
}
не влияет на выбор решения
в рабочей ситуации.
В
заключение отметим, что, как и в разд.
3.3.1, при наличии эмпирических данных
может быть различная степень априорной
неопределенности в отношении
статистического описания х,
и {
}
- от полного незнания их распределений
вероятности до полного статистического
описания; и как и в предыдущих случаях,
чрезвычайно удобно параметрическое
описание с использованием имеющихся
физических представлений и соответствующих
им закономерностей.
