
- •Часть I. Общие положения
- •Глава 3. Априорная неопределенность и возможные способы
- •3.2. Неполное статистическое описание данных наблюдения. Параметрическое описание априорной неопределенности
- •Эмпирический подход в задачах с априорной неопределенностью. Обучение
- •3.3.1 Простое обучение
- •3.3.2. «Рабочеподобное» обучение
- •Часть II. Методы синтеза информационных систем в условиях
- •4.2. Существенная и несущественная априорная неопределенность
- •4.3. Понятие оптимальности в условиях априорной неопределенности
- •4.3.1. Равномерно наилучшее решение
- •4.3.2. Принцип асимптотической оптимальности
- •4.3.3. Минимаксиминный принцип (минимакс минимального среднего риска)
- •4.3.4. Принцип минимума усредненного риска
- •4.3.5. Минимаксный принцип
- •4.4. Соотношения между правилами решения, полученными на основе различных принципов предпочтения
- •4.5. Использование достаточных статистик
- •Глава 5. Минимаксный подход
- •5.1. Минимаксное правило решения при наличии априорной неопределенности относительно параметров X
- •5.2. Полное незнание априорного распределения
- •5.3. Ограниченные сведения о множестве допустимых значений
- •5.4. Ограниченные сведения о статистических характеристиках
- •Г л а в а 6. Адаптивный байесов подход
- •6.1. Общие положения
- •6.2. Адаптивный байесов подход при параметрической априорной неопределенности
- •6.3. Случаи, когда множества решений u и параметров l непрерывны
- •6.4. Соответствие адаптивного байесова правила решения принципам оптимальности в условиях априорной неопределенности
- •6.4.1. Принцип предпочтения, связанный с равномерно наилучшим правилом решения
- •6.4.2. Принцип асимптотической оптимальности
- •6.4.3. Минимаксиминный принцип
- •6.4.4. Принцип минимакса
- •6.5. Принцип минимума усредненного риска
- •6.5.1. Случай одинаковой совокупности параметров при разных значениях
- •6.5.2. Случай разных совокупностей параметров при разных значениях
- •6.6. Выводы
Эмпирический подход в задачах с априорной неопределенностью. Обучение
Рассмотренные
выше аналитические способы неполного
статистического описания х
и
по
существу соответствуют тому, что в
каждой конкретной практической задаче
создается некоторая аналитическая
модель для описания статистических
свойств х
и
с той
степенью полноты и подробности, которая
соответствует имеющимся знаниям о
закономерностях их поведения,
физических свойствах, взаимосвязи между
собой. Подобная модель является в
какой-то степени наиболее сжатым
описанием имеющегося прошлого опыта,
содержащего как результаты изучения
указанных закономерностей, так и,
возможно, эмпирические данные
относительно х
и
.
На
практике бывает и так, что, кроме
эмпирических данных, всякая иная
априорная информация относительно х
и
отсутствует.
Однако если эти данные получены в
обстановке, статистически однородной
или хотя бы статистически связанной с
той, в которой принимается решение no
данным наблюдения х,
то они являются в определенной степени
статистическим эквивалентом аналитических
моделей для распределений вероятности
х
и
,
необходимых для нахождения оптимального
правила принятия решения. Степень этой
эквивалентности, естественно,
зависит
от объема имеющихся эмпирических данных,
которые, в свою очередь, могут быть
использованы по-разному: непосредственно
для нахождения недостающих распределений
вероятности, для оценки функциональной
зависимости апостериорного риска от х
и решения u,
для уточнения структуры и параметров
решающего правила (алгоритма обработки
данных наблюдения х).
Процедуру использования эмпирических
данных, которые характеризуют прошлый
опыт, обычно называют обучением, а
соответствующие алгоритмы — обучаемыми.
Для
того чтобы яснее представить себе
возможный качественный состав имеющихся
эмпирических данных и возможные способы
их использования при синтезе систем
в условиях априорной неопределенности,
предположим, что имеется серия
повторяющихся ситуаций, статистически
однородных или хотя бы статически
связанных с той, в которой мы должны
принимать решение. Последняя (в
соответствии с гл. 2) характеризуется
значением параметра
,
определяющего величину потерь
при принятии решенияu,
и данными наблюдения х,
на основе которых принимается решение
в соответствии с правилом u
= u(x).
Пусть теперь имеется N
ситуаций,
сходных или связанных с основной, в
которых получены те или иные эмпирические
данные. Каждая из них для
характеризуется
значением параметров
,
имеющих ту же природу, состав и содержание,
что и параметры
.
Иными словами, если для ситуации, в
которой принимается интересующее нас
решение,
,
где
-
множество возможных значений
параметров
,
то и каждое из значений
является
одним из
возможных
элементов множества
;
если
имеет
распределение с плотностью
,то
и каждое из значений
имеет
то же распределение.
В
общем случае эмпирические данные
представляют собой совокупность
значений
,каждая
из составляющих
этой совокупности соответствует значению
и
может содержать тот или иной объем
сведений. Характер, значимость и способы
использования этих сведений существенно
различаются в зависимости от того,
производится ли в
-й
ситуации только наблюдение и регистрация
каких-либо данных (аналогичных х
для основной рабочей ситуации либо
как-то отличающихся от х)
или наряду с наблюдением, так же как в
рабочей ситуации, осуществляется
принятие решения
с вытекающими отсюда последствиями.
Согласно принятой терминологии, в первом
случае говорят о простом обучении,
а во втором - о «рабочеподобном». Смысл
последнего термина связан с тем, что
при получении эмпирических данных
воспроизводится не только ситуация,
характеризуемая значением параметра
,
определяющим потери, но и сам процесс
решения,
подобный
тому, который должен быть выполнен в
рабочей ситуации. Это является
принципиальной основой для получения
информации о конкретной величине потерь
от принятия решения на каждом
-м
шаге и использования этой информации
для улучшения правила принятия решения
на рабочем шаге.
Рассмотрим
более полно возможный состав эмпирических
данных - совокупности
для
различных случаев. Заметим, что эта
совокупность часто называется обучающей
последовательностью.