
- •Принятие решений в условиях неопределенности и в условиях риска
- •Принятие решений в условиях неопределенности
- •Принятие решений в условиях риска
- •Стохастическое программирование
- •Вероятностные модели управления запасами
- •2.1. Одноэтапная модель управления запасами
- •Одноэтапная модель с учетом затрат на оформление заказа
- •Многоэтапная модель управления запасами
- •Управление запасами с учетом издержек на производство
- •3. Марковские цепи
- •Марковские цепи. Уравнение Колмогорова-Чэпмена
- •3.2 Марковские цепи с дискретным временем. Теорема о предельных вероятностях
- •3.3. Марковские цепи с непрерывным временем. Уравнения Колмогорова
- •Пуассоновский процесс
- •Простейший поток
- •Пуассоновский поток как марковский процесс. Немарковские потоки
- •Сложный пуассоновский процесс и процессы риска в страховой математике
- •Системы массового обслуживания
- •Марковские системы массового обслуживания
- •Процессы рождения и гибели. Одноканальная марковская смо с бесконечной очередью
- •Многоканальная марковская смо с ожиданием. Дисциплины взаимопомощи
- •Задача о ремонте станков
- •Немарковские модели смо
- •6. Марковские процессы принятия решений
- •6.1. Модели с конечным горизонтом планирования. Задача о замене оборудования
- •6.2. Задача о наилучшем выборе
- •Модели с бесконечным горизонтом планирования
- •7. Статистическое моделирование
- •7.1. Моделирование случайных величин
- •7.2. Моделирование случайных процессов в страховой и финансовой математике
- •Моделирование систем массового обслуживания
- •Статистический анализ данных. Методы уменьшения дисперсии
- •7.5. Метод Монте Карло марковских цепей. Метод отжига в задачах комбинаторной оптимизации
- •Приложение Сводка определений и теорем теории вероятностей и математической статистики
- •Литература
- •Оглавление
- •Глава 1. Принятие решений в условиях неопределенности и в условиях риска
- •Глава 2. Вероятностные модели управления запасами
- •Глава 3. Марковские цепи
- •Глава 4. Пуассоновский процесс
- •Глава 5. Системы массового обслуживания
- •Глава 6. Марковские процессы принятия решений
- •Глава 7. Статистическое моделирование
Казанский Государственный Университет
Кафедра экономической кибернетики
Миссаров М.Д.
Учебное пособие
«Вероятностные модели в исследовании операций»
2006г.
Предисловие
Основная часть материала, изложенного в этом пособии, читается в рамках курса «Теория риска и моделирование рисковых ситуаций», предназначенного для студентов специальности «Математические методы в экономике». В различных экономико-математических и финансовых теориях слово риск употребляется в разных смыслах. Одно из основных употреблений этого слова возникает в теории принятия решений в условиях риска. Мы решаем такие задачи, когда нам приходится оптимизировать или сравнивать между собой экономические или технические системы, на функционирование которых влияют внутренние и внешние случайные факторы. Вероятностные модели исследования операций являются основными поставщиками примеров таких систем. В моделях финансовой математики слово риск имеет другой смысл и чаще всего понимается просто как дисперсия или стандартное отклонение доходности пакета каких-либо финансовых активов. Такие модели также обсуждаются в курсе по теории риска, но им будет посвящено другое пособие.
Основной критерий отбора материала состоял в том, чтобы он был доступен всем студентам, прослушавшим элементарный курс высшей математики и теории вероятностей для технических и экономических специальностей. Я также пытался минимизировать расстояние между математическими определениями и содержательными примерами. Теория вероятностей наряду с математическим анализом и линейной алгеброй входит в «золотое ядро» математики и по праву читается студентам самых разных специальностей. Но из-за нехватки времени студенты не получают представления о приложениях теории вероятностей в физике, или, например, в исследовании операций. Поэтому это пособие будет полезно и студентам-математикам в рамках курса « Дополнительные главы теории вероятностей».
Математическую основу курса составляет теория марковских цепей, изложенная в главе третьей. При этом я обсуждаю только те аспекты теории, которые непосредственно используются в элементарных моделях систем массового обслуживания или марковской теории принятия решений. Например, вопросы классификации марковских цепей не рассматриваются. Седьмая глава посвящена вопросам статистического моделирования. В ней, в частности, обсуждается актуальный в современной прикладной математике метод моделирования сложных распределений, использующий марковские цепи ( теория Monte Carlo Markov Chain). Другим актуальным направлением в современной науке является стохастическое программирование. Простейшие примеры из этой темы приводятся в главе первой.
В заключение хочу сказать, что большую помощь в подготовке этого текста мне оказала Миссарова Ф.Р., за что я выражаю ей свою благодарность
Принятие решений в условиях неопределенности и в условиях риска
Принятие решений в условиях неопределенности
Условно можно разделить задачи принятия решений в исследовании операций на три группы: принятие решений в условиях определенности, в условиях неопределенности и в условиях риска. Первая группа задач является самой богатой, ей посвящено огромное количество книг и мы не будем ее обсуждать. В простейшей форме эти задачи представляются в следующем виде: есть некоторое множество, имеется конкретная функция или функционал на этом множестве и надо найти максимум или минимум этой функции. В частности, одним из основных достижений математического анализа является то, что он дал методы решения важного класса таких задач. Линейное и нелинейное программирование, комбинаторика и целочисленная оптимизация, оптимальное управление вот те разделы исследования операций, в которых решаются различные задачи принятия решений в условиях определенности. Задачи принятия решений в условиях неопределенности образуют самый «бедный» класс задач и мы обсудим их также целиком в этом разделе. Вся остальная часть пособия будет в той или иной степени посвящена задачам принятия решений в условиях риска.
В самой общей форме
задача принятия решения в условиях
неопределенности ставится следующим
образом. Задано некоторое множество
состояний
«природы» («среды»), а у лица, принимающего
решения (ЛПР), имеется некоторый набор
действий (решений)
.
Кроме того, есть отображение
,
называемое функцией
потерь (или выигрышей). Число
интерпретируется как потери (выигрыш)
ЛПР в случае, когда он принял решение
,
а состояние «природы» оказалось равным
.
Естественно, что ЛПР заранее не знает
состояния «природы». В свою очередь
«природа» не настроена злонамеренно
по отношению к ЛПР и не интересуется
тем, какое решение оно (ЛПР) приняло.
Заметим, что случай, когда вместо
«природы» выступает разумный противник,
имеющий свом собственные интересы,
обычно изучается в курсе теории игр.
Удобно записывать набор значений
в виде матрицы размера
,
которую называют матрицей потерь
(выигрышей). Задачей ЛПР является выбор
«хорошего» решения. Понятно, что в общем
случае ситуация очень неопределенная
и трудно рассчитывать на то, что математика
даст однозначные рекомендации. Тем не
менее есть несколько критериев, носящих
имена знаменитых математиков.
Рассмотрим следующий пример. У вас есть деньги, которые вы можете вложить в строительство гостиницы в курортной местности:
в пункте
,
в пункте
,
в пункте
.
Ходят слухи о том, что в пункте могут построить экологически вредное предприятие, а также о том, что в пункте построят горнолыжный курорт. Обозначим возможные состояния среды как
ничего не
изменится,
в пункте
построят предприятие,
в пункте
построят горнолыжный курорт.
Матрица возможных доходов (в рублях) оценивается следующим образом:
300000 160000 70000
130000 480000 90000
-60000 70000 600000
Критерий Максимина. Этот критерий называют еще критерием Вальда, а также критерием пессимиста.
ЛПР считает, что «природа» построена против него и при любых его решениях она выбирает состояние, приносящее наименьший доход. Поэтому процедура принятия решения по этому критерию состоит из двух шагов:
Шаг 1. Для каждого действия найти состояние среды, приносящее наименьший доход.
Шаг 2. Выбрать такое действие, при котором соответствующий ему наименьший доход максимален.
Другими словами, мы должны найти
.
Для нашего примера действию соответствует наименьший доход 70000 (при состоянии ), действию 90000 (при состоянии ), действию (-600000) (при состоянии ). Значит, максимальный критерий рекомендует выбрать решение .
Если является функцией потерь, то критерий называется минимаксным. В этом случае надо найти
.
Критерий оптимиста. По-видимому, этот критерий самый глупый, поскольку не является именным. Оптимист считает, что «природа» благоприятствует ему и поэтому в каждой строке матрицы ищет наибольший доход, и выбирает решение
.
В нашем примере это решение равно .
3. Критерий
Лапласа.
Человек, пользующийся этим критерием,
считает, что поскольку вероятности
возможных состояний
не известны, то все состояния равномерны
и поэтому равновероятны. Считая, что
,
находим среднее значение (математическое
ожидание) дохода для каждого из решений
.
Выбирается то решение, для которого
средний доход максимален:
.
В нашем примере критерий Лапласа дает ответ .
4. Критерий Сэвиджа. Предположим, что ЛПР стало известно, каким будет состояние «природы». Тогда ЛПР может найти максимально возможный доход, а также вычислить для каждого решения недополученный доход. Возникает целая матрица недополученных доходов
,
которая называется матрицей сожаления. Если является матрицей потерь, то матрица сожаления определяется как
и имеет смысл
матрицы лишних потерь (лишних по сравнению
с наименьшими потерями). В любом случае
матрица сожаления по смыслу является
матрицей потерь. Далее мы применяем к
матрице сожаления
минимаксный критерий Вальда. Оптимальное
решение определяется как
.
В нашем примере матрица сожаления выглядит так:
0 320000 530 000
170000 0 510000
360000 410000 0 .
Оптимальное решение равно .
С точки зрения психологии критерий Сэвиджа кажется разумным. Осознание недополученной выгоды или чувство зависти к соседу, ничем от вас не отличающемуся, но угадавшему выигрышное решение, может служить сильным раздражителем.
5. Критерий
Гурвица.
Пусть
матрица выигрышей. Если оптимист выбирает
решение, максимизирующее (по
)
,
а пессимист пытается максимизировать
,
то критерий Гурвица предлагает
максимизировать взвешенную сумму этих
величин:
.
Выбор
отражает субъективную склонность ЛПР
к оптимизму,
.
Например, если
,
то в примере с гостиницами этот критерий
дает решение
.
Мы видим, что разные критерии дают разные ответы. Хотя решение не встретилось ни разу, легко построить матрицу выигрышей, для которой критерии дают все три различные варианты решений.