Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВМИО.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
3 Mб
Скачать

Казанский Государственный Университет

Кафедра экономической кибернетики

Миссаров М.Д.

Учебное пособие

«Вероятностные модели в исследовании операций»

2006г.

Предисловие

Основная часть материала, изложенного в этом пособии, читается в рамках курса «Теория риска и моделирование рисковых ситуаций», предназначенного для студентов специальности «Математические методы в экономике». В различных экономико-математических и финансовых теориях слово риск употребляется в разных смыслах. Одно из основных употреблений этого слова возникает в теории принятия решений в условиях риска. Мы решаем такие задачи, когда нам приходится оптимизировать или сравнивать между собой экономические или технические системы, на функционирование которых влияют внутренние и внешние случайные факторы. Вероятностные модели исследования операций являются основными поставщиками примеров таких систем. В моделях финансовой математики слово риск имеет другой смысл и чаще всего понимается просто как дисперсия или стандартное отклонение доходности пакета каких-либо финансовых активов. Такие модели также обсуждаются в курсе по теории риска, но им будет посвящено другое пособие.

Основной критерий отбора материала состоял в том, чтобы он был доступен всем студентам, прослушавшим элементарный курс высшей математики и теории вероятностей для технических и экономических специальностей. Я также пытался минимизировать расстояние между математическими определениями и содержательными примерами. Теория вероятностей наряду с математическим анализом и линейной алгеброй входит в «золотое ядро» математики и по праву читается студентам самых разных специальностей. Но из-за нехватки времени студенты не получают представления о приложениях теории вероятностей в физике, или, например, в исследовании операций. Поэтому это пособие будет полезно и студентам-математикам в рамках курса « Дополнительные главы теории вероятностей».

Математическую основу курса составляет теория марковских цепей, изложенная в главе третьей. При этом я обсуждаю только те аспекты теории, которые непосредственно используются в элементарных моделях систем массового обслуживания или марковской теории принятия решений. Например, вопросы классификации марковских цепей не рассматриваются. Седьмая глава посвящена вопросам статистического моделирования. В ней, в частности, обсуждается актуальный в современной прикладной математике метод моделирования сложных распределений, использующий марковские цепи ( теория Monte Carlo Markov Chain). Другим актуальным направлением в современной науке является стохастическое программирование. Простейшие примеры из этой темы приводятся в главе первой.

В заключение хочу сказать, что большую помощь в подготовке этого текста мне оказала Миссарова Ф.Р., за что я выражаю ей свою благодарность

  1. Принятие решений в условиях неопределенности и в условиях риска

    1. Принятие решений в условиях неопределенности

Условно можно разделить задачи принятия решений в исследовании операций на три группы: принятие решений в условиях определенности, в условиях неопределенности и в условиях риска. Первая группа задач является самой богатой, ей посвящено огромное количество книг и мы не будем ее обсуждать. В простейшей форме эти задачи представляются в следующем виде: есть некоторое множество, имеется конкретная функция или функционал на этом множестве и надо найти максимум или минимум этой функции. В частности, одним из основных достижений математического анализа является то, что он дал методы решения важного класса таких задач. Линейное и нелинейное программирование, комбинаторика и целочисленная оптимизация, оптимальное управление  вот те разделы исследования операций, в которых решаются различные задачи принятия решений в условиях определенности. Задачи принятия решений в условиях неопределенности образуют самый «бедный» класс задач и мы обсудим их также целиком в этом разделе. Вся остальная часть пособия будет в той или иной степени посвящена задачам принятия решений в условиях риска.

В самой общей форме задача принятия решения в условиях неопределенности ставится следующим образом. Задано некоторое множество состояний «природы» («среды»), а у лица, принимающего решения (ЛПР), имеется некоторый набор действий (решений) . Кроме того, есть отображение

,

называемое функцией потерь (или выигрышей). Число интерпретируется как потери (выигрыш) ЛПР в случае, когда он принял решение , а состояние «природы» оказалось равным . Естественно, что ЛПР заранее не знает состояния «природы». В свою очередь «природа» не настроена злонамеренно по отношению к ЛПР и не интересуется тем, какое решение оно (ЛПР) приняло. Заметим, что случай, когда вместо «природы» выступает разумный противник, имеющий свом собственные интересы, обычно изучается в курсе теории игр. Удобно записывать набор значений в виде матрицы размера , которую называют матрицей потерь (выигрышей). Задачей ЛПР является выбор «хорошего» решения. Понятно, что в общем случае ситуация очень неопределенная и трудно рассчитывать на то, что математика даст однозначные рекомендации. Тем не менее есть несколько критериев, носящих имена знаменитых математиков.

Рассмотрим следующий пример. У вас есть деньги, которые вы можете вложить в строительство гостиницы в курортной местности:

 в пункте ,

 в пункте ,

 в пункте .

Ходят слухи о том, что в пункте могут построить экологически вредное предприятие, а также о том, что в пункте построят горнолыжный курорт. Обозначим возможные состояния среды как

 ничего не изменится,

 в пункте построят предприятие,

 в пункте построят горнолыжный курорт.

Матрица возможных доходов (в рублях) оценивается следующим образом:

300000 160000 70000

130000 480000 90000

-60000 70000 600000

  1. Критерий Максимина. Этот критерий называют еще критерием Вальда, а также критерием пессимиста.

ЛПР считает, что «природа» построена против него и при любых его решениях она выбирает состояние, приносящее наименьший доход. Поэтому процедура принятия решения по этому критерию состоит из двух шагов:

Шаг 1. Для каждого действия найти состояние среды, приносящее наименьший доход.

Шаг 2. Выбрать такое действие, при котором соответствующий ему наименьший доход максимален.

Другими словами, мы должны найти

.

Для нашего примера действию соответствует наименьший доход 70000 (при состоянии ), действию  90000 (при состоянии ), действию  (-600000) (при состоянии ). Значит, максимальный критерий рекомендует выбрать решение .

Если является функцией потерь, то критерий называется минимаксным. В этом случае надо найти

.

  1. Критерий оптимиста. По-видимому, этот критерий самый глупый, поскольку не является именным. Оптимист считает, что «природа» благоприятствует ему и поэтому в каждой строке матрицы ищет наибольший доход, и выбирает решение

.

В нашем примере это решение равно .

3. Критерий Лапласа. Человек, пользующийся этим критерием, считает, что поскольку вероятности возможных состояний не известны, то все состояния равномерны и поэтому равновероятны. Считая, что , находим среднее значение (математическое ожидание) дохода для каждого из решений . Выбирается то решение, для которого средний доход максимален:

.

В нашем примере критерий Лапласа дает ответ .

4. Критерий Сэвиджа. Предположим, что ЛПР стало известно, каким будет состояние «природы». Тогда ЛПР может найти максимально возможный доход, а также вычислить для каждого решения недополученный доход. Возникает целая матрица недополученных доходов

,

которая называется матрицей сожаления. Если является матрицей потерь, то матрица сожаления определяется как

и имеет смысл матрицы лишних потерь (лишних по сравнению с наименьшими потерями). В любом случае матрица сожаления по смыслу является матрицей потерь. Далее мы применяем к матрице сожаления минимаксный критерий Вальда. Оптимальное решение определяется как

.

В нашем примере матрица сожаления выглядит так:

0 320000 530 000

170000 0 510000

360000 410000 0 .

Оптимальное решение равно .

С точки зрения психологии критерий Сэвиджа кажется разумным. Осознание недополученной выгоды или чувство зависти к соседу, ничем от вас не отличающемуся, но угадавшему выигрышное решение, может служить сильным раздражителем.

5. Критерий Гурвица. Пусть  матрица выигрышей. Если оптимист выбирает решение, максимизирующее (по ) , а пессимист пытается максимизировать , то критерий Гурвица предлагает максимизировать взвешенную сумму этих величин:

.

Выбор отражает субъективную склонность ЛПР к оптимизму, . Например, если , то в примере с гостиницами этот критерий дает решение .

Мы видим, что разные критерии дают разные ответы. Хотя решение не встретилось ни разу, легко построить матрицу выигрышей, для которой критерии дают все три различные варианты решений.