Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции(ИИС) / ИИС(Лекции).doc
Скачиваний:
19
Добавлен:
17.04.2015
Размер:
432.13 Кб
Скачать

Матричные игры со смешанными тратегиями

В предыдущей лекции была рассмотрена матричная игра, в котрой ее участники выбирают свои так называемые чистые стратегии.

Дополнительные возможности появляются у игроков, если они будут выбирать свои стратегии случайным образом. Случайный выбор первым игроком своих стратегий называется смешанной стратегией этого игрока. В матричной игре смешанные стратегии определяются наборами вероятностей Х=(х1, х2 , хm), с которыми он выбирает свои чистые стратегии (m – число возможных стратегий). Эти наборы вероятностей можно понимать как m-мерные векторы, у которых компоненты неотрицательны, а их сумма равна нулю. Очевидно, множество всех таких векторов образует симплекс, натянутый на координатные орты m-мерного евклидова пространства. Аналогично определяются n-мерные векторы Y=(y1 ,y2 , yn), сответствующие cмешанным стратегиям второго игрока.

В результате применения смешанных стратегий ситуация оказывается случайным испытанием с mn исходави. В качестве выигрыша в данных условиях естественно принять математическое ожидание выиграша, т.е.

m n

∑ ∑xi yj ai j .

i=1j=1

В матричном выражении это будет выглядить так

т

XAY .

По аналогии с чистыми стратегиями если

т т

max min XAY .= min max XAY, (1)

X Y Y X

то те стратегии X0 и Y0 , которые доставляют внешние экстремумы в данном равенстве, есть оптимальные стратегиями игроков.

Важным отличием от чистых стратегий является интересный факт: указанное равнство имеет место в с е г д а! Этот факт показан Нейманом в теореме, которая носит его имя.

Общее значение левой и правой части равенства (1)

Называется значением игры с матрицей А Оно часто обозначается ка v (A). Таким образом, значение игры есть тот наибольший выигрыш, который тгрок 1 может себе лбеспечить (или, что то же самое, те наибольшие потери игрока 2, которые он вынужден понести).

Для того, чтобы стратегии X0 и Y0 в игре с матрицей А были оптимальными, необходимо и достаточно, чтобы тиели место неравенства

X0 A .j ≥ v (A) (j=1,…,n),

Y≤ v (A) (i=1,…,m),

где A ..i – i-я строка матрицы А, а A.j – ее j-ый столбец.

Из данных неравенств следует, что влюбой матичной игре Г множества всех оптимальных стратегий игроков являются выпуклыми и замкнутыми подмножествами симплексов S m и S n всех стратегий игроков

В теории игр показано, что максимизация параметра v (A) (цены игры) эквивалентна минимизации суммы координат некотрого вектора при линейных ограничениях на его составляющие. Это означает, что расматриваемую матричная задачу, а значит, и задачу принятия решений, можно свести к задаче линейного программирования.

Лекция 8

Методы нахождения решения матричной игры в смешанных стратегиях

Решение матричной игры ГА в смешанных стратегиях формально записывается в виде тройки (x0 , y0 , vA ), где x0 – оптимальная стратегия первого игрока, y0 – второго игрока, vA – цена игры.

В предыдущей лекции было отмечено, что в ряде случаев матричные игры можно трактовать как задачу линейного прграммирования. Этот ценный для практике факт позволяет построить вычислителные методы нахождения решения матричной игры в смешанных стратегиях. Покажем, как свести матричную игру к задаче линейного прогаммирования.

Пусть х1. х2 , …, хn – есть компоненты оптимальной смешанной стратегии игрока 1.

В силу теоремы Неймана, цена игры является наибольшей изгарантированных исходов для первого игрока. Значит, имеют место следующие нервенства:

a11 x1+ а 21x2+ ….+аn1 xn ≥ v,

a12 x1+ а 22 x2+ ….+аn2 xn ≥ v,

……………………………… (1)

a1m x1+ а2m x2+ ….+аnm xn ≥ v,

Не нарушая общности, иожно положить, что цена игры ГА сторго положительна. Раделив каждое неравенство в системе (1) на v и заменив в них xi /v на xi¯(i = 1,…,n), придем к ситеме неравенств:

a11 x1¯+ а 21 x2¯+ ….+аn1 xn¯≥1,

a12 x1¯+ а 22 x2¯+ ….+аn2 xn¯≥ 1,

……………………………… (2)

a1m x1¯+ а2m x2¯+ ….+аnm xn¯≥ 1,

Ясно, что данная система эквивалентно системе (1).

Поскольку макимизация параметра v, т.е. цены игры, равносильна минимизации суммы новых переменных xi¯, то рассматриваеа нами задачу можно сформулировать следующим образом.

Найти минимум суммы x1¯ + x2¯ + ….+ xn¯ при неотрицательных значениях переменных xi¯ (i = 1, 2, …n), удовлетворяющих линейным ограничениям (2).

Как мы видим, это и есть задача линейного программирования.

Следуя теории математического программирования, двойственную задачу ставим так:

Найти максимум суммы y1¯ + y2¯ + ….+ ym¯при неотрицательных перменных yi¯, удовлетворяющих линейным ограничениям

a11 y1¯+ а12 y2¯+ ….+а1m ym¯ ≤1,

a21 y1¯+ а 22 y2¯+ ….+а2m ym ≤1,

……………………………… (2)

am1 y1¯+ аm2 y2¯+ ….+аmn ym¯ ≤1.

Лекция 9

Технология хранилища данных

Создание хранилища данных включает следующие аспекты: извлечение данных из их источников, преобразование и согласование данных, анализ, представление.

Основными источниками данных служат операционные базы данных информационных систем предприятия. Другими важными источниками являются внешние источники. В отличие от внутренних данных внешние приобретаются у специализированных организаций, занимающихся сбором информации. Кроме того, источниками данных могут быть различного рода документы (договоры, контракты, приказы, письма и т.п.).

В словарь метаданных хранилища данных, заносятся характеристики источников данных. Словарь метаданных содержит информацию о периодичности обновления данных и их согласованности во времени. Используя словарь метаданных, системы управления данными своевременно извлекают данные из имеющихся источников, преобразовывают их в единый формат и сочетают так, чтобы они были удобны для проведения анализа.

Логическая структура данных. хранилища данных радикальным образом отличается от структур данных операционных информационных систем. Поскольку информация, циркулирующая в обычных информационных системах предприятия, не предназначена последние для выработки решений, то ее следует привести к тому виду, который позволит выполнять специализированные запросы. Данные, перемещаемые из операционных баз должны храниться в хранилище данных в оптимальном для выполнения таких запросов виде. С этой целью, прежде, чем поместить в хранилище, выполняют операцию преобразования данных.

Несмотря на колоссальный объем информации, перемещаемой из различных источников в хранилище, довольно не просто извлечь именно те сведения, которые необходимы и достаточны для принятия решения. Информация разрознена, распределена по различным базам данных как внутри предприятия, так и во внешних источниках. Мало того, данные могут быть недостоверными и противоречивами. Чтобы из такой информации выбрать нужные сведения, требуется ее переосмысление. Именно поэтому и осуществляют операцию преобразования данных.

Преобразование данных предшествует операции анализа. Анализ информации может осуществляться с применением различных методов и моделей обработки данных. Имитационное моделирование позволяет построить гипотетические сценарии развития событий и оценить возможные последствия.

Современные инструментальные средства, применяемые при анализе и обработки данных, используют, как правило, не реляционную модель, а многоразмерную модель. В таких моделях данные представляются в виде “гиперкубов”. В качестве размерностей могут выступать, например, время, имя компании, подразделения компании, объем выпускаемой продукции, цена и т.п.

Многие инструментальные средства, применяют объектно-ориентированные модели данных, а также смешанные представления, т.е. используют не одну модель данных, а несколько.

Информационное хранилище создается с учетом предметной ориентвции данных, историчности и неизменяемости во времени. Хранимые данные стуктурированы. С целью экономии времени обработки запросов пользователя обеспечивается многоуровневое хранение информации. Сложность многоуровневой организации хранилища требует поддержки целостности данных, т.е. соответствия данных вышележащих уровней данным нижележащих уровней. Как правило, предусматриваются и согласовываются структуры данных и метаданных, как в целом для системы, так и для каждой решаемой автономной задачи.

Сбор информации и обеспечение ее хранения не являются конечной целью создания СППР. Известно, что для принятия решения мало собрать информацию и организовать ее хранение. Нужно уметь воспользоваться имеющейся в вашем распоряжении информацией, т.е. на основании результатов ее анализа делать те или иные выводы. Известно также, что обладая одной и той же информации, разные люди могут делать различные выводы, даже прямо противоположные. Нестандартность мышления позволяет часто принимать далеко не очевидные и не стандартные решения. Поэтому вопросам аналитического анализа информации отводится особое место.

Аналитиков интересуют не только и не столько вопросы одномерного (одноаспектного) характера, сколько многомерные вопросы. Поэтому СППР поддерживают реализацию сложных запросов, содержащих несколько аспектов анализа. Например, запрос может содержать ограничения на временной период, перечень анализируемых рисков, услуг, правовые ограничения и т.п. Безусловно, запрос любой степени сложности можно сформировать заранее. Однако процесс принятия решения характерен именно тем, что не возможно описать все множество возможных запросов из за их непредсказуемости. Мало того констатация фактов является только началом любой анализа. Да и отнесение к фактам тех или иных утверждений может вызвать сопутствующие им вопросы.

Пример.

Рассмотрим два события – рост заработной платы и повышение уровня жизни.

Возникает вопрос, как связаны между собой эти события. Рост заработной платы – необходимое условие повышения уровня жизни? Является рост заработной платы достаточным условием повышения уровня жизни? Другими словами, имеется ли причинно-следственная связь между этими событиями? Очевидно, что дать ответ на данный вопрос довольно трудно. Для полного ответа требуются дополнительные сведения.

Другой пример.

Пусть показатели финансовой деятельности компании свидетельствуют об устойчивом положении ее на рынке (валовая прибыль на протяжении последних двух лет неуклонно возрастает, сальдо доходов и расходов положительно, чистая прибыль превышает намеченные уровни). Достаточно ли этих данных для принятия решения о увеличении выпуска продукции компании? Для эксперта, разумеется, не достаточно. Многие же специалисты среднего звена управленческого аппарата дадут на данный вопрос положительный ответ.

Таким образом, сами по себе данные, содержащиеся в информационном хранилище, целесообразно преобразовать в знания, т.е. из них нужно извлечь знания.

Операция извлечения знаний занимает важное место в процессе подготовки принятия решения.

Как известно, при создании баз знаний экспертных систем также приходится решать вопрос извлечения знаний. Однако при этом речь идет о передаче знаний эксперта инженеру по знаниям, а в нашем случае – знания извлекаются из хранилища данных. Поэтому имеются принципиальные отличия процессов извлечения знаний в системах поддержки принятия решений и системах, основанных на знаниях.

Основное отличие заключается в том, что наполнение базы знаний ЭС осуществляет эксперт совместно с инженером по знаниям. Без помощи последнего, как показывает практика, эксперт не в состоянии создать модель предметной области. Как ни странно, при моделировании предметной области эксперту мешает глубина его познаний.

В реальном мире существуют сотни типов отношений между отношениями (временные, пространственные, причинно-следственные и др.). Реальная предметная область представляет собой сложную систему. Любая ее модель отражает исследуемую часть реального мира с той или иной степенью точности. В процессе создания модели приходится упрощать имеющие место взаимосвязи между объектами реального мира. Такое упрощение легче сделать аналитику, чем эксперту. Аналитик воспринимает конкретную предметную область в упрощенном виде, он лучше владеет методологией разработки сложных систем. Поэтому-то и включают в коллектив разработчиков систем, основанных на знаниях, как экспертов, так и инженеров по знаниям.

В принципе мышление по своей природе диалогично. Об этом говорили еще древнегреческие исследователи (Платон). Диалогичность мышления подтверждает утверждение, гласящее о том, что в начале было слово.

Инженер по знаниям в диалоге с экспертом выясняет его знания о рассматриваемой предметной области, т.е. сам приобретает необходимые ему знания. В процессе диалога он пытается создать модель предметной области. Если ему не хватает для этого каких-то сведений, он задает вопросы эксперту и заново строит искомую модель. Зачастую эксперт не отдает себе отчета в том, что его рассуждения на самом деле не так просты, как он преподносит их инженеру по знаниям. Он, например, далеко не всегда поясняет, почему одно событие влечет за собой другое. Чтобы выявить причинно-следственные связи между теми или иными явлениями, аналитик вынужден снова обращаться с вопросами к эксперту. Таким образом, процесс построения модели предметной области носит итеративный характер.

Процесс извлечения знаний в СППР не обладает описанными особенностями. В то же время средства извлечения знаний, используемые в них, позволяют получить из хранилища данных более глубокие знания, чем обычные средства обработки транзакций и оперативной аналитической обработки. На основании таких знаний можно выявить полезные для обоснования решения имеющие место закономерности. В принципе эти закономерности можно получить, сформировав необходимую последовательность запросов и выполнив их. Однако применяемые с этой целью методы в СППР значительно расширяют спектр возможных вариантов и позволяют быстрее обследовать огромные массивы информации, которые могут достигать сотен гигабайт.

Процесс анализа данных и выявление скрытых закономерностей с использованием специального математического и программного аппарата в теории систем, основанных на знаниях, называют формированием знаний. По традиции этот термин употребляют в области инженерии знаний. К данной области относится разработка систем обучения и самообучения, включающих модели, методы и алгоритмы обучения. Такие системы позволяют выявить причинно-следственные зависимости между структурированными объектами баз данных в условиях не полной информации.

В последние годы проблеме поиска закономерностей, присущих данным, находящимся в БД, уделяется значительное внимание со стороны исследователей в области искусственного интеллекта.

Достижения в данной области науки способствовали появлению програмнных средств извлечения знаний и применению их в процессе принятия решений. Современные средства извлечения знаний используют различные методы выявления скрытых закономерностей в данных. В первую очередь это – индуктивные методы обучения, статистические методы, методы нечеткой логики, метолы нейросетевых технологий.

Лекция 10