Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
сеченов.docx
Скачиваний:
5
Добавлен:
24.12.2018
Размер:
138.71 Кб
Скачать

Интеллектуализация поисковых процедур

Системы управления знаниями в настоящее время с успехом используются во многих областях применения автоматизирован­ных информационных систем, ориентированных на интеллектуаль­ные методы. С другой стороны, информация современного общест­ва привела к появлению крупнейших информационных банков в различных отраслях научно-технических знаний. Попытки разра­ботки и внедрения многокритериальных систем классификации информации, а также автоматизации информационного поиска, пока не приводят к сколько-нибудь существенным результатам с точки зрения увеличения релевантности и комфортности информа­ционного поиска.

Развитие новых информационных технологий и образования реальной всемирной компьютерной сети настоятельно требует пре­доставления новых возможностей получения актуальной информа­ции и знаний, которые предприятия и физические лица могут ис­пользовать в своей деятельности. Таким образом, возникает про­блема интеллектуального поиска необходимой пользователю науч­но-технической и технологической информации. Решение этих проблем может быть найдено в развитии методологии проектиро­вания систем управления знаниями для информационного поиска.

На современном этапе к числу проблем поиска информации можно отнести следующие:

• при получении пользователем большого объема информации в результате автоматизированного поиска много времени затрачи­вается на ее просмотр и выбор, в то время как даже простой выбор необходимой информации зачастую представляет собой нелегкую проблему;

• выбор информации, осуществляемый человеком, нередко не является рациональным и строго последовательным, что сущест­венно осложняет поиск информации;

• пользователь при поиске информации обычно не строго опре­деляет цель поиска, т. е. использует нечетко определенные поня­тия.

Недостатки существующих систем управления знаниями за­ключаются в том, что при построении с целью поиска персональ­ной модели знаний для организации или пользователя и при по­следующем поиске информации в базе знаний не учитываются от­ношение к знанию пользователя и взаимодействие элементов ин­формации между собой, что ведет к увеличению объема выборки из баз данных.

Процедура проведения поиска информации, необходимой пользователю, предполагает в ходе опроса выявление ключевых по­нятий поиска и их значимости для пользователя.

На увеличение используемости систем управления зна­ниями влияет несколько факторов:

• влияние окружающей среды;

• развитие технологий;

• способность создавать ценную информацию.

Решение проблемы построения систем поиска информации су­щественно облегчается при использовании систем управления зна­ниями.

Недостатки существующих систем управления знаниями в том, что при поиске информации в базе знаний не учитывают отноше­ние к информации пользователя и взаимодействие элементов ин­формации между собой, что ведет к большому объему выборки из баз данных, и расположение документов представляет собой беспо­рядочную структуру, а не последовательность, расположенную по возрастанию степени важности документа.

В связи с этим необходимо составить библиотеку моделей пред­ставления знаний (МПЗ), используемых при построении систем управления знаниями. При этом для формализации описания мо­дели знаний следует использовать универсальную алгебру.

При проектировании баз знаний используют четкое взаимоот­ношение объектов, т.е. традиционную логику, которая подразуме­вает, что символы и управляемые процедуры точно определены. Такой подход облегчает создание систем, основанных на знаниях. Однако указанный подход недостаточен для определения реального мира (предметной области), в котором часто возникает неопреде­ленность отклонений между объектами. В отличие от традицион­ной логики нечеткая логика обладает способностью обрабатывать неопределенность и приблизительные рассуждения.

Модель многокритериального выбора в условиях неопределенности. При решении задач поискового конструирования конструктор име­ет дело с формально неопределенными связями, неметрическими признаками, качественными критериями, а зачастую и с нефор­мальным описанием требований технического задания (ТЗ). Нали­чие в таких задачах подобного рода неопределенностей ведет к не­обходимости их формального учета и в проектных критериях.

Если поиск рационального проектно-конструкторского реше­ния (ПКР) ведется в условиях неопределенности, то нет смысла точно фиксировать окончательную цель. В соответствии с этим, формальное описание цели ТЗ, параметров разрешаемой проблем­ной ситуации, а также значений качественных факторов, выражае­мых в терминах цели, можно представить в виде нечетко опреде­ленных предпочтений. Например:

Ремонтопригодность — «НЕ ОЧЕНЬ ВЫСОКАЯ»,

Технологичность — «НИЗКАЯ».

С целью формализации процедур выбора, связанных с неколи­чественными измерениями на базе нечетких множеств, ис­пользуются специальные функции принадлежности и на их основе вводятся лингвистические переменные, которые в наиболее естест­венной для конструктора форме отражают особенности его нефор­мальных предпочтений ив то же время являются точными операн­дами для расчета на ЭВМ.

Применение лингвистических переменных для описания нефор­мальных элементов, встречающихся в процессе решения проектно-конструкторской задачи (ПКЗ), обусловлено еще и тем, что раз­мытость (расплывчатость) свойственна самой сущности процессов восприятия, воспроизведения и переработки информации челове­ком-конструктором. Конструктору легче формулировать свое мне­ние расплывчато, и нечеткая оценка в большинстве случаев оказы­вается более адекватной реальной действительности, чем четкая.

Если требуется найти решение, экстремизирующее все частные критерии (составляющие многокомпонентного ТЗ), то необходимо рассматривать векторный критерий оптимальности. Как известно, точная оптимизация векторного функционала недостижима. Единственным объективным фактором, характеризующим пробле­му векторной оптимизации (в рамках того субъективизма, который связан с выбором самих локальных критериев), является наличие области Парето в пространстве критериев и существование паре­то-оптимальных решений. Область Парето (область компромиссов) ограничивает возможный выбор проектных решений. Для выбора ПКР из множества парето-оптимальных решений необходим ввод в рассмотрение дополнительных критериев.

В настоящее время основными группами методов при решении задач векторной оптимизации являются:

• оптимизация последовательности скалярных (локальных, ча­стных) критериев при введении приоритетов и назначении после­довательных уступок;

• оптимизация в целях выделения ларето-оптимальных решений;

• оптимизация, в смысле близости решения к некоторому иде­альному значению;

• оптимизация на основе компромиссных соотношений, на­пример путем введения весовых коэффициентов или использова­ния пороговой оптимизации.

Эти группы методов различаются степенью дополнительной информации, которую необходимо получить от конструктора для проведения оптимизации, а также сложностью вычислительных процедур, предназначенных для обработки этой информации.

Типовая последовательность расчетных процедур многокрите­риального выбора представляется в следующем виде:

1. Устанавливается ранг модели.

2. Исходя из опыта прошлого и среднестатистических представ­лений лиц, принимающих решения, устанавливаются приемлемые значения функций принадлежности и формируется структур­ное содержание лингвистических переменных.

3. Определяются весовые коэффициенты частных критериев.

4. Формируется матрица многокритериального выбора.

5. Производится линейное преобразование частных критериев, имеющих количественный характер.

6. Определяются нормированные рассогласования j-й хараристики i-ro варианта с требованиями ТЗ.

7. Определяются суммарные взвешенные потери.

8. После ряда преобразований получим для Vi (i= l,...,m) опре­деление уровня относительной неопределенности Д.

9. Согласно методике, выделяется множество эффективных ПКР. Дальнейший выбор рационального ПКР производится на осно­ве праксеологического анализа структуры дополнительных крите­риев.

Распознавание образов и анализ изображений

Разнообразные процедуры поиска информации или случившегося события среди множества других данных и событий, контроль состоя­ния сложных многопараметрических объектов и процессов, управление в условиях неопределенности и ограниченной информации играют большую прикладную роль в решении многих задач в различных пред­метных областях. Здесь используются, как правило, методы обучения алгоритмическим процедурам преобразования и анализа информации для задач, алгоритмы решения которых неизвестны.

Задачи распознавания (классификации) возникают в связи с обработкой и преобразованием на ЭВМ структур, представляющих в программах искусственного интеллекта знания о предметной об­ласти в целом и знания, относящиеся к конкретной задаче.

Под образом понимается структурированное приближенное (частичное) описание изучаемого объекта или процессов, причем частичная определенность описания является принципиальным свойством образа. Образ допускает рекурсивное определение: сим­вол является образом, список символов является образом. Можно допустить, что образ состоит из двух групп символов, представляю­щих соответственно переменные и постоянные характеристики объекта описания.

Описания служат для установления соответствия образов, т.е. доказательства их идентичности, аналогичности, подобия, сходства и т.п., осуществляемого сопоставлением. Сопоставление образов представляет собой основную задачу как распознавания, так и ис­кусственного интеллекта в целом.

В различных задачах искусственного интеллекта понятию «об­раз» придается различный смысл. Так, в распознавании (в класси­ческих моделях) образ описывается вектором признаков, каждый элемент которого представляет числовое значение одного из при­знаков, характеризующих соответствующий объект. В структурной модели распознавания в качестве образа выступает высказывание, порождаемое грамматикой, характеризующий класс, которому дан­ный образ принадлежит.

Целью создания автоматизированных вычислительных систем распознавания является автоматизация группы процессов воспри­ятия и познания, связанных с поиском, выделением, идентифика­цией, классификацией и описанием образов на основе анализа ре­альных данных. Обычно поиск и выделение образов осуществляют­ся на начальном этапе анализа в процессе обработки исходных данных; следующий этап — разработка «классификатора» — вклю­чает анализ выборочных (преобразованных) данных, синтез моде­ли, учитывающий изменчивость образов, выбор из заданного набо­ра характеристик наиболее информативных и разработку алгоритма распознавания (классификации).

В основе гносеологического обоснования распознавания и таких фундаментальных понятий распознавания, как образ, класс, распознающий алгоритм, лежит представление о структу­рированности мира, т.е. существовании регулярности, проявляю­щейся в виде постоянных связей, закономерностей. Отправной точкой служат объект (образ как таковой) и проблемы природы образа, прототипа, класса. Образы рассматриваются в рамках точного формализма, который используется в качестве основы для синтеза и анализа образов, что способствует пониманию того, каким способом образы строятся и обрабатываются. В результате процедуры, обеспечивающие описание, аппроксима­цию, восстановление и распознавание образов, принимают вид естественных следствий процедур формирования и преобразова­ния объектов. Основным объектом служат комбинаторные регулярные структуры (конфигурации), логические конструкции, по­зволяющие определять типы регулярности. С формальной точки зрения речь идет о построении новых объектов посредством комбинирования заданных объектов в соответствии с определен­ными правилами построения объектов. Постулируется, что обра­зы формируются из простых стандартных элементов (атомов), которые выбираются в соответствии с «физической» природой изучаемых объектов и процессов. В качестве таких элементов могут выступать абстрактные символы, множества, отношения или функции, но роль элементов в порождении регулярных структур идентична.

Распознавание обычно связывают с двумя функциями: отнесе­нием объекта к неизвестному классификатору классу объектов и идентификацией объекта в качестве элемента известного классифи­катору класса. Первая функция представляет собой процесс выде­ления новых классов — кластеризацию, а вторая — собственно рас­познавание.

Основной целью распознавания является построение на основе систематических, теоретических и экспериментальных исследова­ний эффективных вычислительных средств для отнесения форма­лизованных описаний процессов и объектов к соответствующим классам. Задачи распознавания представляют собой дискретные аналогии задач поиска оптимальных решений, в которых по некоторой информации требуется установить, обладает ли объект сированным набором свойств.

Математические модели распознавания образов. Среди достаточ­но хорошо зарекомендовавших себя математических моделей сле­дует выделить следующие:

1. Модели, основанные на использовании принципа разделе­ния, различаются главным образом заданием класса поверхностей, среди которых выбирается поверхность (или набор поверхностей), в некотором смысле наилучшим образом разделяющая объекты разных классов.

2. Статистические модели, основанные на использовании аппа­рата математической статистики. Применяются в тех случаях, когда определены вероятностные характеристики классов, например за­коны распределения.

3. Модели, построенные на основе «методы потенциальных функций» и базирующиеся на заимствованной из физики идее по­тенциала, определенного для любой точки пространства и завися­щего от расстояния до источника потенциала.

4. Модели вычисления оценок (голосования), основанные на принципе частичной прецедентности. Анализируется «близость» между частями описаний ранее классифицированных объектов и объекта, который надо распознать. Наличие близости служит час­тичным прецедентом и оценивается по заданному правилу (посред­ством числовой оценки).

5. Модели, основанные на исчислении высказываний, в частно­сти на аппарате алгебры логики, в которых классы и признаки объ­ектов рассматриваются как логические переменные.

Появление каждого нового эвристического алгоритма можно рассматривать как эксперимент, а со всем множеством экспери­ментов и их результатов необходимо работать как с новым для ма­тематики множеством объектов, т.е. изучать с помощью строгих математических методов множество некорректных процедур реше­ния плохоформализованных задач.

Потребность в синтезе моделей распознавания определялась необходимостью фиксировать класс алгоритмов при выборе опти­мальной или хотя бы приемлемой процедуры решения конкретной задачи.

Методы работы с нечеткими знаниями

Особенностью большинства интеллектуализированных инфор­мационных систем является их функционирование в сложных ПО со множеством объектов, разнообразных процессов и носителей естественного интеллекта — людьми. К производственным ПО можно отнести технические, технологические и экологические сис­темы, разные промышленные, энергетические и транспортные комплексы, предназначенные для создания материальных и других видов продукции. Современные производственные ПО представля­ют собой сложную структуру, состоящую из совокупности взаимо­связанных подструктур, функционирование которых направлено на достижение общих целей всей структуры ПО. В этих условиях при исследовании подобных структур и описании их математическими моделями возникает проблема дефицита информации. Дефицит информации возникает, во-первых, из-за неполноты (ограничен­ности) информации, описывающей объект или наблюдаемый про­цесс (явление); во-вторых, из-за качественного (неформализован­ного) представления информации, порождаемой трудноформализуемой ситуацией; в-третьих, из-за нечеткости информации, появ­ляющейся в условиях неопределенности.

Проблему, связанную с недостатком информации, решают сле­дующими способами: либо стараются уменьшить дефицит информации, либо примиряются с недостатком информации и продолжа­ют исследование в сложившихся условиях.

Одно из направлений исследований в решении проблем неоп­ределенности связано с созданием математических методов для описания нечетко определенных ПО. Трудности здесь возрастают, если существует лингвистическая неопределенность при описании ПО. В подобных ситуациях широкое применение находит аппарат нечеткой логики Л. Заде.

Что же предложил Заде? Во-первых, он расширил классическое канторовское понятие множества, допустив, что характеристиче­ская функция (функция принадлежности элемента множеству) мо­жет принимать любые значения в интервале (0;1), а не только зна­чения 0 либо 1. Такие Множества были названы им нечеткими (fuzzy). Л. Заде определил также ряд операций над нечеткими мно­жествами и предложил обобщение известных методов логаческого вывода modus ponens и modus tollens. Введя затем понятие лингвис­тической переменной и допустив, что в качестве ее значений (тер­мов) выступают нечеткие множества, Л.Заде создал аппарат для описания процессов интеллектуальной деятельности, включая не­четкость и неопределенность выражений. Математическая теория нечетких множеств, предложенная Л.Заде более четверти века на­зад, позволяет описывать нечеткие понятия и знания, оперировать этими знаниями и делать нечеткие выводы. Основанные на этой теории методы построения компьютерных нечетких систем сущест­венно расширяют области применения компьютеров. В последнее время нечеткое управление является одной из самых активных и результативных областей Исследований применения теории нечет­ких множеств.

Таким образом, при формализации качественных знаний может быть использована теория нечетких множеств, особенно те ее ас­пекты, которые связаны с лингвистической неопределенностью, наиболее часто возникающей, например, при работе с экспертами на естественном языке. Под лингвистической неопределенностью подразумевается не полиморфизм слов естественного языка, кото­рый может быть преодолен на уровне понимания смысла высказы­ваний в рамках байесовской модели, а качественные оценки есте­ственного языка для длины, времени, интенсивности, для логиче­ского вывода, принятия решений, планирования.

Лингвистическая неопределенность в системах представления знаний задается с помощью лингвистических моделей, основанных на теории лингвистических переменных и теории приближенных рассуждений. Эти теории опираются на понятие нечеткого множества, систему операций над нечеткими множествами и строения функции принадлежности.

В основе этой теории лежит понятие нечеткого множества, которое является математической формализацией не­четкой информации, используемой при анализе, моделировании и управлении сложными системам ПО.