Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
0
Добавлен:
20.04.2023
Размер:
3.56 Mб
Скачать

В последнее время наблюдается оживление рынка программного обеспечения,

предназначенного для ведения интеллектуального анализа данных (в англоязычных источниках — Data Mining, т. е. «раскопка данных»). Для этого класса систем ИИ характерно комплексное использование методов, используемых в логических системах ИИ и нейрокомпьютинге, в сочетании с инструментарием статистического анализа данных и компьютерной лингвистики. Только по состоянию на начало 1999 года на американском рынке интеллектуального программного обеспечения было представлено свыше пятнадцати программных и программно-аппаратных комплексов, относящихся к этому классу99.

Безусловно, все эти системы нуждаются в обучении, профессиональной настройке и адаптации к предметной области, в которой предполагается их дальнейшее использование. В

большинстве своем, они представляют собой системы искусственного интеллекта,

ориентированные на решение задач анализа «абстрактных» типов данных (т. е.

безотносительно к их семантике), интегрированные со сконфигурированными под потребности заказчика базами данных. Иным вариантом поставки систем data mining

является вариант, предполагающий настройку и адаптацию системы искусственного интеллекта (собственно, инструмента Data Mining) под уже существующую подсистему хранения данных заказчика.

В любом варианте поставки по мере функционирования системы она выделяет некие скрытые закономерности в хранимых массивах данных (в том числе — корреляции временных рядов). Такие корреляции не всегда очевидны для аналитика, однако, для систем data mining числа — родная стихия. Системы data mining не имеют обыкновения забывать или упускать из внимания сколь бы то ни было «незначительные детали» и закономерности

— это свойство делает их полезным инструментом информационно-аналитической работы.

Принцип функционирования систем интеллектуального анализа данных состоит в том, что на основе анализа потока данных, поступающих от разнообразных источников информации, формируется информационный образ неким образом интерпретируемой ситуации, который в ходе дальнейшей эксплуатации системы может быть «узнан», о чем и информируется потребитель. Отрасль, для которой создается такая система, на этапе разработки, в принципе, не существенна, поскольку важен лишь принцип формирования системы признаков и класс данных, на которые ориентирована данная система

(количественные, качественные).

Адаптация к предметной области этого класса программного обеспечения заключается в том, что предметная область подлежит моделированию и описанию в виде совокупности измеримых атрибутов. Поведение этих атрибутов во времени неким (наперед неизвестным) образом характеризует состояние и поведение систем. С точки зрения

исследователя интерес представляет именно то, каким образом наблюдаемые ситуации и тенденции отражаются в имеющемся наборе атрибутов, не существует ли неких признаков,

характеризующих начальный период зарождения негативной или позитивной тенденции,

скатывания к неким сценариям в развитии ситуации и т. п.

Еще раз заметим: системы data mining не работают напрямую с текстами произвольного формата и данными, которые не могут быть непосредственно сопоставлены.

Максимум, что они «могут», если не располагают тезаурусом, характерным для данной предметной области — это работа со структурно-статистическими признаками и временными распределениями.

Если разобраться, то, на самом деле, такие системы могут оказаться полезными даже в случае отсутствия интепретанты у впервые проявившегося признака, поскольку системы интеллектуального анализа данных способны лишь акцентировать внимание аналитика на неких всплесках, по совокупности интегральных или частных показателей отличающих ситуацию от эталона нормы. Какую именно интерпретацию получат эти признаки — вопрос квалификации аналитика, поскольку задача систем интеллектуального анализа данных — это выделение сэмпла, но никак не снабжение его некой семантикой.

Системы этого типа работают подобно периферийному зрению человека — они реагируют лишь на изменения (периферийное зрение человека обеспечивает только сигнализацию о перемещениях в «опасной» зоне, но за распознавание движущегося объекта оно не берется).

Обращают на себя внимание попытки вхождения на уровень таких, казалось бы,

трудно формализуемых отношений, как политика. Подобные системы не пытаются подменить аналитика, взвалив на себя весь интеллектуальный процесс, связанный с формированием политической стратегии (социализацией идей), однако способны выступать в роли хорошего помощника, способного непредвзято оценить пользу от предпринятых политических шагов. Для того, чтобы система смогла стать таким помощником,

пользователю нужно «разъяснить» автоматизированной системе преследуемые им цели и рассматриваемые способы достижения этих целей, «проинформировать» систему о тех политических силах, чьи интересы, следует учитывать при решении задачи, отношениях между вероятными политическими сторонниками и противниками, возможных препятствиях на пути достижения целей и вероятных причинах их возникновения. Лишь после этого встроенная экспертная система будет способна оказать пользователю помощь в разработке альтернативных вариантов стратегии достижения целей, сопоставить эти варианты, а также оценить результативность предпринятых политических шагов. Далее начинается работа,

собственно, системы искусственного интеллекта, которая на основе поставляемых ей данных

(отклики прессы, рейтинги, результаты голосования и т. д.) предпримет попытки оценивания результативности целенаправленной деятельности. По результатам работ обычно предоставляется набор графиков, текстов и диаграмм, обеспечивающих возможность системного видения проблемы и путей ее решения.

Доступным примером, на котором можно испытать возможности такого рода систем,

может служить распространяемая на основе лицензии Shareware «облегченная» версия программного обеспечения PolicyMaker Lite (PoliMap, США, http://www.polimap.com).

Данный программный продукт специально разработан для ведения политического анализа и позволяет оценивать расстановку действующих политических сил при осуществлении политической активности (например, при продвижении законодательных инициатив,

ведении внутрипартийной борьбы или в ходе выборов). И хотя в этой системе (по крайней мере, в той демонстрационной версии, которая предлагается на пробу заинтересованным лицам) явно перевешивает блок экспертных знаний, ознакомление с ней может оказаться весьма поучительным.

Назвать такие системы разумными нельзя, но на звание электронного интеллектуального помощника они вполне могут претендовать. Часто по своим функциями системы этого типа занимают позицию между инструментальными средствами формального моделирования и средствами активизации мыслительной деятельности.

3.9.5 Средства структурирования и визуализации данных. Электронные

помощники аналитика

Над решением проблемы визуализации и структурирования данных работали крупнейшие ученые (достаточно вспомнить Аристотеля, ведь логика — это одна из систем визуализации рассуждений). Рассматривая технологии работы с текстами, мы уже уделили немалое внимание проблеме структурирования данных, но позволим себе еще раз вернуться к этой проблеме.

Как часто случается, что после тщетных размышлений над некоторой проблемой в прыгающем на колдобинах ГАЗике, садишься за стол, берешь бумагу, карандаш и... все сложное становится простым (правда, иногда случается и обратное!). И не потому, что в условиях тряски нейроны, вынужденные цепляться своими дендритами, аксонами и синапсами друг за дружку, забывают о своем высоком предназначении (лишь бы не рассыпалась пресловутая нейронная сеть).

Дело в том, что оперировать знаками легче, когда они наблюдаемы, а не роятся в голове вперемешку с мыслями об удержании в себе содержимого желудка. Причем способ наблюдения несущественен: например, еще одним приемом «визуализации» является

проговаривание цепочки рассуждений. Дети часто пользуются этим приемом, более того,

использовать его рекомендуют и психологи, но мы-то умные, да взрослые, и позволяем себе такое только в одиночестве или в состоянии, когда уже впору идти на прием к доктору.

Проворачивать в голове сложные многосвязные структуры знаковой природы очень сложно, а без них, увы, вся логика повисает в воздухе. Знаки же человек привык воспринимать либо с помощью зрения, либо с помощью слуха — вот и вся разгадка (кто на что учился, как принято говорить).

Разберемся с тем, что наизобретали умнейшие... Итак: рисунки и иероглифика,

письменность, формальные знаковые системы, таблицы, матрицы, графики, плоскостные развертки, сечения и аксонометрические проекции многомерных графиков, графы, сети,

диаграммы, многомерные таблицы и массивы, сетчатые рельефы, псевдотрехмерные текстурные рельефы, виртуальная реальность... Внушительный перечень, но... неполный — одних диаграмм можно насчитать массу разновидностей, не говоря уже о прочих способах визуализации данных.

Собственно, в ряде приложений визуализация данных является одним из эффективных способов упорядочения — зачем проводить сортировку неупорядоченных пар данных, если они могут быть непосредственно нанесены на график и считаны с приемлемой точностью? Более того: таким способом часто восстанавливаются и пропущенные измерения. Другой пример — использование сечений на трехмерной модели рельефа позволяет легко установить зону затопления в весенний паводок, в то время как обсчитать такую модель очень непросто.

Короче говоря, что хорошо аналитику, то программисту — чистая мука. Работа с графикой — одна из тех отраслей, в которой приходится помнить высшую математику с аналитической геометрией, чего не требуется при разработке большинства прикладных программ. По этой причине на рынке программного обеспечения для разработчиков программного обеспечения большой популярностью пользуются библиотеки подпрограмм и программных компонентов, предназначенных для решения задач отображения данных в графическом режиме. Например, на специализированном Интернет-сайте ComponentSource

(США, http://www.componentsource.com), где размещаются сведения о коммерчески распространяемых библиотеках подпрограмм и программных компонентах, прошедших тестирование и допущенных к применению в проектах федерального уровня, компоненты подобного сорта, обладающие мощными возможностями — хотя и не редкость, но и стоят недешево (особенно это заметно по стоимости лицензий для использования в ГСТК Интернет).

Если же в вашей организации нет штатных программистов, а заказное программное обеспечение для вас слишком дорого, то на рынке программного обеспечения сегодня присутствует масса программных продуктов, приспособленных для решения задач отображения данных, а также задач разработки и отображения деловой графики. Рассмотрим стандартные возможности некоторой гипотетически доступной потребителю системы такого сорта:

-наличие непосредственной связи с базами данных или возможности выполнения разовых процедур импорта данных из формата хранения наиболее известных баз данных и табличных редакторов;

-наличие возможности редактирования и/или просмотра в табличном режиме данных, поступающих из подключенной базы данных, введенных в ручном режиме или импортированных извне;

-возможность выбора типа диаграммы или графика, используемого для отображения данных, настройки цветов линий и плоскостей на графике (диаграмме и т. п.), ориентации и пределов измерений шкал (координатных осей), подписей и т. д.;

-возможность манипуляции шкалами: нормирование отображаемых величин,

установление масштаба отображения, изменение закона распределения делений на шкалах

(линейный, экспоненциальный и т. п.);

-возможность вывода на печать и экспорта в другие программы и сохранения в иных форматах представления графики, нежели фирменный;

-возможность считывания данных, соответствующих указанной на теле графического объекта точке (ближайших или интерполированных).

Этому перечню требований на сегодня соответствует большинство подсистем отображения данных, реализованных в средах математического моделирования (MathCAD, MathLab и др.), табличных редакторах (Lotus Notes/Domino, Microsoft Excel и др.), а также в ряде других профессионально исполненных программных продуктов, предназначенных для работы с числовыми или структурированными данными. Довольно часто создатели программного обеспечения используют для решения проблемы отображения данных прием сохранения результатов обработки в формате обеспечивающем возможность их последующего просмотра с применением подсистемы отображения данных наиболее распространенных программных продуктов.

Одной из основных проблем, существующей в ИАР, является сам процесс синтеза модели, так и не получивший технологического обеспечения. До сего момента наиболее весомым достижением в этой сфере стало создание средств визуального моделирования объектов, процессов и отношений (эти технологии получили название WYSIWYG, от фразы

what-you-see-is-what-you- get — что видишь, то и получаешь). Благодаря этой технологии инструментарий аналитика составили средства, предоставляющие наборы конструктивных элементов, располагающих совместимыми интерфейсами. Их комбинирование позволяет достаточно легко построить логико-графическую интерпретацию модели. Применение средств визуального моделирования и проектирования на первичном этапе формализации положительно сказывается на процессе моделирования, так как оно:

-стимулирует мыслительные усилия эксперта-аналитика за счет придания абстрактному мыслительному процессу наглядной формы;

-способствует формированию и развитию системного мышления;

-способствует проявлению скрытых логических конфликтов, а также логической неполноты модели (системы умолчаний эксперта);

-позволяет создать основу для развития модели, дальнейшей формализации отношений, перехода от качественных показателей к количественным — к аналитическим методам моделирования;

-позволяет за счет протоколирования процесса построения модели осуществлять обучение системы моделирования, а также адаптировать ее интерфейс к конкретному пользователю, его аналитическим приемам;

-способствует развитию методологии моделирования, поскольку протоколирование процесса синтеза модели позволяет перейти на уровень металогики модели, т. е.

анализировать процесс анализа или моделировать процесс моделирования.

Особого упоминания здесь заслуживают системы протоколирования рассуждений,

позволяющие отображать в виде графических и логико-лингвистических моделей сценарии и алгоритмы различных процессов, рассуждений экспертов, классификации и иные виды моделей, использующих графические методы отображения связей. Операции, выполняемые с их применением, часто называют майнд-мэппингом (от англ. mind mapping —

картографирование мышления). Вообще-то, в русском языке для именования результата работы систем такого типа есть название: «функциональная схема (диаграмма)», но из-за того, что отечественные программные продукты этого класса на рынке практически не представлены, то термин уже изрядно потеснен, если не вытеснен вовсе.

Те, кому уже доводилось решать подобные задачи, знают, сколько времени уходит на разработку с помощью примитивных компьютерных средств, не приспособленных для таких работ, графического представления мало-мальски серьезной классификации. Майнд-

мэпперы же практически всю графическую работу берут на себя, заботясь, в том числе, и о размещении элементов на полученной диаграмме. К числу систем этого класса могут быть отнесены: система MindMapper (SimTech, США, http://www.mindmapper.com/), Microsoft

Project (Microsoft, США, http://www.microsoft.com/) и другие. Экономия времени от применения подобных программных продуктов даже на относительно простых функциональных схемах (порядка 20 блоков) может составлять около часа на одну схему.

Кроме того, следует учесть, что многие системы протоколирования рассуждений прекрасно стыкуются с базами данных и табличными редакторами, способны экспортировать данные в формат языков гипертекстовой разметки, например, XML, что делает эти средства еще и незаменимым инструментом управления проектами и создания действующих макетов баз знаний.

Использование систем майнд-мэппинга для протоколирования мозговых штурмов,

сеансов извлечения знаний при создании экспертных систем делает их незаменимым инструментом информационной работы. Кроме того, средства протоколирования рассуждений часто реализуются в многопользовательском режиме и выступают в качестве подсистемы в автоматизированных системах, служащих для коллективной разработки управленческих и проектных решений, а также программного обеспечения. Многие системы этого типа позволяют строить линейные планы-графики Г. Гантта (диаграммы Гантта), а

также циклические и сетевые планы-графики, широко используемые в управлении, позволяя решать не только задачи графического отображения, но и производить вычисления затрачиваемых ресурсов и времени, а также решать примитивные оптимизационные задачи.

Существует также и еще один класс программного обеспечения по своей идеологии близкого к системам майнд-мэппинга: это системы презентационной графики, но по этапу применения они ближе к завершению цикла ИАР и могут быть отнесены к классу систем отображения результатов ИАР. Поэтому к их рассмотрению мы обратимся позже.

3.9.6 Системы гибридного интеллекта

Если рассматривать системы гибридного интеллекта в самом общем виде, то можно сказать, что системы гибридного интеллекта представляют собой сложный, скорее даже,

социальный феномен, возникающий при коллективном ведении интеллектуальной работы.

Соответственно, любая организационная система, осуществляющая ИАР, со всеми основаниями может быть названа системой гибридного интеллекта.

По определению В.Ф. Венды , «гибридный интеллект — это механизм совместного прогнозирования живых систем в процессе опережающей взаимной многоуровневой адаптации с внешней средой, отличающийся тем, что каждая участвующая система располагает частной, фрагментарной, неполной информацией о динамике внешней среды, а

совместно они синтезируют адекватную интегральную модель внешней среды и прогноз

процесса взаимной адаптации со средой». Определение, безусловно, мощное, но почему бы тогда этот феномен не назвать иначе — коллективный интеллект?

Ответ прост: для конкретного приложения — для ИАР это определение нуждается в уточнении… Коль скоро понятие системы гибридного интеллекта охватывает феномен коллективной работы по анализу и обработке информации, то рассматривая системы гибридного интеллекта, следует уделить внимание и технологической компоненте ИАР, в

частности — ее инструментальной подсистеме. Ведь сегодня для коллективного ведения ИАР широко используются средства телекоммуникационных сетей, различные инструментальные системы (те же майнд-мэпперы, наконец). Эти системы, подобно живым организмам, являются не только носителями информации, но и средствами ее интерпретации.

Собственно, и сам В. Венда ввел понятие систем гибридного интеллекта применительно к эргатическим (человеко-машинным) системам (например, комплексам управления атомными электростанциями и т. п.), но предпочел дать более общее определение. Мы же не можем довольствоваться общим определением — любая система, в

которой ведется ИАР, очень чувствительна к качеству инструментального обеспечения,

которое определяет виды и параметры информационных взаимодействий в системе, а значит,

определяет и свойства системы в целом.

Одной из центральных проблем, осложняющих ведение ИАР, является отсутствие коммуникаций между экспертами. Увы, построение даже самой совершенной телекоммуникационной системы этой проблемы не решает.

Человек часто остается один на один с проблемой — даже тогда, когда сидит в комнате, переполненной людьми. Коммуникация в системе ИАР — это, прежде всего,

совместный творческий акт, а не возможность такового. Попробуем пояснить эту мысль...

Дело в том, что при общении наличие вопроса не всегда является побудительной причиной акта коммуникации (на момент инициации акта коммуникации вопрос может и не существовать, быть неосознанным). В ходе совместной ИАР вопрос часто становится следствием коммуникации. Осознанная же потребность в коммуникации (мне нужен совет Петровича) при ведении ИАР — это уже «почти ответ» на вопрос, так как вопрос является способом реализации активной стратегии добывания знаний, а отсутствие результата беседы с «Петровичем» способно повлечь за первым актом коммуникации и последующие. По этой причине неинтеллектуальная телекоммуникационная среда может повысить эффективность ИАР лишь в части, касающейся активных стратегий добывания знания.

А как быть с неосознанными, не сформулированными или еще не возникшими вопросами? Существуют ли пассивные стратегии добывания знаний? — Если считать, что

ожидание новых данных — это стратегия, то, пожалуй, существуют. Сосредоточенное ожидание новых данных — это тоже вопрос, но вопрос «самого общего плана». В таком вопросе еще нет самого вопросительного слова — ни «что», ни «где», ни «когда».

Увы, очень часто вопрос, не спровоцированный внешними обстоятельствами, в

принципе не может быть сформулирован на этапе ИАР. Это означает, что в неявном виде он переходит и в конечную информационную продукцию аналитика. В результате за рамками внимания руководителя остаются, возможно, наиболее существенные аспекты проблемы...

Какие механизмы выявления «незаданных вопросов» известны человеку? — Один из методов борьбы с такими «незаданными вопросами» — это диалог. Диалог — это эффективный способ «визуализации» системы рассуждений и сопоставления их с другой моделью мира.

Деятельность же аналитика «монологична» — в большинстве случаев аргументы и контраргументы формулируются им самим. При логическом анализе активно используется

«более молодая» вторая сигнальная система, устойчивость функционирования которой намного ниже, нежели у первой сигнальной системы, опирающейся на рефлексы. Поэтому сам процесс ИАР обладает слабой устойчивостью по отношению к нерегулярным внешним раздражителям (тому, что не может быть «подавлено» на уровне автоматизма). Для многих,

если не для большинства аналитиков при ведении напряженной аналитической работы даже поступление новой (а иногда и релевантной потребностям аналитика) информации может явиться тем раздражителем, который способен снизить его работоспособность.

Соответственно, возникает противоречие между потребностью в диалоге

(раздражителе) и потребностью в изоляции от раздражителей. И вот тут, похоже, начинает проясняться суть проблемы: видимо, надо рассмотреть какие типы и режимы проявления раздражителей могут восприниматься как желательные, учредить некий регламент общения,

а уж далее попытаться подчинить ему всю систему ведения диалога.

Деятельность человека подчиняется так называемому «закону колоколообразных кривых» (их вид показан на рисунке 12). Смысл этого закона заключается в том, что любое изменение ситуации приводит к временному снижению эффективности в результате возникновения дезадаптационного стресса.

Рисунок 12 — Иллюстрация закона колоколообразных кривых

Если рассматривать, например, процесс внедрения новой техники, программного обеспечения, призванных повысить эффективность решения тех или иных задач, то на протяжении некоторого времени, требующегося для адаптации, система снижает свою эффективность и процесс наращивания эффективности происходит с некоторой задержкой.

Когда степень новизны слишком высока, то система после такого стресса может и не вернуться к прежним показателям эффективности (это происходит, когда исходный тезаурус принципиально несовместим с новым и не позволяет системе приспособиться к происшедшим изменениям). Но в целом, если последнее замечание учтено и преемственность тезауруса соблюдена, процесс роста эффективности системы подчиняется закону S-кривых. Аналогичные явления наблюдаются и в момент смены обстановки или появления новой информации.

Однако порог возникновения дезадаптационного стресса может быть повышен за счет специальных мероприятий. Отрицательный эффект от появления новых данных может быть снижен при выполнении следующих условий :

-данные релевантны текущим информационным потребностям аналитика;

-момент появления данных предсказуем;

-проблема интеллектуальной изолированности аналитика преодолена благодаря наличию мощной телекоммуникационной компоненты, обеспечивающей возможность получения доступа к дополнительным информационным массивам и консультаций коллег.

Обеспечить эти условия можно только при условии, что телекоммуникационная среда является «интеллектуальной», то есть, способна отслеживать текущие информационные потребности аналитика. Такая среда должна, по возможности, протоколировать логику рассуждений аналитика по некоторым внешним проявлениям и в фоновом режиме осуществлять поиск и отбор аргументов и контраргументов, потребность в которых еще только назревает.

Соседние файлы в папке из электронной библиотеки