Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информационное обеспечение государственного управления - Никитов В. А

..pdf
Скачиваний:
203
Добавлен:
24.05.2014
Размер:
14.79 Mб
Скачать

Показатели из базы данных задаются специальным перечнем

— системным каталогом; каждый показатель, описанный в нем, имеет уникальный идентификатор и наименование.

Показатели часто не имеют структуры и поэтому определя­ ются только своими идентификационными номерами. Структу­ рированные показатели устроены точно так же, как и объекты. На множестве значений их идентификаторов тоже могут зада­ ваться структуры, определяющие вхождение и агрегацию^, а так­ же разрезы, выделяющие подмножества показателей и объектов соответственно.

Таким образом, совокупность социально-экономической ин­ формации любой сложности структурно можно свести к опреде­ ленному набору минимальных семантических единиц — показа­ телей. Социально-экономический показатель представляет собой контролируемый параметр объекта управления и состоит из ос­ нования (наименования и характеристических признаков) показа­ теля и значения.

Иными словами, каждый показатель характеризуется набором признаков, необходимых и достаточных для его идентификации. Минимальный их состав включает:

идентификаторы объекта (что считается), субъекта (кто выполняет расчет);

используемых процессов (что делается с объектом); признаки места (где выполняется расчет); времени (когда вьшолняется процесс);

функции управления (для чего используется показатель); способа расчета (как считается); единицы измерения реквизита — основания показателя.

Совокупность социально-экономических показателей с еди­ ным смысловым содержанием объединяется в однородные груп­ пы, которые характеризуются одинаковым составом описыва­ емых объектов и своим функциональным назначением.

Кроме показателей и объектов, информация по которым не­ посредственно хранится в базе данных, есть вычисляемые показа­ тели и вычисляемые объекты — группировки. Способы их полу­ чения задаются формулами, с использованием базовых понятий модели.

Основными в модели информационных ресурсов ИКС явля­ ются:

отношения вхождения, определяющие подчиненность одного объекта другому, один показатель как часть или подвид другого;

^Агрегация — в моделях данных вид абстракции, когда программа рассмат­ ривается как сложная система, представляющая совокупность конечного числа агрегатов, взаимодействие между которыми удовлетворяет ряду предположений.

280

отношение агрегации, позволяющее получать значение свод­ ного показателя как сумму других показателей;

разрезы, задающие совокупности стандартных группировок на множестве объектов.

Введенные понятия — это то средство, с помощью которого пользователь выбирает нужную ему информацию и способы ее обработки. Это определение задается на языке запросов — путем указания требуемых показателей, объектов, периодов и харак­ теристик обработки в соответствующих меню^ и явного задания формул и группировок.

Функциональные возможности обработки информационных ре­ сурсов ИКС предусматривают:

получение группировок объектов по качественным и количест­ венным признакам с расчетом сводных показателей по группам и статистических характеристик групп;

получение производных показателей по формулам, заданным пользователем;

расчет показателей анализа рядов динамики и статистических характеристик динамики изменения показателей;

решение информационно-аналитических задач.

Состав показателей, круг наблюдаемых объектов, методоло­ гия и алгоритмы расчетов показателей изменяются в зависимос­ ти от потребностей в получении информации о социально-эконо­ мических процессах в условиях меняющейся экономики России и содержатся в системном каталоге показателей.

Гипертекст как информационная технология ИКС

Ориентированная на информационное обслуживание широко­ го круга проблем ИТКС должна позволять пользователю об­ рабатывать все менее формальную, все более слабо структуриро­ ванную информацию. Гипертекстовые системы способны обра­ батывать (анализировать) информацию, практически не подвергшуюся никакой предварительной формализации.

Априорная структуризация информации полезна и необходи­ ма, если речь идет об информационном обеспечении определен­ ных устойчивых видов и форм деятельности, функций и задач, в условиях, когда предварительно могут быть определены виды требующихся данных. В этих случаях информация дается только об объектах, выделенных как значимые для определенной де-

^Меню (menu) — список вариантов (режимов, команд, ответов и т. п.), выведенных на экране дисплея и предлагаемых пользователю для выбора. Вы­ бранный вариант определяет следующее действие системы.

281

ятельности, а из всего многообразия связей каждого объекта и явления отбираются лишь некоторые, заранее признанные су­ щественными.

Однако априорная структуризация информации не обес­ печивает в достаточной степени поддержку процессов принятия сложных решений, и пользователь заранее не знает, что может оказаться особо значимым, ему требуется информация о многообразии аспектов и связей в интересующей его про­ блеме.

Особенность гипертекстовой технологии как средства инфор­ мационного обеспечения в том, что она делает доступной для пользователя информацию, которая заранее не структурирована в соответствии с какими-либо формами входных и выходных документов, рубрикаторами и классификаторами. Эти системы, накапливая информацию, не подгоняют ее под некоторую струк­ туру данных. Добавляемая информация представляется просто как новый узел гипертекстовой сети, для которого указываются семантические связи с уже имеющимися узлами.

Чтобы естественный процесс чтения не нарушался, любой фрагмент, выбранный в качестве продолжения читаемого текста, должен предъявляться аналитику практически мгновенно, как это происходит при перелистывании страницы в книге. Ясно, что бумажная форма существования текста не предоставляет таких возможностей. Гипертекст может существовать только в тех­ нически сложной среде, способной обеспечить необходимую быс­ троту предъявления выбираемых фрагментов. Такой средой в ЙТКС является информационно-коммуникационная сеть. Представление семантического материала в гипертекстовой фор­ ме, его чтение и анализ не могут занять сколько-нибудь значи­ тельного места в социальной практике без широко доступных инструментальных средств, обеспечиваюпщх поддержку связей. Гипертекст неотделим от них так же, как книга в современном представлении неотделима от книгопечатания. Поэтому гипер­ текстом часто называют как саму форму организации текстового материала (нелинейную, сетевую), так и технологию, без которой невозможна такая организация материала в широких масштабах.

Липп> при определенном уровне компьютерных инструмен­ тальных средств чтение гипертекста, то есть освоение материала, представленного в виде сложной сети связей между текстовыми фрагментами, становится почти столь же доступным, как и чте­ ние линейного текста. Точно так же и составление гипертекста (в частности, установление, проверка, согласованное изменение многочисленных связей) становится настолько простым, что ока­ зывается возможным создавать гипертексты для себя, то есть представлять в виде сети связей именно те факты, наблюдения,

282

выводы, идеи и т. п., которые являются объектом внимания какого-нибудь специалиста или коллектива.

Гипертекстовая система должна позволять без особого труда добавлять в соответствующим образом организованную систему хранения информации новые текстовые единицы, указывая их связи с уже имеющимися в базе.

Гипертекстовое пространство

Обычный текст мы воспринимаем как некое единое, непре­ рывное образование, состоящее из символов и пробелов. Он может члениться на разделы или даже состоять из независимых по отношению друг к другу текстов, обладать более или менее нелинейным характером (в смысле насьпценности ссылками и возможности отклоняться от единого маршрута чтения), но как единая совокупность символов и пробелов он непрерывен (кон­ тинуален).

Гипертекст же не обладает континуальностью, он принципи­ ально дискретен. Пользователь не видит и не осознает его как непрерывное целое и с самого начала имеет дело с фрагментами. Здесь первичны именно текстовые фрагменты, а не текст как целое. Они не расположены (для читателя) в одном физическом (геометрическом) пространстве. И когда читатель переходит от одного фрагмента к другому, он не движется по непрерывному пространству текста (как при обращении с линейным текстом).

Гипертекст как среда обработки неструктурированной информации

Продолжая характеристику гипертекста, надо подчеркнуть, что это компьютеризованный нелинейный текст, представляюпщй собой единство двух сторон — смысловой и технической. Его особенность как информационной технологии в том, что он вводит в практику новые способы организации информации, когда последняя предстает как открытая, динамично расши­ ряемая сеть связей и доступ к информации осуществляется путем перемещения по связям и выявления в сети различных подструктур.

На место поиска информации через ее соответствие поисково­ му образу гипертекстовая технология ставит движение от извест­ ной информации к связанной с нею неизвестной с помощью соответствуюпщх указателей, что дает пользователю возмож­ ность относительно легко отыскать интересующую информацию

283

без изучения запросного языка, работать с неформализованной или плохо структурированной информацией большого объема. Это средство охвата различных аспектов проблемы, идей и фак­ тов, накапливаемых и представляемых в их взаимосвязи, незави­ симо от какой-либо априорной позиции.

Серьезное преимущество гипертекстовых систем в том, что они позволяют пользователю ИКС, интересующемуся оп­ ределенной предметной областью, не подлаживаться под заранее кем-то представленную структуру этой предметной области.

Развитие технологии гипертекста

Связи в обычной базе данных организованы так, чтобы обес­ печить доступ по запросам, то есть они носят функциональный, служебный, вторичный характер по отношению к данным. В ги­ пертекстовых базах данных дело обстоит иначе, здесь связи сами по себе представляют огромную важность для пользователя. Развитые гипертекстовые системы включают инструментальные средства, позволяющие формировать и исследовать гипертекст в интерактивном режиме одновременно многим участникам кол­ лективной работы.

В последнее время мы наблюдаем интенсивное развитие ряда новых направлений в технологии гипертекста, среди них:

полуавтоматическая и автоматическая генерация гипертексто­ вой базы данных на основе лингвистического анализа текстов и различных правил установления связей;

осуществление различного рода процедур над структурой ги­ пертекстовой сети, придание этим процедурам и их результатам семантической интерпретации.

В рамках структурного анализа гипертекстов вместо "поша­ гового" перемещения от узла к узлу в сети выделяют целые участки, представляющие интерес именно как нечто целое для предметной области. Они не заложены, не вставлены в гипер­ текст заранее (по отношению к динамичным гипертекстам это и невозможно сделать). И специалисты говорят в этом случае о формировании "виртуальных структур".

Наиболее интересны подсети, выделяемые из гипертекста по чисто структурным критериям, например подсеть из узлов, об­ ладающих наибольшим количеством связей. Еще более перспек­ тивно, на наш взгляд, выделение в гипертексте в качестве некото­ рых целостных структур цепочек (путей), образующих связные линейные тексты. В рамках этого технологического направления можно отметить так называемую алгоритмическую навигацию,

284

то есть перемещение по сети текстовых фрагментов, определя­ емое различными правилами, сформулированными в терминах теории графов^.

Могут быть сформулированы наборы правил, обеспечиваю­ щие "хорошие" смысловые свойства цепочек текстовых фрагмен­ тов, выделяемых в гипертекстовой сети. Например, достигается такое свойство: каждый очередной фрагмент этой цепочки тесно примыкает по содержанию к предшествующим, продолжает и развивает их. Такого рода цепочки (их обычно называют "пути") имеют различную интерпретацию с точки зрения анали­ тика. Выявление, так сказать, магистральных для пользователя путей занимает важное место в гипертекстовой поддержке раз­ личных видов интеллектуальной деятельности.

Логическая структура гипертекста

Наиболее характерная черта гипертекста состоит в том, что образующий его текстовой материал не выстроен, подобно обыч­ ному тексту, в единую линейную последовательность, а органи­ зован более сложным образом. Это, как отмечалось выше, текст с нелинейной структурой, элементами которой выступают обыч­ ные линейные, то есть читаемые подряд, тексты (или фрагменты текстов). Нелинейность означает, что после прочтения каждого из фрагментов текст как бы ветвится: для дальнейшего чтения пользователю предлагаются на выбор несколько возможных продолжений.

В линейном тексте, читаемом подряд, нет необходимости специально указывать, что после прочитанного фрагмента (раз­ дела и т. п.) надо читать непосредственно примыкающий к нему следующий фрагмент. Другими словами, линейный текст в прин­ ципе непрерывен, он не предполагает остановки в чтении для выбора следующего фрагмента. Но если возможны вариан­ ты продолжения читаемого материала, то текст становится в принципе дискретным, расчлененным на некоторые кванты или фрагменты, внутри которых текст читается подряд. Границей каждого такого фрагмента является место, где пользователь делает выбор в отношении дальнейшего маршрута чтения (место ветвления).

^Теория графов — раздел математики, изучающий графы и те их обобщения (транспортные сети, гиперграфы и т. п.), на которые распространяются некоторые из основных понятий и методов, относящихся к графам.

285

Структурные элементы гипертекста

Элементами гипертекста в ИКС могут быть письменные тек­ сты любого объема — документы, обзоры, монографии, статьи либо их фрагменты. Становясь элементами гипертекста, все эти отдельные тексты входят в некоторую суперструктуру, образуют некоторую единую систему.

В традиционном тексте его отдельные структурные элементы (разделы, абзацы) также образуют некоторую единую систему. Но это система, в которой элементы жестко упорядочены с точки зрения последовательности их чтения. Они, как правило, не суще­ ствовали до данного текста и возникают как части его, неся на себе отпечаток несамостоятельности, подчиненности единому за­ мыслу и целостности текста.

Элементы же гипертекста — достаточно автономные образо­ вания, которые существовали или во всяком случае могут сущес­ твовать вне его. Благодаря этой автономности они могут вклю­ чаться в разные смысловые ряды, читаться в разной последова­ тельности, что и обеспечивает гипертексту возможность различной семантической интерпретации.

Отсутствие в гипертексте иерархической организации

Линейный текст предельно иерархичен: в нем априорно задан единственно возможный порядок следования элементов тексто­ вого материала, нелинейность же означает преодоление иера­ рхичности, возрастание свободы в выборе маршрутов чтения. На практике часто создаются гипертексты, которые могут от­ ражать иерархическую структуру, существующие в любом струк­ турированном тексте (документе) связи между документом в це­ лом и его разделами, между разделом в целом и его элементами и т. п.

Выше гипертекст был охарактеризован как ветвящийся пото­ му, что от каждого фрагмента можно переходить не к одному, а к нескольким другим. Однако и здесь может встречаться до­ вольно жесткая иерархическая структура. Такой текст, например, может иметь вид основанной на дихотомии классификации. Сис­ тема переходов между фрагментами организуется в этом случае в форме "дерева", другие переходы между теми фрагментами, к которым можно перейти от данного фрагмента, исключаются. Такого рода ограничения уменьшают общее число возможных маршрутов чтения, снижают нелинейность текста, задают оп­ ределенные направления чтения. Конечно, мы и в таком варианте

286

имеем дело с гипертекстом, но при этом свойства его выражены слабее.

Если система документов упорядочена в соответствии с неко­ торым рубрикатором, также возникает возможность отразить эту иерархию в структуре гипертекста и осуществлять переходы от рубрики к подрубрике, от нижней подрубрики — к соответ­ ствующему документу. Однако при этом очень неполно исполь­ зуются возможности гипертекста осуществлять самые разнооб­ разные переходы, не только иерархические, но и основанные на перекрестных ссылках, на тематической близости и т. д. Если гипертекст строится на такого рода связях, его организация уже не характеризуется какой-либо иерархической структурой.

Гипертекстовая сеть как отображение структуры смыслового пространства

Сеть как топологическое образование способна достаточно адекватно отображать структуру именно смыслового, семанти­ ческого пространства, взаимосвязанность, относительную бли­ зость, непосредственный или опосредованный характер связи "объектов" в этом пространстве (смыслов, элементов содержа­ ния).

Для описания и анализа систем, в которых основным отноше­ нием выступает смежность (непосредственная связь) элементов, есть строгий, хорошо проработанный аппарат — упоминавшаяся уже теория графов, которая позволяет наиболее точным и адек­ ватным образом описывать все структурные свойства и структур­ ные элементы гипертекстового пространства.

Поскольку речь идет об описании смыслового пространства, эти и значительно более сложные подструктуры получают естест­ венную семантическую интерпретацию. Так, какие-то участки и элементы пространства гипертекста, выделяемые по чисто структурным критериям, могут трактоваться как "смысловой центр" или как "смысловая периферия" представленного содер­ жания, как области повышенной или пониженной смысловой связности и т. п.

Иногда, в целях лучшей ориентации в гипертекстовой сети, ей придают более укрупненную, обобщенную структуру, и тогда определенные участки сети трактуются как целостные образова­ ния, между которыми устанавливаются переходы, что и между отдельными узлами. Способность создавать композитные или составные узлы позволяет обращаться с группой узлов как с еди­ ным узлом.

287

Навигация в пространстве гипертекста

Навигация в гипертекстовой сети — это совершаемые в про­ цессе чтения гипертекста переходы от одного фрагмента к дру­ гому. Она предполагает прежде всего ориентирование. Имея перед собой фрагмент или, как принято говорить, находясь в некотором узле гипертекста, пользователь должен представить себе его положение относительно других узлов. Ориентирование может быть глобальным и локальным. В первом случае поль­ зователю предъявляют графический образ сети или ее укрупнен­ ную структуру, наглядно демонстрирующую положение данного узла. При локальном ориентировании читатель просматривает и оценивает информацию об окрестности данного узла, то есть о содержании текстов, к которым можно перейти из данного фрагмента.

В ИКС необходимо предусмотреть разные способы предъяв­ ления информации о содержании смежных узлов (выделение в тексте узла соответствующих слов, вызов на экран оглавления или начальных частей смежных фрагментов). На основе ориен­ тирования пользователь выбирает один из смежных узлов и пе­ реходит к нему (вызывает соответствующий фрагмент для чте­ ния). Навигация состоит в последовательности таких переходов. При этом пользователь как бы перемещается в сети от узла к узлу. Последовательности читаемых фрагментов соответствует некоторая цепочка соединенных связями узлов. Каждая такая цепочка — одна из множества возможных, один из маршрутов в пространстве гипертекстовой сети.

Система перехода между структурными элементами гипертекста

Структурные элементы гипертекста можно читать в разном порядке, следуя смысловым связям и соответственно матери­ ализованным возможностям перехода между текстами. Система переходов в гипертексте — это, с одной стороны, смысловая структура, система смысловых взаимосвязей соответствующих текстов (фрагментов). С другой — это структура, в которой каждой смысловой связи соответствует технически обусловлен­ ная возможность перейти от текста к тексту, то есть непосред­ ственно вызвать для чтения текст, связанный с читаемым в дан­ ный момент. Создание гипертекста — это прежде всего фор­ мирование такой системы переходов. Когда аналитик приступает к чтению, он имеет дело с некоторой наличной структурой гипер­ текста. В процессе чтения он может совершить переход от какого-

288

либо фрагмента не к любому другому, а лишь к некоторым, для которых эта возможность создана при формировании гипертек­ ста. Возможность перехода вызывается в тех случаях, когда фрагменты связаны по содержанию.

Характер этой связи различный: переход может быть между текстом и комментарием к нему, между разными редакциями текста, между текстом и его возможными продолжениями, меж­ ду текстами, отвечающими или возражающими друг другу, меж­ ду текстами, пересекающимися по содержанию, перекликающи­ мися или созвучными.

Итак, гипертекст — это не просто система смысловых связей между текстами (словесно выраженными мыслями), а соединение системы таких связей с технически обеспеченной возможностью перехода по ним от текста к тексту.

Поиск информационных ресурсов на Web-сервере

Одним из способов априорного обнаружения в Web-сервере релевантных^ документов является запуск Web-агента. Такая программа получает предписание пользователя, после чего сис­ тематически исследует Web-серверы ИКЦ, находя документы, оценивая их релевантность, и возвращает пользователю ранжи­ рованный список документов.

Для эффективности поиска обычно используется заранее со­ зданный индекс, периодически формируемый и обновляемый программами-демонами^ Web-сервера. Он представляет собой структуру, в которой можно искать ссылки на документы Webсервера. Такой подход более практичен, на нем основаны многие современные инструменты поиска.

Генерация полного индекса требует систематического обхода Web-узлов и определения местонахождения каждого документа. Гипертекстовая сеть аналогична структуре ориентированного графа, поэтому здесь применимы алгоритмы обхода графа.

Существуют три метода такого обхода:

случайный выбор первого URL-адреса программой-агентом для инициализации поиска, а затем рекурсивный анализ других URL для поиска "преимущественно в ширину" или "преимущест­ венно в глубину";

^Релевантность — смысловое соответствие между запросом, введенным в ин­ формационно-поисковую систему, и списком выданных ею документов.

^Демон базы данных — неясный процесс, инициируемый не по запросу пользователя, а, как правило, вследствие введенного запроса; процедура, автоманачески вызываемая при заранее заданных условиях.

289

Соседние файлы в предмете Экономика