Информационное обеспечение государственного управления - Никитов В. А
..pdfПоказатели из базы данных задаются специальным перечнем
— системным каталогом; каждый показатель, описанный в нем, имеет уникальный идентификатор и наименование.
Показатели часто не имеют структуры и поэтому определя ются только своими идентификационными номерами. Структу рированные показатели устроены точно так же, как и объекты. На множестве значений их идентификаторов тоже могут зада ваться структуры, определяющие вхождение и агрегацию^, а так же разрезы, выделяющие подмножества показателей и объектов соответственно.
Таким образом, совокупность социально-экономической ин формации любой сложности структурно можно свести к опреде ленному набору минимальных семантических единиц — показа телей. Социально-экономический показатель представляет собой контролируемый параметр объекта управления и состоит из ос нования (наименования и характеристических признаков) показа теля и значения.
Иными словами, каждый показатель характеризуется набором признаков, необходимых и достаточных для его идентификации. Минимальный их состав включает:
идентификаторы объекта (что считается), субъекта (кто выполняет расчет);
используемых процессов (что делается с объектом); признаки места (где выполняется расчет); времени (когда вьшолняется процесс);
функции управления (для чего используется показатель); способа расчета (как считается); единицы измерения реквизита — основания показателя.
Совокупность социально-экономических показателей с еди ным смысловым содержанием объединяется в однородные груп пы, которые характеризуются одинаковым составом описыва емых объектов и своим функциональным назначением.
Кроме показателей и объектов, информация по которым не посредственно хранится в базе данных, есть вычисляемые показа тели и вычисляемые объекты — группировки. Способы их полу чения задаются формулами, с использованием базовых понятий модели.
Основными в модели информационных ресурсов ИКС явля ются:
отношения вхождения, определяющие подчиненность одного объекта другому, один показатель как часть или подвид другого;
^Агрегация — в моделях данных вид абстракции, когда программа рассмат ривается как сложная система, представляющая совокупность конечного числа агрегатов, взаимодействие между которыми удовлетворяет ряду предположений.
280
отношение агрегации, позволяющее получать значение свод ного показателя как сумму других показателей;
разрезы, задающие совокупности стандартных группировок на множестве объектов.
Введенные понятия — это то средство, с помощью которого пользователь выбирает нужную ему информацию и способы ее обработки. Это определение задается на языке запросов — путем указания требуемых показателей, объектов, периодов и харак теристик обработки в соответствующих меню^ и явного задания формул и группировок.
Функциональные возможности обработки информационных ре сурсов ИКС предусматривают:
получение группировок объектов по качественным и количест венным признакам с расчетом сводных показателей по группам и статистических характеристик групп;
получение производных показателей по формулам, заданным пользователем;
расчет показателей анализа рядов динамики и статистических характеристик динамики изменения показателей;
решение информационно-аналитических задач.
Состав показателей, круг наблюдаемых объектов, методоло гия и алгоритмы расчетов показателей изменяются в зависимос ти от потребностей в получении информации о социально-эконо мических процессах в условиях меняющейся экономики России и содержатся в системном каталоге показателей.
Гипертекст как информационная технология ИКС
Ориентированная на информационное обслуживание широко го круга проблем ИТКС должна позволять пользователю об рабатывать все менее формальную, все более слабо структуриро ванную информацию. Гипертекстовые системы способны обра батывать (анализировать) информацию, практически не подвергшуюся никакой предварительной формализации.
Априорная структуризация информации полезна и необходи ма, если речь идет об информационном обеспечении определен ных устойчивых видов и форм деятельности, функций и задач, в условиях, когда предварительно могут быть определены виды требующихся данных. В этих случаях информация дается только об объектах, выделенных как значимые для определенной де-
^Меню (menu) — список вариантов (режимов, команд, ответов и т. п.), выведенных на экране дисплея и предлагаемых пользователю для выбора. Вы бранный вариант определяет следующее действие системы.
281
ятельности, а из всего многообразия связей каждого объекта и явления отбираются лишь некоторые, заранее признанные су щественными.
Однако априорная структуризация информации не обес печивает в достаточной степени поддержку процессов принятия сложных решений, и пользователь заранее не знает, что может оказаться особо значимым, ему требуется информация о многообразии аспектов и связей в интересующей его про блеме.
Особенность гипертекстовой технологии как средства инфор мационного обеспечения в том, что она делает доступной для пользователя информацию, которая заранее не структурирована в соответствии с какими-либо формами входных и выходных документов, рубрикаторами и классификаторами. Эти системы, накапливая информацию, не подгоняют ее под некоторую струк туру данных. Добавляемая информация представляется просто как новый узел гипертекстовой сети, для которого указываются семантические связи с уже имеющимися узлами.
Чтобы естественный процесс чтения не нарушался, любой фрагмент, выбранный в качестве продолжения читаемого текста, должен предъявляться аналитику практически мгновенно, как это происходит при перелистывании страницы в книге. Ясно, что бумажная форма существования текста не предоставляет таких возможностей. Гипертекст может существовать только в тех нически сложной среде, способной обеспечить необходимую быс троту предъявления выбираемых фрагментов. Такой средой в ЙТКС является информационно-коммуникационная сеть. Представление семантического материала в гипертекстовой фор ме, его чтение и анализ не могут занять сколько-нибудь значи тельного места в социальной практике без широко доступных инструментальных средств, обеспечиваюпщх поддержку связей. Гипертекст неотделим от них так же, как книга в современном представлении неотделима от книгопечатания. Поэтому гипер текстом часто называют как саму форму организации текстового материала (нелинейную, сетевую), так и технологию, без которой невозможна такая организация материала в широких масштабах.
Липп> при определенном уровне компьютерных инструмен тальных средств чтение гипертекста, то есть освоение материала, представленного в виде сложной сети связей между текстовыми фрагментами, становится почти столь же доступным, как и чте ние линейного текста. Точно так же и составление гипертекста (в частности, установление, проверка, согласованное изменение многочисленных связей) становится настолько простым, что ока зывается возможным создавать гипертексты для себя, то есть представлять в виде сети связей именно те факты, наблюдения,
282
выводы, идеи и т. п., которые являются объектом внимания какого-нибудь специалиста или коллектива.
Гипертекстовая система должна позволять без особого труда добавлять в соответствующим образом организованную систему хранения информации новые текстовые единицы, указывая их связи с уже имеющимися в базе.
Гипертекстовое пространство
Обычный текст мы воспринимаем как некое единое, непре рывное образование, состоящее из символов и пробелов. Он может члениться на разделы или даже состоять из независимых по отношению друг к другу текстов, обладать более или менее нелинейным характером (в смысле насьпценности ссылками и возможности отклоняться от единого маршрута чтения), но как единая совокупность символов и пробелов он непрерывен (кон тинуален).
Гипертекст же не обладает континуальностью, он принципи ально дискретен. Пользователь не видит и не осознает его как непрерывное целое и с самого начала имеет дело с фрагментами. Здесь первичны именно текстовые фрагменты, а не текст как целое. Они не расположены (для читателя) в одном физическом (геометрическом) пространстве. И когда читатель переходит от одного фрагмента к другому, он не движется по непрерывному пространству текста (как при обращении с линейным текстом).
Гипертекст как среда обработки неструктурированной информации
Продолжая характеристику гипертекста, надо подчеркнуть, что это компьютеризованный нелинейный текст, представляюпщй собой единство двух сторон — смысловой и технической. Его особенность как информационной технологии в том, что он вводит в практику новые способы организации информации, когда последняя предстает как открытая, динамично расши ряемая сеть связей и доступ к информации осуществляется путем перемещения по связям и выявления в сети различных подструктур.
На место поиска информации через ее соответствие поисково му образу гипертекстовая технология ставит движение от извест ной информации к связанной с нею неизвестной с помощью соответствуюпщх указателей, что дает пользователю возмож ность относительно легко отыскать интересующую информацию
283
без изучения запросного языка, работать с неформализованной или плохо структурированной информацией большого объема. Это средство охвата различных аспектов проблемы, идей и фак тов, накапливаемых и представляемых в их взаимосвязи, незави симо от какой-либо априорной позиции.
Серьезное преимущество гипертекстовых систем в том, что они позволяют пользователю ИКС, интересующемуся оп ределенной предметной областью, не подлаживаться под заранее кем-то представленную структуру этой предметной области.
Развитие технологии гипертекста
Связи в обычной базе данных организованы так, чтобы обес печить доступ по запросам, то есть они носят функциональный, служебный, вторичный характер по отношению к данным. В ги пертекстовых базах данных дело обстоит иначе, здесь связи сами по себе представляют огромную важность для пользователя. Развитые гипертекстовые системы включают инструментальные средства, позволяющие формировать и исследовать гипертекст в интерактивном режиме одновременно многим участникам кол лективной работы.
В последнее время мы наблюдаем интенсивное развитие ряда новых направлений в технологии гипертекста, среди них:
полуавтоматическая и автоматическая генерация гипертексто вой базы данных на основе лингвистического анализа текстов и различных правил установления связей;
осуществление различного рода процедур над структурой ги пертекстовой сети, придание этим процедурам и их результатам семантической интерпретации.
В рамках структурного анализа гипертекстов вместо "поша гового" перемещения от узла к узлу в сети выделяют целые участки, представляющие интерес именно как нечто целое для предметной области. Они не заложены, не вставлены в гипер текст заранее (по отношению к динамичным гипертекстам это и невозможно сделать). И специалисты говорят в этом случае о формировании "виртуальных структур".
Наиболее интересны подсети, выделяемые из гипертекста по чисто структурным критериям, например подсеть из узлов, об ладающих наибольшим количеством связей. Еще более перспек тивно, на наш взгляд, выделение в гипертексте в качестве некото рых целостных структур цепочек (путей), образующих связные линейные тексты. В рамках этого технологического направления можно отметить так называемую алгоритмическую навигацию,
284
то есть перемещение по сети текстовых фрагментов, определя емое различными правилами, сформулированными в терминах теории графов^.
Могут быть сформулированы наборы правил, обеспечиваю щие "хорошие" смысловые свойства цепочек текстовых фрагмен тов, выделяемых в гипертекстовой сети. Например, достигается такое свойство: каждый очередной фрагмент этой цепочки тесно примыкает по содержанию к предшествующим, продолжает и развивает их. Такого рода цепочки (их обычно называют "пути") имеют различную интерпретацию с точки зрения анали тика. Выявление, так сказать, магистральных для пользователя путей занимает важное место в гипертекстовой поддержке раз личных видов интеллектуальной деятельности.
Логическая структура гипертекста
Наиболее характерная черта гипертекста состоит в том, что образующий его текстовой материал не выстроен, подобно обыч ному тексту, в единую линейную последовательность, а органи зован более сложным образом. Это, как отмечалось выше, текст с нелинейной структурой, элементами которой выступают обыч ные линейные, то есть читаемые подряд, тексты (или фрагменты текстов). Нелинейность означает, что после прочтения каждого из фрагментов текст как бы ветвится: для дальнейшего чтения пользователю предлагаются на выбор несколько возможных продолжений.
В линейном тексте, читаемом подряд, нет необходимости специально указывать, что после прочитанного фрагмента (раз дела и т. п.) надо читать непосредственно примыкающий к нему следующий фрагмент. Другими словами, линейный текст в прин ципе непрерывен, он не предполагает остановки в чтении для выбора следующего фрагмента. Но если возможны вариан ты продолжения читаемого материала, то текст становится в принципе дискретным, расчлененным на некоторые кванты или фрагменты, внутри которых текст читается подряд. Границей каждого такого фрагмента является место, где пользователь делает выбор в отношении дальнейшего маршрута чтения (место ветвления).
^Теория графов — раздел математики, изучающий графы и те их обобщения (транспортные сети, гиперграфы и т. п.), на которые распространяются некоторые из основных понятий и методов, относящихся к графам.
285
Структурные элементы гипертекста
Элементами гипертекста в ИКС могут быть письменные тек сты любого объема — документы, обзоры, монографии, статьи либо их фрагменты. Становясь элементами гипертекста, все эти отдельные тексты входят в некоторую суперструктуру, образуют некоторую единую систему.
В традиционном тексте его отдельные структурные элементы (разделы, абзацы) также образуют некоторую единую систему. Но это система, в которой элементы жестко упорядочены с точки зрения последовательности их чтения. Они, как правило, не суще ствовали до данного текста и возникают как части его, неся на себе отпечаток несамостоятельности, подчиненности единому за мыслу и целостности текста.
Элементы же гипертекста — достаточно автономные образо вания, которые существовали или во всяком случае могут сущес твовать вне его. Благодаря этой автономности они могут вклю чаться в разные смысловые ряды, читаться в разной последова тельности, что и обеспечивает гипертексту возможность различной семантической интерпретации.
Отсутствие в гипертексте иерархической организации
Линейный текст предельно иерархичен: в нем априорно задан единственно возможный порядок следования элементов тексто вого материала, нелинейность же означает преодоление иера рхичности, возрастание свободы в выборе маршрутов чтения. На практике часто создаются гипертексты, которые могут от ражать иерархическую структуру, существующие в любом струк турированном тексте (документе) связи между документом в це лом и его разделами, между разделом в целом и его элементами и т. п.
Выше гипертекст был охарактеризован как ветвящийся пото му, что от каждого фрагмента можно переходить не к одному, а к нескольким другим. Однако и здесь может встречаться до вольно жесткая иерархическая структура. Такой текст, например, может иметь вид основанной на дихотомии классификации. Сис тема переходов между фрагментами организуется в этом случае в форме "дерева", другие переходы между теми фрагментами, к которым можно перейти от данного фрагмента, исключаются. Такого рода ограничения уменьшают общее число возможных маршрутов чтения, снижают нелинейность текста, задают оп ределенные направления чтения. Конечно, мы и в таком варианте
286
имеем дело с гипертекстом, но при этом свойства его выражены слабее.
Если система документов упорядочена в соответствии с неко торым рубрикатором, также возникает возможность отразить эту иерархию в структуре гипертекста и осуществлять переходы от рубрики к подрубрике, от нижней подрубрики — к соответ ствующему документу. Однако при этом очень неполно исполь зуются возможности гипертекста осуществлять самые разнооб разные переходы, не только иерархические, но и основанные на перекрестных ссылках, на тематической близости и т. д. Если гипертекст строится на такого рода связях, его организация уже не характеризуется какой-либо иерархической структурой.
Гипертекстовая сеть как отображение структуры смыслового пространства
Сеть как топологическое образование способна достаточно адекватно отображать структуру именно смыслового, семанти ческого пространства, взаимосвязанность, относительную бли зость, непосредственный или опосредованный характер связи "объектов" в этом пространстве (смыслов, элементов содержа ния).
Для описания и анализа систем, в которых основным отноше нием выступает смежность (непосредственная связь) элементов, есть строгий, хорошо проработанный аппарат — упоминавшаяся уже теория графов, которая позволяет наиболее точным и адек ватным образом описывать все структурные свойства и структур ные элементы гипертекстового пространства.
Поскольку речь идет об описании смыслового пространства, эти и значительно более сложные подструктуры получают естест венную семантическую интерпретацию. Так, какие-то участки и элементы пространства гипертекста, выделяемые по чисто структурным критериям, могут трактоваться как "смысловой центр" или как "смысловая периферия" представленного содер жания, как области повышенной или пониженной смысловой связности и т. п.
Иногда, в целях лучшей ориентации в гипертекстовой сети, ей придают более укрупненную, обобщенную структуру, и тогда определенные участки сети трактуются как целостные образова ния, между которыми устанавливаются переходы, что и между отдельными узлами. Способность создавать композитные или составные узлы позволяет обращаться с группой узлов как с еди ным узлом.
287
Навигация в пространстве гипертекста
Навигация в гипертекстовой сети — это совершаемые в про цессе чтения гипертекста переходы от одного фрагмента к дру гому. Она предполагает прежде всего ориентирование. Имея перед собой фрагмент или, как принято говорить, находясь в некотором узле гипертекста, пользователь должен представить себе его положение относительно других узлов. Ориентирование может быть глобальным и локальным. В первом случае поль зователю предъявляют графический образ сети или ее укрупнен ную структуру, наглядно демонстрирующую положение данного узла. При локальном ориентировании читатель просматривает и оценивает информацию об окрестности данного узла, то есть о содержании текстов, к которым можно перейти из данного фрагмента.
В ИКС необходимо предусмотреть разные способы предъяв ления информации о содержании смежных узлов (выделение в тексте узла соответствующих слов, вызов на экран оглавления или начальных частей смежных фрагментов). На основе ориен тирования пользователь выбирает один из смежных узлов и пе реходит к нему (вызывает соответствующий фрагмент для чте ния). Навигация состоит в последовательности таких переходов. При этом пользователь как бы перемещается в сети от узла к узлу. Последовательности читаемых фрагментов соответствует некоторая цепочка соединенных связями узлов. Каждая такая цепочка — одна из множества возможных, один из маршрутов в пространстве гипертекстовой сети.
Система перехода между структурными элементами гипертекста
Структурные элементы гипертекста можно читать в разном порядке, следуя смысловым связям и соответственно матери ализованным возможностям перехода между текстами. Система переходов в гипертексте — это, с одной стороны, смысловая структура, система смысловых взаимосвязей соответствующих текстов (фрагментов). С другой — это структура, в которой каждой смысловой связи соответствует технически обусловлен ная возможность перейти от текста к тексту, то есть непосред ственно вызвать для чтения текст, связанный с читаемым в дан ный момент. Создание гипертекста — это прежде всего фор мирование такой системы переходов. Когда аналитик приступает к чтению, он имеет дело с некоторой наличной структурой гипер текста. В процессе чтения он может совершить переход от какого-
288
либо фрагмента не к любому другому, а лишь к некоторым, для которых эта возможность создана при формировании гипертек ста. Возможность перехода вызывается в тех случаях, когда фрагменты связаны по содержанию.
Характер этой связи различный: переход может быть между текстом и комментарием к нему, между разными редакциями текста, между текстом и его возможными продолжениями, меж ду текстами, отвечающими или возражающими друг другу, меж ду текстами, пересекающимися по содержанию, перекликающи мися или созвучными.
Итак, гипертекст — это не просто система смысловых связей между текстами (словесно выраженными мыслями), а соединение системы таких связей с технически обеспеченной возможностью перехода по ним от текста к тексту.
Поиск информационных ресурсов на Web-сервере
Одним из способов априорного обнаружения в Web-сервере релевантных^ документов является запуск Web-агента. Такая программа получает предписание пользователя, после чего сис тематически исследует Web-серверы ИКЦ, находя документы, оценивая их релевантность, и возвращает пользователю ранжи рованный список документов.
Для эффективности поиска обычно используется заранее со зданный индекс, периодически формируемый и обновляемый программами-демонами^ Web-сервера. Он представляет собой структуру, в которой можно искать ссылки на документы Webсервера. Такой подход более практичен, на нем основаны многие современные инструменты поиска.
Генерация полного индекса требует систематического обхода Web-узлов и определения местонахождения каждого документа. Гипертекстовая сеть аналогична структуре ориентированного графа, поэтому здесь применимы алгоритмы обхода графа.
Существуют три метода такого обхода:
случайный выбор первого URL-адреса программой-агентом для инициализации поиска, а затем рекурсивный анализ других URL для поиска "преимущественно в ширину" или "преимущест венно в глубину";
^Релевантность — смысловое соответствие между запросом, введенным в ин формационно-поисковую систему, и списком выданных ею документов.
^Демон базы данных — неясный процесс, инициируемый не по запросу пользователя, а, как правило, вследствие введенного запроса; процедура, автоманачески вызываемая при заранее заданных условиях.
289