Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Т4_Гипертекстовые технологии мультимедийных мар...doc
Скачиваний:
22
Добавлен:
17.08.2019
Размер:
397.82 Кб
Скачать

3 Математическая модель гипертекста

Гипертекст - это нелинейно организованный текст, т.е. текст с нелинейной структурой. Обычному (одномерному) тексту, который можно интерпретировать как одну длинную строку символов, читаемую в одном направлении, противопоставлен многомерный текст. В отдельных точках такого ветвящегося многомерного текста чтение можно продолжать в нескольких различных направлениях в зависимости от информационной потребности. Гипертекст может отличаться от обычного текста порядком следования материала, способом его представления. Элементы гипертекста могут размещаться в виде иерархического дерева или сетевой организации, он может иметь несколько уровней краткого изложения и детализации материала и т. д. Тексты, составленные на естественном языке, хранятся, будучи организованными по новому принципу. При этом приходится отказаться от используемых сейчас подходов к подготовке изданий или других документов и перейти к сложной нелинейной форме организации материала. Для пояснения нелинейной формы построения гипертекстовых изданий рассмотрим одну из известных математических моделей гипертекста.

Используем следующие обозначения.

Пусть М и R - конечные непустые множества:

M = {m1, m2,..., mn}; R = {R1, R2,..., Rk}; .

Элементами множеств М и R будем обозначать объекты и отношения между ними соответственно. Тогда гипертекст в наиболее общем виде (Г0 ) описывается как совокупность следующих четырех компонентов:

Г0 = (T, I, S, Q),

где Т - тезаурус гипертекста; I - информационная составляющая гипертекста. Включает в себя содержание информационных статей Ii , в которые помещаются сведения о всех mi М, т.е.

I = i Ii ;

S - алфавитный (или хронологический) словарь всех наименований mi М; Q - список главных тем гипертекста.

Тезаурус гипертекста состоит из тезаурусных статей. Тезаурусная статья может быть представлена в виде

ti = {mi , Ami },

где ti - тезаурусная статья объекта mi ; Ami - множество объектов, с которыми mi связан отношениями из R с указанием типа отношения.

Например, если объект ma связан с другими объектами из множества М отношениями Ri, Rj,..., Re , то

Ama = {Ri(mi1, mi2, ..., mit), Rj(mj1, mj2, ..., mjs),..., Re(me1, me2, ..., mep) },

(mi1, ..., mit) связаны с объектом ma отношением Ri ,

(mj1, ..., mjs) связаны с объектом ma отношением Rj ,

me1, ..., mep) связаны с объектом ma отношением Re .

Здесь существенно отметить, что в Ami содержатся только ближайшие «родственники» для mi .

Всю совокупность тезаурусных статей, т. е. тезаурус гипертекста, можно представить следующим образом:

Т = {m1, m2, ..., mi, ..., mn), Am1, Am2,..., Ami, ..., Amn}.

Тезаурус гипертекста графически можно представить в виде сети, в узлах которой находятся текстовые описания объектов, а ребра сети указывают на существование связи между объектами и позволяют определить тип связи (рис. 2.4).

Наиболее важным компонентом гипертекста Г0 является совокупность гипертекстовых статей Г:

Г = i Гi , Г Г0 ,

где Гi состоит из описания объекта mi (информационная статья Ii ) и перечня родственных объектов (тезаурусная статья ti ):

Гi = (ti , Ii ).

Выдача информации, ввод новых сведений осуществляются, как правило, Гi -порциями.

Для аналитического осмысления и последующей автоматизации процедуры поиска семантических сведений в гипертекстовом массиве необходимо составить математическое описание этой процедуры. Важность задачи подтверждается также тем, что проблема поиска возникает при внесении новой информации в гипертекст. В этом случае необходимо выделить все родственные объекты, чтобы установить необходимые тезаурусные связи.

Для описания процедуры поиска могут применяться следующие модели:

1) поиск ближайшей по составу и содержанию гипертекстовой статьи:

ρ (Гi , Гc ) min,

где ρ - некоторая характеристика близости состава и содержания гипертекстовых статей; Гc - вводимая статья или статья, которую ищут, Гi Г;

2) поиск гипертекстовых статей с наиболее желательными свойствами:

f(Гi ) max,

где f характеризует некоторые желательные свойства, например наличие одинакового родового объекта, Гi Г;

3) комбинированный случай:

f (Гi ) max, ρ (Гi , Гc ) ≤ρ0 ,

где ρ0 - некоторое ограничение, Гi Г.

Последние три соотношения применяются не только при поиске сведений по запросам абонентов, но и для нахождения ранее сформированных статей с целью установления перекрестных ссылок при поступлении в гипертекст новой информации.

Для корректного обновления гипертекста важное значение приобретает определение элементарных операций над тезаурусом. В семиотике используется следующий подход. В обобщенном виде тезаурус представляется как связка двух параметров: (М, А), где А - отображение MR в М, взвешенное отношениями из R. Пусть заданы тезаурусы:

T1 = (M1, A1), T2 = (M2, A2), ..., Tq = (Mq, Aq).

Определение 1. Тезаурус Т = (М, А ) будем называть объединением тезаурусов Ti, где i = 1, ..., q, и обозначать Т = i Ti, если М = i Mi и для mi M Am i Aim.

Пользуясь данным определением, можно осуществить слияние нескольких независимо подготовленных тезаурусов.

Определение 2. Тезаурус Т = (М, A) будем называть пересечением тезаурусов Ti, i =1, ..., q и обозначать Т = i Ti, если М i Mi и для mi M Am i Aim.

Определения 1 и 2 позволяют манипулировать с пересекающимися независимо подготовленными тезаурусами.

Таким образом, структуру гипертекстового издания можно представить в следующем виде (рис. 2.5).