Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Інформаційні системи.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
217.6 Кб
Скачать

Інформаційні системи

© Ю.В. Рогушина, І.Ю.Гришанова, 2005 83

Issn 1727-4907. Проблеми програмування. 2005. № 3

УДК 004.738.52

Ю.В.Рогушина, І.Ю.Гришанова

ПОШУК МУЛЬТИМЕДIЙНИХ ОБ’ЄКТІВ ЗА КОНТЕКСТОМ

ТА МЕТАОПИСАМИ ГІПЕРМЕДІЙНИХ ІНФОРМАЦІЙНИХ РЕСУРСІВ

Аналізуються типи та формати подання мультимедійної інформації, її розташування в гіпермедійних

ресурсах. Розглядаються питання, пов'язані з пошуком мультимедійних об’єктів, поданих в Інтернеті,

на основі аналізу контексту і метаописів інформаційних ресурсів, що містять посилання на такі

об’єкти. Для підвищення релевантності пошуку пропонується порівнювати контекст і метаописи

мультимедійних об’єктів з онтологією предметної області, що цікавить користувача.

Вступ

Значна частина інформаційних ре-

сурсів (ІР), доступ до яких забезпечує

глобальна мережа Інтернету, містить

елементи мультимедіа. Такі ресурси на-

зиваються гіпермедійними. Гіпермедіа –

формат даних, подібний до гіпертексту, у

якому текст, звук, зображення або інші

об'єкти, пов'язані з інформацією, відо-

бражуваною на екрані, може бути виве-

дений на дисплей за допомогою гіпертек-

стового посилання [1]. Пошук мультиме-

дійної інформації являє собою серйозну

теоретичну проблему, яка ускладнюється

різнорідністю представленої інформації,

розходженнями у форматах та стандартах

її подання.

Аналіз наукових публікацій пока-

зує, що світове наукове співтовариство

вважає пошук мультимедіа важливою

проблемою сьогодення і приділяє їй зна-

чну увагу. ACM Multimedia Special

Interest Group [2] займається, зокрема,

дослідженням імен мультимедіа і пошу-

ком, збереженням і використанням муль-

тимедійних інформаційних ресурсів

(МІР). Moving Picture Experts Group роз-

робляє стандарти подання та опису ауді-

овізуальної інформації. Synchronized

Multimedia Working Group Консорціуму

W3С пропонує механізм створення до-

кументів, що містять синхронізовану му-

льтимедійну інформацію SMIL [3].

Користувач, що шукає мультимедіа,

зазвичай не може навести фрагмент по-

трібної інформації у формі, придатній

для автоматичної обробки. Параметри

опису мультимедіа вкрай різноманітні та

важко формалізовані й у значній мірі

суб’єктивні.

Постановка задачі

Для того щоб забезпечити ефектив-

ний пошук мультимедіа, потрібно визна-

чити, що саме є об’єктом пошуку; які па-

раметри може задавати користувач для

ідентифікації інформаційних потреб; які

відомості про мультимедіа можна отри-

мати внаслідок аналізу ІР та як порівню-

вати опис запиту з описом ІР.

1. Визначення мультимедіа

Термін "мультимедіа" має багато

визначень, але в більшості випадків це

поєднання текстової, звукової та відео

інформації. Під мультимедіа розуміють

електронний носій інформації, що вклю-

чає кілька її видів (текст, зображення,

анімація тощо [4]), інтегроване представ-

лення інформації в кількох формах, на-

приклад, відео, голос, музика або дані [5].

Іноді під мультимедіа розуміють також

потоки сигналів від віддаленого облад-

нання (телескопів, датчиків тощо).

Обробка мультимедіа засобами об-

числювальної техніки почалася ще в 60-х

роках, коли зображення та текст поєдну-

вали в одному документі. Дослідження

мультимедіа базується на таких дисцип-

лінах, як обробка сигналів, комп’ютерна

графіка, бази даних, когнітивна психоло-

гія, інтерфейс користувача. Для подаль-

шої роботи з аналізу мультимедіа вве-

демо більш чітке поняття мультимедій-

ного об’єкта. Це об'єкт, відтворений за

допомогою комп'ютера і здатний

впливати на одне або кілька людських

почуттів – зір, слух тощо. Слід зазначити, Інформаційні системи

84

що основна частина інформації

надходить через зір і слух, тому,

розглядаючи мультимедіа, враховують

вплив тільки на ці почуття (хоча в

окремих випадках тактильна інформація

також може відтворюватися за

допомогою технічних пристроїв, напри-

клад, тактильного монітора).

Під мультимедійним об’єктом

(МО) розумітимемо інформацію, подану

в електронній формі, яка не є символьно-

текстовою та може інтерпретуватися

спеціалізованим програмним забезпечен-

ням і периферійними пристроями виве-

дення таким чином, щоб впливати на ор-

гани почуттів користувача.

Гіпермедійний інформаційний ре-

сурс (ГІР) – це ІР, який містить МО або

посилається на них (приміром, через гі-

перпосилання).

Контекст МО складається з конте-

нту (вмісту) та метаопису ГІР, який міс-

тить посилання на цей МО, та метаопису

самого МО. Метаописи як МО, так і ГІР

можуть бути відсутні.

Пошук мультимедіа виконується

існуючими інформаційно-пошуковими

системами (ІПС) з низькою релевантні-

стю. Важливо відмітити, що у випадку,

коли пошук здійснюється у такому дина-

мічному середовищі, як Інтернет (на від-

міну від, приміром, електронних бібліо-

тек), кожен ресурс потрібно індексувати

знову при звертанні до нього. Тому сема-

нтичний аналіз контента мультимедіа, що

потребує великих обчислювальних ре-

сурсів, не ефективен.

Існуючі ІПС індексують МО за кон-

текстом та назвами, вони не враховують

семантичну спрямованість ІР, які на них

посилаються. Пошук здійснюється за

ключовими словами.

Більш корисною для пошуку є об-

робка вмісту ГІР, у якому зустрічається

посилання на МО в текстових докумен-

тах (сучасні ІПС дозволяють знаходити

html-документи, документи у форматі

MS Word та PDF, презентації MS

PowerPoint тощо), та метаописи як са-

мого цього документа, так і мультимедіа.

Щоб аналізувати цю інформацію, потрі-

бно з'ясувати, які типи МО подані в Ін-

тернеті, в яких структурних елементах

html-сторінки розміщуються посилання

на них, які формати та елементи викори-

стовуються для їх метаописів і знання

про семантику МО здобуття з цієї інфор-

мації.

Мультимедійна інформація може

бути подана у різних формах: у вигляді

зображень, графіки, 3D-моделей, аудіо,

відео тощо (рис.1). Загальноприйнятої

класифікації МО на сьогодні немає, хоча

цьому питанню приділяється значна

увага. Оскільки МО різняться між собою

за типом, фізичною сутністю і форматом,

на семантичному рівні необхідно, абстра-

гуючись від фізичної сутності об'єктів,

виділити характеристики, які є загаль-

ними для всіх ГІР або специфічними для

кожного окремого типу.

Джерелами інформації, до яких си-

стема переадресує запит користувача,

можуть бути локальними і глобальними

ІПС. Надалі розглядається пошук МО

тільки серед тих ІР Інтернету, доступ до

яких здійснюється за протоколом http (а

не ftp).