Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
papers.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.42 Mб
Скачать

Проект eCulture

eCulture - семантична пошукова система, яка дозволяє одночасно вести пошук інформації в кількох колекціях установ, що опікуються проблемою культурної спадщини [15]. Це робиться шляхом перенесення цих колекцій в RDF шляхом зв’язування об’єктів колекцій як екземплярів класів через загальнодоступні словники, тим самим створюючи великий RDF граф. В процесі пошуку цей граф трасується і деякі підграфи повертаються у вигляді результату. Основним механізмом пошуку є використання Prolog.

Більшість Semantic Web додатків реалізовано за зразком реляційних баз даних, де прикладна логіка має доступ до бази даних на основі SQL [20]. Існує ряд еквівалентів SQL для Semantic Web, таких як SeRQL [17] і рекомендація W3C SPARQL [10]. Обидва дозволяють виразити граф, що складається з низки обов'язкових і необов'язкових ребер та вузлів, з розширеними умовами літеральних значень.

SeRQL відповідає вираженню графу на транзитивно закритому виразі, використовуючи семантику RDFS. Стандарт SPARQL не визначає, чи виконується логічний наслідок, який виконаний механізмом судження СУБД.

Однак, додатки eCulture не використовують SeRQL або SPARQL. Замість цього запити прикладної логіки виражаються як Prolog цілі на необроблених даних RDF та/або модулях судження  RDFS/OWL.

У eCulture розроблено методологію для портування культурних сховищ для Semantic Web і RDF. Ця методологія заснована на тому факті, що можна розраховувати, як правило, на два типи даних, від установ, що займаються питаннями культурної спадщини:

– Метадані, які описують культурні об'єкти та фотографії,

– Локальні словники, які використовуються в деяких метаданих.

Установи, як правило, використовують різні формати та різні моделі даних для представлення своїх колекцій та словників, це можуть бути бази даних, XML файли, або навіть текстові файли.

Основна увага в проекті приділена конвертації XML до RDF. Звертаючи увагу на те, що на відміну від раніше запропонованих підходів, при яких цільова модель RDF виходить з джерел даних XML, в eCulture такий підхід неприйнятний. Трансформація XML до RDF базується на основі правил властивостей, правил впорядкування, заміни значень та інших.

Проект IPISAR (Image Preservation, Information Systems, Access and Research)

Проект IPISAR досліджує розповсюдження, вивчення і раціональне використання культурної спадщини, та спроби представити вирішення загальних проблем в цих галузях на базі Semantic Web (SW) [Solutions for a Semantic Web-Based Digital Library Application Andrew Russell Green and Jose Antonio Villarreal Martinez].

У рамках проекту розроблений додаток «Pescador», який буде зберігати каталогізовані дані в стійких потрійний сховищах (їх функції будуть ті ж самі, що і в реляційної бази даних в традиційних системах).

Вимоги до додатку включають у себе здатність до інтеграції даних з каталогів різних форматів і адаптування до каталогізаційних потреб різних архівів. У даному проекті терміни "формат каталогу" і "формат запису", відносяться до організаційних особливостей значення полів, які використовуються для опису об'єктів в архів або до каталогу бібліотеки, а також інших конвенцій, пов'язаних зі створенням каталогу. Pescador використовує модель SW для каталогізації, де кожному формату запису буде відповідати окремий вид структурованого графу, в який включено спеціальна лексика і правила, що пов'язана із спеціалізованою прикладною логікою.

Висновки

Основним напрямком Європейських проектів щодо розвитку програмного забезпечення для підтримки електронних бібліотек є розширення онтологій екземплярами у вигляді метаданих. Формат представлення онтології в більшості проектів спирається на загально прийняті рекомендації RDF та OWL.

Слід зазначити, що існуючі рекомендації SPARQL можуть вирішити проблему пошуку інформації в графі. Це призводить до розробки нових гілок SPARQL а саме SeRQL та SPARQLeR. Останні, на нашу думку, мають більше перспектив, оскільки є розширеннями мови запитів SPARQL, що додає підтримку для створення семантичних шляхів запиту. Пропоноване розширення вписується в загальний синтаксис і семантику SPARQL і дозволяє легко формулювати запити за участю широкого кола регулярних шляхів в моделях RDF графів.

Слід також звернути увагу, що однією з найбільших проблем в Європейських проектах, є інтеграція даних залежно від їх змісту. Цю проблему поки не вирішено повністю.

Аналіз міжнародних проектів показав, що в подальшому необхідно досліджувати проблему інтеграції даних в семантичних мережах, а також побудови семантичних електронних бібліотек, концептуальний мапінг яких оперує не тільки метаданими, але й контентом гетерогенних ресурсів.

На нашу думку, більш адаптованими до потреб електронних бібліотек є системи EPrints і Dspace. При цьому Eprints вже достатньо довгий час використовується в електронних бібліотеках України, тому застосування саме цієї системи є найбільш оптимальним рішенням для створення відкритого інформаційного простору АПН України.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]