
- •«Протокол oia-pmh»
- •Розділ 1 Технічні характеристики oai-pmh
- •Основні поняття протоколу oai-pmh
- •Особливості протоколу oai-pmh
- •Повідомлення про помилки
- •Види помилок, що виникають при обробці запитів
- •Основні типи запитів
- •Розділ 2 Інструментарій реалізації протоколу oai-pmh
- •Програмне забезпечення Data Providers
- •Програмне забезпечення Service Providers
- •Висновки
- •Список використаних джерел інформації
- •Додаток а Запит Identify
- •Виконання запиту Identify
- •Додаток б Виконання запиту GetRecord
- •Додаток в Виконання запиту ListSets
Програмне забезпечення Service Providers
PKP Open Archives Harvester – вільне програмне забезпечення, що поширюється під ліценцією GNU General Public License, призначене для накопичення та індексування вільнодоступних метаданих за протоколом OAI-PMH. Програма повністю реалізована як веб-застосування і є кросплатформною, а її модульний підхід дозволяє нарощувати функціональність.
PKP Open Archives Harvester створений та підтримується Public Knowledge Project, Ванкувер, Канада. Система, спочатку розроблена для отримання метаданих статей відкритих журналів та публікацій відкритих конференцій, пізніше стала використовуватися і для будь-яких ресурсів, сумісних з протоколом OAI-PMH.
Можливості програмного забезпечення [9]:
збирання метаданих в різних форматах, наприклад, некваліфікованого DC, розширеного DC системи PKP;
підтримка простого й розширеного пошуку, використовуючи поля переходів (crosswalked fields) сховищ, з яких збирається інформація;
можливість виконання гранулярного (агрегованого) збору метаданих;
легкість налаштування інтерфейсу користувача на основі шаблонів HTML та CSS;
масштабованість.
Встановлення програмного забезпечення здійснюється за допомогою веб-інтерфейсу. Після процесу встановлення система не вимагає ніяких додаткових налаштувань та готова до роботи.
Користувач із правами адміністратора може в повному обсязі керувати репозиторіями системи. При індексуванні репозиторію можна здійснювати вибіркове індексування за такими характеристиками, як статус публікації (опублікована, представлена на розгляд, неопублікована), предметний класифікатор, що прийнятий в даному архіві та ін. Потім здійснюється індексування метаданих вибраного віддаленого репозиторію. Можлива вказівка часових умов, коли будуть вибиратися записи на віддалених репозиторіях.
Висновки
Основним результатом роботи Ініціативи відкритих архівів є розробка протоколу OAI-PMH. Цей протокол дозволяє автоматизовано отримувати дані про матеріали, розміщені в сумісних репозиторіях, для наступного агрегування та обробки. Протокол OAI-PMH побудовано на основі XML і для забезпечення сумісності потребує обов’язкової підтримки схеми опису метаданих Дублінського ядра. Цей стандарт є набором елементів метаданих описів публікацій, незалежний від тематики публікацій та включає два рівні: простий та кваліфікований. Перший з них включає 15 елементів метаданих, а другий додає ще 3 елементи та групу кваліфікаторів, що уточнюють семантику елементів для підвищення ефективності пошуку. Значна кількість сучасних програм для створення електронних репозиторіїв підтримує як OAI-PMH, так і Дублінське ядро, що дозволяє спеціалізованим пошуковим машинам автоматично отримувати повну інформацію про розміщені в таких репозиторіях об’єкти та агрегувати їх в єдину базу даних. Слід зауважити, що для кращої роботи систем пошуку рекомендується додаткова підтримка інших більш складних форматів метаданих. Так як джерелом виникнення протоколу була електронна публікація, модель даних OAI-PMH інтерпретується в термінах бібліографічних даних, що описують академічний ресурс: репозиторій, елемент (item), запис (record), колекція (set) та безпосередньо сам ресурс (resource). Протокол розрізняє 2 класи технологічних учасників, це провайдери даних, що є серверами OAI та провайдери послуг, що становлять клієнтів цих серверів. Основними керуючими елементами в протоколі OAI-PMH є так звані типи запитів (verbs), що спеціалізуються на конкретному зборі метаданих: виведення інформації про репозиторій, отримання окремого запису метаданих зі сховища, збір усіх записів зі сховища відповідно до колекційної приналежності, збір лише заголовків записів, виведення списку доступних форматів метаданих з репозиторію та отримання наборів записів зі сховища. Кожен запис складається з трьох частин: заголовок, власне метадані та примітки.