Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1_Л1.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
160.26 Кб
Скачать

4. Класифікація іп.

Інформаційний пошук розрізняють наступним чином:

  • в залежності від мети – адресний пошук (формально-механічний) та семантичний (тематичний),

  • в залежності від об'єкту пошуку – документний та фактографічний,

  • в залежності від ступіню використання технічних засобів – ручний або автоматизований,

  • в залежності від функціональної ролі – домінуючі/другорядні, центральні/периферичні, сталі/сітуативні потреби.

Усі види інформаційного пошуку перетинаються, тому що цілі та об'єкти часто взаємопов'язані. Наприклад, документний і фактографічний види пошуку можуть бути як адресними, так и семантичними.

Адресний пошук

Процес пошуку документів за чисто формальними ознаками, зазначеним у запиті. Для здійснення потрібні наступні умови:

  1. Наявність у документа точної адреси

  2. Забезпечення суворого порядку розташування документів в запам'ятовуючому пристрої або в сховище системи.

Адресами документів можуть виступати адреси веб-серверів і веб-сторінок і елементи бібліографічного запису, і адреси зберігання документів у сховище.

Семантичний пошук

Процес пошуку документів за їх змістом.

Умови:

  • Переклад змісту документів і запитів з природної мови на інформаційно-пошукова мова та складання пошукових образів документа і запиту.

  • Складання пошукового опису, в якому вказується додаткова умова пошуку.

Принципова різниця між адресним і семантичним пошуками полягає в тому, що при адресному пошуку документ розглядається як об'єкт з точки зору форми, а при семантичному пошуку - з точки зору змісту.

При семантичному пошуку знаходиться безліч документів без зазначення адрес.

У цьому принципова відмінність каталогів і картотек.

Бібліотека - зібрання бібліографічних записів без вказівки адрес.

Документальний пошук

Процес пошуку в сховищі інформаційно-пошукової системи первинних документів або в базі даних вторинних документів, що відповідають запиту користувача.

Два види документального пошуку:

  1. Бібліотечний, спрямований на знаходження первинних документів.

  2. Бібліографічний, спрямований на знаходження відомостей про документи, представлених у вигляді бібліографічних записів.

Фактографічний пошук

Процес пошуку фактів, відповідних інформаційним запитом. До фактографічних даних відносяться відомості, витягнуті з документів, як первинних, так і вторинних і одержувані безпосередньо з джерел їх виникнення.

Розрізняють два види:

  1. Документально-фактографічний, полягає в пошуку в документах фрагментів тексту, що містять факти.

  2. Фактологічний (опис фактів), що передбачає створення нових фактографічних описів в процесі пошуку шляхом логічної переробки знайденої фактографічної інформації.

5. Стратегії інформаційного пошуку.

Стратегії інформаційного пошуку визначають ступінь подібності документів, що розглядаються, до пошукового запиту. Ступінь подібності визначається згідно з робочою гіпотезою: чим частіше пошуковий термін зустрічається в документі, тим «відповіднішим» є цей документ до пошукового запиту.

Стратегії інформаційного пошуку розробляються не тільки для визначення відповідності, але і для вирішення проблем, які пов’язані з неоднозначністю мови – один і той самий термін може позначати різні концепти (ключ в механіці означає зовсім не те, що в шифруванні), один і той же концепт може позначатись різними термінами (обласний центр Львівської області має назву Львів і Місто Лева).

Стратегія інформаційного пошуку це алгоритм, який, переглядаючи набір документів (Д1, ..., Дn), встановлює їх відповідність до пошукового запиту (ПЗ). Оскільки пошуковий термін зустрічається в документах різну кількість раз, можна говорити про різну ступінь відповідності до пошукового запиту. Цей алгоритм обчислює коефіцієнт відповідності (similarity coefficient) (КВ) для кожного документу КВ(ПЗ, Дi), де 1 ≤ i ≤ n.

Існують такі стратегії інформаційного пошуку: - з використанням векторно-просторового представлення (vector space model); пошук імовірності появи пошукового терміну в документі (probabilistic retrieval); - з побудовою мовної моделі для кожного документу (language models); - з побудовою мережі припущень, яка використовується для встановлення відповідності документу до пошукового запиту (inference network); - з Булевим індексуванням, коли кожному пошуковому терміну присвоюється своя «вага», що потім враховується при побудові впорядкованих списків документів (Boolean indexing); - з використанням не проявленого семантичного індексування (latent semantic indexing); - з побудовою нейромереж (neural networks); - з використанням продуктивних алгоритмів, коли початковий пошуковий запит «еволюційно» видозмінюється (genetic algorithms); - з використанням нечітких множин, коли документу ставиться у відповідність нечітка множина (fuzzy set retrieval).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]