Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Якість інформації.doc
Скачиваний:
16
Добавлен:
16.11.2019
Размер:
6.04 Mб
Скачать

Імовірнісний пошук

Коефіцієнт відповідності документу пошуковому запитові визначається на основі імовірності того, що документ є відповідним пошуковому запитові. Присутність чи відсутність пошукового терміну в документі використовується для визначення імовірності того, що документ відповідає інформаційному запитові. Визначення імовірності базується на попередніх статистичних даних, про те, наскільки імовірно, що документ який містить пошуковий термін A, відповідатиме пошуковому запитові, що містить термін A. Припускаючи, що пошукові терміни в пошуковому запиті є незалежні, можна обчислювати таку імовірність для кожного пошукового терміну з пошукового запиту. Загальна імовірність відповідності документу обчислюється як добуток ймовірностей відповідності для кожного терміну. Незалежність пошукових термінів в пошуковому запиті рідко спостерігається в дійсності, тому обчислення сумарної відповідності значно ускладнюється, що збільшує час інформаційного пошуку. Крім того, необхідно мати попередні дані про входження термінів у відповідні до запиту документи а також і у невідповідні до запиту документи.

Maron, M. E., & Kuhns, J. L. (1960). On relevance, probabilistic indexing and information retrieval. Journal of the ACM, 7(3), 216-244.

Алгоритми прийняття рішень

Алгоритми прийняття рішень використовуються для визначення імовірності того, що документ буде відповідним до пошукового запиту. Алгоритми прийняття рішень застосовуються як доповнення до імовірнісного пошуку, для отримання додаткових доказів того, що документ може відповідати пошуковому запиту. Метод основано на виокристанні відомих залежностей для побудови невідомих. Це дозволяє кардинально знизити обсяг обчислень, які необхідні для визначення імовірності тої чи іншої події.

Greiff Warren R., Croft B., Turtle H. PIC matrices: a computationally tractable class of probabilistic query operatorsю ACM Transactions on Information Systems (TOIS) Volume 17 , Issue 4 (October 1999) p. 367 - 405

Пошук з використанням алгоритмів розвитку

Шляхом еволюції можна змінити початковий пошуковий запит. Початковий запит використовується з рівноправними термінами, або з термінами, що мають різну вагу. Згенерований пошуковий запит залишається, якщо він охоплює відомі відпоівдні до початкового запиту документи, якщо ж ні – відкидається.

Hsinchun Chen Machine learning for information retrieval: Neural networks, symbolic learning, and genetic algorithms. Journal of the American Society for Information Science. Volume 46 Issue 3, Pages 194 - 216

Ландэ Д.В., Снарский А.А., Безсуднов И.В. Интернетика: Навигация в сложных сетях: модели и алгоритмы. — M.: Либроком (Editorial URSS), 2009. — 264 с. ISBN 978-5-397-00497-8.

Документа́ція — це спосіб оформлення господарських операцій відповідними документами, призначений для первинного спостереження за господарськими операціями як обов’язкова умова відображення їх в обліку. Документація відіграє також важливу роль в управлінні діяльністю підприємства, забезпечує контроль за збереженням майна господарства, раціональним його використанням. Вона має юридичне значення як письмовий доказ здійснення господарських операцій. Використовують документацію для аналізу господарської діяльності, фінансового контролю, аудиту й документальних ревізій.