Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1_Л1.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
160.26 Кб
Скачать

Алгоритми прийняття рішень

Алгоритми прийняття рішень використовуються для визначення імовірності того, що документ буде відповідним до пошукового запиту. Алгоритми прийняття рішень застосовуються як доповнення до імовірнісного пошуку, для отримання додаткових доказів того, що документ може відповідати пошуковому запиту. Метод основано на виокристанні відомих залежностей для побудови невідомих. Це дозволяє кардинально знизити обсяг обчислень, які необхідні для визначення імовірності тої чи іншої події.

Greiff Warren R., Croft B., Turtle H. PIC matrices: a computationally tractable class of probabilistic query operatorsю ACM Transactions on Information Systems (TOIS) Volume 17 , Issue 4 (October 1999) p. 367 - 405

Розширений Булевий пошук

Звичайний Булевий пошук не має нічого спільного з ступінню відповідності документу до пошукового запиту, і, відповідно, з упорядкуванням документів згідно з цією відповідністю. Документи або задовільняють інформаційний запит, або ні. Ті документи, що задовільняють булевий запит попадають у список по черзі. Ідея розширеного Булевого пошуку полягає у створенні можливостей для визначення ступеня відповідності документів пошуковому запитові. Це досягається з допомогою присвоєння ваги пошуковим термінам. Вага термінів враховується при побудові списку відповідності документів до інформаційного запиту.

Fox Edward A., Salton G., Wu H. Extended Boolean information retrieval. Commun. of the ACM, Volume 26 , Issue 11 (November 1983) р. 1022 - 1036

Пошук з прихованим семантичним індексуванням

Поява термінів в документі представляється за допомогою матриці термін-документ. Матриця приводиться за допомогою розкладу за виродженими матрицями для того, щоб відділити «шум», так, що два семантично спільні документи знаходяться поруч в багатомірному просторі.

Scott Deerwester, Susan T. Dumais, George W. Furnas, Thomas K. Landauer, Richard Harshman. Indexing by latent semantic analysis. Journal of the American Society for Information Science (1990)

Пошук з використанням нейро-мереж

Вузли нейронної мережі «активуються» пошуковим запитом. Сила кожного зв’язку нейронної мережі передається документу і використовується для обчислення коефіцієнта відповідності документа до пошуковго запиту. Для цього зв’язкам присвоюється вага згідно з наперед визначеною відповідністю чи невідповідністю документів.

Kwok K. L. A neural network for probabilistic information retrieval. ACM SIGIR Forum, Volume 23 , (June 1989)

Пошук з використанням алгоритмів розвитку

Шляхом еволюції можна змінити початковий пошуковий запит. Початковий запит використовується з рівноправними термінами, або з термінами, що мають різну вагу. Згенерований пошуковий запит залишається, якщо він охоплює відомі відпоівдні до початкового запиту документи, якщо ж ні – відкидається.

Hsinchun Chen Machine learning for information retrieval: Neural networks, symbolic learning, and genetic algorithms. Journal of the American Society for Information Science. Volume 46 Issue 3, Pages 194 - 216

Пошук з використанням нечітких множин

Документ перетворюється в нечітку множину (це множина, що містить не тільки сам елемент але і число, що показує ступінь приналежності елемента до множини). Далі для кожного документу з проведеного попередньо Булевого пошуку додається інформація отримана з операцій об’єднання, перетину, комплементарності нечітких множин, яка говорить про ступінь відповідності кожного документу до пошукового запиту. Ступінь відповідності використовується як коефіцієнт відповідності.

V. Повідомлення домашнього завдання.

VI. Підсумки заняття (рефлексія).

Відповідати «так» або «ні»:

  • Я дізнався(лась) багато нового.

  • Мені це пригодиться у житті.

  • На лекції було над чим поміркувати.

  • На усі питання, які виникали у мене під час заняття, я отримав(ла) відповіді.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]