
- •Национальный исследовательский
- •Аннотация
- •The annotation
- •Введение
- •1. Анализ предметной области
- •1.1. Основные понятия информационного поиска
- •1.2. Задачи информационного поиска
- •1.3. Методы информационного поиска
- •1.4. Адаптивный поиск информации
- •1.5. Проблемы адаптивного поиска
- •Выводы по главе 1
- •2. Алгоритм адаптивного поиска информации
- •Выводы по главе 2
- •3. Разработка программной библиотеки
- •3.1. Проектирование
- •3.2. Системные требования
- •3.3. Настройка параметров адаптивного поиска
- •3.4. Тестирование
- •Выводы по главе 3
- •Заключение
- •Приложения Приложение 1. Исходный код библиотеки
- •Приложение 2. Значения кодов состояний
- •Национальный исследовательский университет «мэи»
- •Задание н а в ы п у с к н у ю р а б о т у
- •Содержание разделов задания и исходные данные
- •Перечень графического материала
- •Рекомендуемая литература
- •Библиографический список
- •Содержани
1.4. Адаптивный поиск информации
Адаптивный поиск – это поиск, при котором учитывается персональная информация пользователя, сделавшего запрос: его местоположение, история поисковых запросов и т. п. Впервые адаптивный поиск был запущен в сентябре 2011 года корпорацией Microsoft в своей поисковой системе Bing. А с 1 марта 2012 года поисковая система Google также начала использовать поисковые результаты пользователей сервисов Google+, Gmail и YouTube. Принципы, заложенные в идею адаптивного поиска, являются, бесспорно, очередным шагом в развитии информационного поиска как науки.
Адаптивный поиск не является полностью самостоятельным методом поиска информации, а представляет собой лишь общий принцип ранжирования результатов выполнения поискового запроса. Согласно этому принципу личные предпочтения пользователя выдвигаются на первый план. При этом все прочие критерии ранжирования либо вовсе отбрасываются, либо учитываются в меньшей степени.
Рассмотрим основные виды персональной информации пользователя, потенциально доступные поисковой системе.
Пол и возраст могут быть известны точно (указаны при регистрации) или приближённо (на основании анализа поисковых запросов). Использование подобной информации позволяет поисковым системам отбрасывать результаты, заведомо не интересующие данную категорию пользователей.
Местоположение – данные о конкретном географическом положении устройства, с которого был осуществлён поисковый запрос. В большинстве случаев имеется возможность определить местоположение пользователя с точностью до города. Данная информация может быть использована при выдаче территориально ориентированных поисковых результатов, например, при поиске близлежащих ресторанов, больниц и т. п.
История поисковых запросов – основной источник персональных предпочтений пользователя для поисковой системы. Основная проблема, возникающая при работе с данным видом персональной информации, заключается в его размере и постоянной пополняемости. Анализ поисковой истории пользователя может дать представление о поле, возрасте и местоположении пользователя.
1.5. Проблемы адаптивного поиска
Одной из ключевых и широко обсуждаемых проблем адаптивного поиска является так называемый «пузырь фильтров».
Пузырь фильтров (англ. «Filter bubble») – явление, при котором веб-сайты используют алгоритмы выборочного угадывания, какую информацию пользователь хотел бы увидеть, основываясь на информации о его месторасположении и истории поиска. В результате веб-сайты показывают только информацию, которая согласуется с прошлыми точками зрения данного пользователя. Вся иная информация, как правило, пользователю не выводится. Яркими примерами этого являются Google с персонализированными результатами поиска, а также Facebook с персонализированной лентой новостей. В итоге пользователи получают меньше точек зрения и становятся интеллектуально изолированными в своём собственном информационном пузыре.
Понятие «пузырь фильтров» было впервые использовано интернет-активистом Эли Парайзером и описанное в его книге с одноимённым названием. Эффект пузыря может иметь негативные последствия для формирования гражданского мнения [3].
От того, что интернет-компании стремятся подстроить свои услуги (включая новости и поисковые результаты) под наши индивидуальные вкусы, появилось опасное непреднамеренное последствие: мы оказываемся в плену у «пузырей фильтров» и не получаем информацию, которая могла бы поставить под сомнение или расширить наш взгляд на мир.
Парайзер Э. предупреждает, что потенциальным недостатком фильтрации поисковых запросов является то, что она закрывает нас от новых идей, предметов и важной информации и создаёт впечатление того, что наши узкие собственные интересы и есть всё, что существует и окружает нас [3]. Это приносит потенциальный вред, как для личности, так и для общества в целом. Согласно Парайзеру, «пузырь фильтров» оказывает вред обществу, так как он может подрывать формирование гражданского мнения и сделать людей более уязвимыми к пропаганде и манипуляциям.
Понятие «пузырь фильтров» похоже на явление, в котором люди и организации ищут информацию, которая изначально кажется им правильной, но она оказывается совершенно бесполезной, и избегают полезной информации. Проблема появляется, потому что реальная значимость конкретного факта или понятия в этих случаях очевидна только после того, как этот факт стал известен. До этого идея изучения была отклонена, потому что какой-либо факт был неправильно воспринят. Соответственно, пользователь, ищущий информацию, попадает в ловушку и не может узнать то, что ему действительно нужно, и попадает в информационное слепое пятно. Этот феномен был описан как «парадокс релевантности» [3], и это происходило во многих случаях на протяжении всего человеческого интеллектуального развития и является важной проблемой для науки и образования.
Решением данной проблемы, предоставляемым современными поисковыми системами, является полный или частичный отказ от механизма адаптации поисковых результатов. Поисковая система Google позволяет своим пользователям управлять поисковой историей запросов и тем самым влиять на работу механизма адаптивного поиска.
Ещё одной проблемой адаптивного поиска является эффект полного или частичного игнорирования любых попыток поисковой оптимизации сайта. Так как SEO (от англ. «Search Engine Optimization») – это комплекс мероприятий, целью которого является улучшение позиций сайта в выдаче поисковых систем по конкретным запросам, то в случае адаптивного поиска этот комплекс мероприятий должен быть направлен на улучшение позиции сайта в персональной выдаче каждого отдельно взятого пользователя поисковой системы. Решение данной проблемы заключается в поиске «золотой середины», позволяющей выдать одновременно и персонализированные, и оптимизированные результаты выполнения поискового запроса.