Скачиваний:
172
Добавлен:
15.03.2015
Размер:
6.35 Mб
Скачать

Федеральное агентство связи Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования «Санкт-Петербургский государственный университет телекоммуникаций им. проф. М. А. Бонч-Бруевича»

Представление знаний в информационных сетях

Лабораторная работа №4

Анализ влияния пропозициональной логики на качество функционирования поисковой системы в глобальной сети интернет

Выполнил: Богомазов С.В.

студент группы И-02з

Принял:

д.т.н. проф. Птицына Лариса Константиновна

. .

Санкт - Петербург

2014

Цель работы:

Выявить технологические приемы повышения качества функционирования поисковых систем в глобальной сети Интернет на основе использования правил пропозициональной логики.

Задание:

  1. Выбрать для сравнительного анализа ряд поисковых систем не менее чем 4-х.

  2. Определить содержание концепта, относящийся к области информационных систем и технологий.

  3. Для каждой поисковой системы решить задачу поиска о применении сконструированного высказывания.

  4. Провести сравнительный анализ результатов поиска.

  5. Проанализировать отличия в синтаксисе и грамматике высказываний в контексте каждой поисковой системы.

  6. Проанализировать эффективность поиска в выделенном множестве систем.

  7. Сформировать рекомендации по повышению эффективности поисковых систем при помощи пропозициональной логики.

Ход работы:

Для выполнения работы выделены 4 поисковые системы:

  1. Google

  2. Яндекс

  3. Bing

  4. Рамблер

В качестве поискового запроса используется выражение «Информационная безопасность автоматизированных систем».

При вводе запроса в поисковой системе Яндекса, видно, что присутствует функция автоопределение запроса, что значительно ускоряет, а иногда и дает сам результат поиска (например, в случае, если пользователь не знал что писать после слова «объектно-», функция подскажет что можно ввести).

При вводе запроса в поисковую систему Google так же имеется функция автоопределения запроса, но, в отличие от ПС Яндекс, Google одновременно динамически выдает результаты поиска по запросу, наиболее подходящему под описание пользователем.

Поисковая система Bing так же имеет функцию автоопределения запросов пользователя, но по каким-то причинам, эта функция перестает срабатывать при вводе запроса до следующей позиции: «Принципы объектно-». Предполагается, что эта поисковая система еще не достаточна развита в виду малого количества схожих запросов.

В поисковой системе Раблер ситуация с функцией автоопределения запроса пользователя такая же как и у ПС Bing.

Результаты запроса «Информационная безопасность автоматизированных систем» в количестве найденных результатов сведены в таблицу:

Поисковая система

Яндекс

Google

Bing

Рамблер

Количество результатов (количество ссылок)

2 000 000

200 000

1 380 000

2 000 000

Рассмотрим процесс формирования выдачи результатов в поисковых системах при использовании пропозициональной логики.

ПС Яндекс и Google имеют справочные материалы по использованию языка запросов при поиске, чего не удалось найти в ПС Bing и Рамблер.

Функция расширенного поиска есть также у всех, рассматриваемых ПС, кроме Bing. Это дает возможность выявить синтаксис управления языком запросов в определенной ПС.

Таким образом, управление языком запросов в ПС Bing будет осуществляться эвристическим методом (метод слепого поиска).

Справочные материалы по использованию языка запросов ПС Яндекс.

Справочные материалы по использованию языка запросов ПС Google.

Функция расширенного поиска ПС Яндекс.

Функция расширенного поиска ПС Google.

Функция расширенного поиска ПС Рамблер. При помощи нее будут определен синтаксис нужных пропозициональных логических выражений в данной ПС.

Расширенный поиск в ПС Bing найти не удалось.

Отметим реакцию выдачи рассматриваемых поисковых систем при использовании отдельных выражений пропозициональной логики.

  1. Слова запроса в точной форме («» – ставятся вначале и в конце запроса):

ПС Яндекс выдал 16000 ответов.

ПС Google выдал 214000 ответов.

ПС Bing выдал 32500 ответов.

ПС Рамблер выдал 25 000 ответов.

  1. Поиск выражения с пропущенным словом (вместо пропущенного слова ставится «*»):

ПС Яндекс нашел 2000000 ответов.

ПС Google нашел 55 500 000 ответов.

Для ПС Бинг данное выражение отработало так же ка и предыдущее (1), это значит что синтаксис запросов в ПС Bing исключает такую возможность. Смежной функции для ПС Bing найти не удалось.

ПС Рамблер нашел 241 страницу.

  1. Поиск выражения в пределах одного предложения (между частями предложения ставится знак «&» или «AND»):

ПС Яндекс нашла 2 000 000 ответов.

ПС Google нашла 4 660 000 ответов.

ПС Bing нашел 1 380 000 ответов.

ПС Рамблер вывела 2 000 000 ответов.

  1. Вхождение любого из слов в результаты запроса (между выбранными словами ставится знак «|» или «OR»):

ПС Яндекс нашел 48 000 000 ответов.

ПС Google нашел 5 190 000 ответов.

ПС Bing нашел 2 580 000 ответов.

ПС Рамблер нашел 48 000 000 ответов.

  1. Исключение слова из результата поиска (перед исключаемым словом ставится знак «-» или «~~»):

ПС Яндекс нашла 3 000 000 ответов.

ПС Google нашла 240 000 ответов.

ПС Bing нашла 65 000 ответов.

ПС Рамблер нашла 3 000 000 ответов.

Сведем результаты в таблицу и выявим процент обработки изначальной выдачи от выдачи с использованием выражений с пропозициональной логикой:

«»

*

& / AND

| / OR

- /~~

Яндекс

1%

0,004%

19%

7 500%

24%

Рамблер

1%

0,01%

11%

8 750%

25%

Google

18%

758%

96%

5 862%

9%

Bing

15%

15%

105%

53 684%

25%

Поразительная корреляция наблюдается у ПС Яндекс и Рамблер, в то время как остальные ПС показывают независимые процентные соотношения.

В результате детального изучения ПС Рамблер, было выявлено что она использует движок ПС Яндекс:

Рассмотрим составное выражение пропозициональной логики (поиск в пределах одного предложение и исключение слова из поиска):

ПС Яндекс нашел 2 000 000 ответов.

ПС Google нашел 4 670 000 ответов.

ПС Bing нашел 65 300 ответов.

ПС Рамблер нашел 2 000 000 ответов, что не удивительно.

Проведем сравнение синтаксиса у выделенных поисковых систем:

Точная последовательность выражения

Пропуск слова в выражении

Поиск сочетания слов в пределах 1 предложения

Поиск любого из слов

Исключение слова из поиска

Яндекс

«фраза»

«слово1 * слово2»

слово1 & слово2

слово1 | слово2

-(слово)

или

~~ слово

Рамблер

«фраза»

«слово1 * слово2»

слово1 AND слово2

слово1 | слово2

-(слово)

или

~~ слово

Google

«фраза»

«слово1 * слово2»

слово1 & слово2

слово1 | слово2

-слово

Bing

«фраза»

«слово1 * слово2»

слово1 & слово2

слово1 | слово2

-слово

Как можно заметить, синтаксис используемых в работе пропозициональной логики не на много отличается в ряде поисковых систем и являются интуитивно понятными для людей, имеющих знания в сфере информационных технологий.

Из взятых 4-х поисковых систем наиболее эффективно показали себя ПС Яндекс и ПС Google.

Однако, можно усовершенствовать систему расширенного поиска таким образом, чтобы обычный человек, не имеющий знаний в области информационных технологий смог самостоятельно использовать запросы с пропозициональной логикой, при помощи интерфейса сайта систем.

Выводы:

Выявлены технологические приемы повышения качества функционирования поисковых систем в глобальной сети Интернет на основе использования правил пропозициональной логики.

На основе анализа представленных данных выявлена зависимость функциональной мощности поисковых систем от форм представления знаний в фиксируемых запросах.

Исследовано влияние пропозициональной логики на качество функционирования каждой поисковой системы из выделенного множества.

В одинаковых условиях качество функциониования поисковой системы Google превышает качество функционирования других поиск овых систем из числа сравниваемых. Поисковые системы Google, Яндекс, Рамблер предоставляют возможность расширенного поиска.

Соседние файлы в папке мои лабы