Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Компьютерная и офисная техника..pdf
Скачиваний:
45
Добавлен:
05.02.2023
Размер:
2.2 Mб
Скачать

165

Поисковый индекс Google по состоянию на начало мая 2005 года содержал ссылки более чем на 8 миллиардов Web-страниц. Но самыми главным достоинствами поисковой машины Google являются высокое качество искорость полнотекстового поиска. Авторы проекта разработалитехнологию link popularity, которая при вычислении релевантности учитывает также количество и качество ссылок на страницы с других страниц

(Page Rank).

Самым удивительным в поисковой машине Google является то, что она совсем не рассчитана на суперкомпьютеры. Вместо этого там используются кластеры, содержащие десятки, если не сотни, тысяч простеньких и дешевых компьютеров на платформе Intel. Механизм поиска построен таким образом, что запросы равномерно распределяются между тысячами процессоров, в результате скорость поиска по гигантскому индексу измеряется долями секунды. Такие свойства системы принесли ей необыкновенную популярность во всем мире. В 2004 году акции компании вышли на фондовую биржу, к исходу первого дня торгов на планете появились два новых миллиардера.

По данным компании Net Applications в декабре 2007 года рыночная доля Google в мире составляла 77.04 %, Yahoo! – 12.46 %, MSN – 3.33 %, Microsoft Live Search – 2.57 %, AOL – 2.12 %, Ask – 1.38 %, AltaVista – 0.13 %, Excite – 0.07 %, Lycos – 0.02 %, All the Web – 0.02 % [2].

Российские поисковые системы если не по объему, то по качеству поиска не уступают западным. И хотя наличиефлексий (изменяемых частей слова) в русском языке существенно усложняет задачу построения полнотекстовых индексов, накопленный отечественной наукой опыт построения библиографических информационно-поисковых систем позволил создать мощные и удобные в использовании поисковые системы, самыми известными из которых являются Яндекс, Rambler и Mail.ru. Кстати, в русскоязычных поисковых системах также используется Page Rank, который называется индексом цитирования.

Взаключение приведем статистику популярных поисковых системы

вРунете на ноябрь 2008 года (по данным ресурса LiveInternet.ru): Google

– 34,1 %, Яндекс – 45,1 %, Mail.ru – 7,7 % , Rambler – 7,1 %, Nigma – 0,5 %, Aport – 0,1 %.

Контрольные вопросы

1.Кто является родоначальником гипертекста?

2.Кем и в какой связи был введен в оборот термин «гипертекст»?

3.Каковы основные примеры документальных гипертекстовых систем?

4.Кем, где и когда предложена технология Word Wide Web?

5.Каковы основные составляющие технологии WWW?

166

6.Какова роль Марка Андриссена в развитии WWW?

7.Что такое сайт?

8.Что такое «война браузеров»? Кто в ней стал победителем?

9.Когда и кем был создан первый интернет-каталог? Как он называется?

10.Чем интернет-каталоги отличаются от поисковых систем?

11.Что такое индексация в поисковых системах?

12.Что такое Rage Rank?

13.Что такое индекс цитирования?

14.В чем основное преимущество поисковой машины Google?