
- •Анатомия крупномасштабного Гипертекстовая поисковый сайт Сергей Брин и Лоуренс страницу
- •Абстрактный
- •1. Введение
- •1,1 Поисковики в интернете - Расширение масштабов: 1994 - 2000
- •1.2. Google: масштабирование с веб-
- •1,3 Целей проектирования
- •1.3.1 Повышение качества поиска
- •1.3.2 Научные исследования поисковых
- •2. Особенности системы
- •2,1 PageRank: наведение порядка в Web
- •2.1.1 Описание Расчет PageRank
- •2.1.2 Обоснование Интуитивно
- •2,2 Якорный текст
- •2.3 Другие особенности
- •3 Связанные работы
- •3.1 Информационно-поисковая
- •3.2 Различия между веб-и хорошо контролируемых Коллекции
- •4 Система Анатомии
- •4.1 Google Обзор архитектуры
- •4.2 Основные структуры данных
- •4.2.1 BigFiles
- •4.2.2 Репозиторий
- •4.2.3 Индекс документа
- •4.2.4 Lexicon
- •4.2.5 Списки Хитов
- •4.2.6 Переднего указателя
- •4.2.7 Инвертированный индекс
- •4.3 Сканирования Интернета
- •4,4 Индексирования веб-
- •4.5 Поиск
- •4.5.1 Система ранжирования
- •4.5.2 Обратная связь
- •5 Результаты и оценочные
- •5.1 Требования хранения
- •5.2 Производительность системы
- •5.3 Эффективность поиска
- •6 Выводы
- •6.1 Дальнейшая работа
- •6,2 Высококачественного поиска
- •6,3 Масштабируемая архитектура
- •6,4 Исследовательский инструмент
- •7 Благодарности
- •9 Приложение b: Масштабируемость
- •9. 1 Масштабируемость Google
- •9.2 Масштабируемость архитектуры централизованного индексирования
5 Результаты и оценочные
Запрос:
Билл Клинтон
http://www.whitehouse.gov/
100,00% (без
даты)
(0K) Рисунок 4. Результаты образца от Google |
Все результаты являются достаточно высокие качество страниц и, наконец чек, ни один не был неработающие ссылки.Это в значительной степени потому, что все они имеют высокое PageRank. PageRanks это проценты в красных вместе с гистограммой. Наконец, нет никаких результатов о Билла Клинтона, чем другие, или около Клинтон, кроме Билла. Это потому, что мы придаем важность тяжелой от близости вхождений слов. Конечно, настоящей проверкой качества поисковой системы будет включать обширное исследование пользователей или результаты анализа которых у нас нет места для здесь. Вместо этого, мы предлагаем читателю попробовать Google для себя на http://google.stanford.edu .