Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Анатомия крупномасштабного Гипертекстовая поиск...docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
159.81 Кб
Скачать

Анатомия крупномасштабного Гипертекстовая поисковый сайт Сергей Брин и Лоуренс страницу

{Сергей, стр.} @ cs.stanford.edu

Факультет Вычислительной Техники, Стэнфордский университет, Стэнфорд, Калифорния 94305

Абстрактный

       В этой статье мы представляем Google, прототип крупномасштабную поисковую машину, которая активно использует структуры присутствуют в гипертекст. Google предназначена для сканирования и индексирования Web эффективно и производят гораздо больше удовлетворения, чем результаты поиска существующих систем.Прототип с полным текстом и гиперссылку данных по крайней мере 24 миллионов страниц можно получить на http://google.stanford.edu/         инженеру поисковой системы является сложной задачей. Поисковые системы индексов в десятки и сотни миллионов веб-страниц с участием сопоставимых число различных условиях. Они отвечают на десятки миллионов запросов каждый день. Несмотря на важность крупномасштабных поисковых систем в интернете, очень мало научных исследований было сделано на них. Кроме того, из-за быстрого развития технологий и веб-распространения, создания системы веб-поиска в настоящее время очень сильно отличается от трех лет назад. В данном документе приводится подробное описание наших крупномасштабных поисковых веб -. Первый такой подробный публичного описания мы знаем на сегодняшний день         Помимо проблем масштабирования традиционные методы поиска данных такого масштаба, появляются новые технические проблемы связанные с использованием дополнительного представления информации в гипертекстовой для повышения качества результатов поиска. Эта статья рассматривает этот вопрос, как построить практическую крупномасштабные системы, которые могут использовать дополнительные представления информации в гипертекст. Также мы смотрим на проблемы, как эффективно бороться с неконтролируемым коллекции гипертекстовых где любой желающий может опубликовать все, что хотят.

 Ключевые слова : World Wide Web, Поисковые системы, поиск информации, PageRank, Google

1. Введение

(Примечание:.. Существуют две версии этой бумаги - больше полную версию и более короткой печатной версии Полная версия доступна на веб-конференции и CD-ROM)  веб создает новые проблемы для поиска информации. Количество информации в сети быстро растет, а также количество новых пользователей неопытный в искусстве веб-исследований. Люди, скорее всего, работать в Интернете, используя ссылку графика, часто начиная с высоким качеством человека поддерживается индексов, таких как Yahoo! или в поисковых системах. Человека поддерживается перечни вошли популярные темы эффективно, но субъективны, дорого строить и поддерживать, медленное улучшение, и не может охватить все эзотерические темы. Автоматизированные поисковые системы, которые полагаются на соответствия ключевых слов обычно возвращают слишком много матчей низким качеством. Что еще хуже, некоторые рекламодатели пытаются привлечь к себе внимание людей, принимая меры, призванные ввести в заблуждение двигателей автоматизированного поиска. Мы построили крупномасштабных поисковую машину, которая решает многие из проблем, существующих систем. Это делает особенно интенсивного использования дополнительных нынешней структуре в гипертекстовых обеспечить гораздо более высокие результаты качества поиска. Мы выбрали наше имя системы, Google, потому что она является общей написание гугол, или 10 100 и хорошо вписывается в нашу цель создания сверхбольших поисковыми системами.