Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИТУ - Курс лекций.doc
Скачиваний:
4
Добавлен:
21.11.2018
Размер:
692.74 Кб
Скачать

4.3. Механизм работы поисковых систем

Ниже будут рассмотрены механизмы, используемые Google при индексировании и выдаче результатов запроса. Познакомившись с этими механизмами, можно научиться управлять поведением поисковой машины.

«Что для Вас является решающим фактором в работе поисковика? Единственное, что нас интересует в поиске информации, - это релевантность ссылок. Упорядоченность нашей базы данных - забота номер два, но и она напрямую связана с единственным качественным показателем работы поисковой машины - релевантностью.»

Сергей Брин, президент Google Inc.

Google - это поисковая система, которая использует количество ссылок на веб-сайт, как основной параметр популярности сайта. Это является особенно полезным в поиске хороших сайтов при простых поисковых запросах, например "автомобиль" или "путешествие". Именно поэтому Google приобрел большую славу за релевантность своих ссылок. Индекс цитирования (link popularity) - это количество ссылок, ведущих на ваш сайт с других сайтов. Этот метод сейчас широко используется поисковыми системами для ранжирования сайтов, так как можно предположить, что если на ваш сайт ведет множество ссылок, то содержимое вашего сайта является интересным и в чем-то уникальным. Индекс цитирования - это популярность сайта. Важность наличия ссылок на ваш сайт можно процитировать словами представителя Inktomi (чьей базой данных пользуются такие поисковые системы как Hotbot, AOL, MSN, Yahoo, Snap, Goto, Iwon): "если на ваш сайт нет ни одной ссылки, он проживет не более, чем один цикл обновления нашей базы данных". Чем большее количество ссылок существует на ваш сайт, тем лучший рейтинг он получает. Кроме количества ссылок, при расчете индекса цитирования учитывается качество ссылок. Это включает в себя три момента:

  1. Откуда идет ссылка. Например, если ссылка на ваш сайт идет с каталога Yahoo, то "вес" этой ссылки будет гораздо больше, чем если бы ссылка шла с сайта http://www.geosites.com/users/~vasya-pupkin. Многие сайты получали увеличение своих рейтингов в поисковых системах после того, как регистрировались в таких общепризнанных каталогах как Yahoo.

  2. Тематическая надпись на ссылке. Многие поисковые системы анализируют релевантность содержимого ссылки и сайта, на который она ведет. То есть, если на ссылке написано "поиск и поисковые системы в интернет", а сайт, куда она ведет так же посвящен "поиску и поисковым системам в интернет", то ссылка приобретает дополнительный "вес".

  3. Тематическая принадлежность сайта, откуда идет ссылка. Поисковые системы часто анализируют, с каких сайтов идут ссылки на ваш сайт. То есть 10 ссылок с сайтов, которые посвящены поисковым системам, будут гораздо ценнее, чем 100 ссылок с сайтов, которые не имеют никакого отношения к тематике вашего сайта. Следует, однако, отметить, что далеко не во всех поисковых системах реализован данный механизм.

Способы увеличения "индекса цитирования" сайта

  1. Существует хороший способ улучшить свой индекс цитирования. Для этого вам надо зарегистрировать ваш сайт во всех основных поисковых каталогах. После этого найдите ваш сайт в каталоге и скопируйте точный адрес URL, по которому находится ваш сайт в каталоге. Затем установите на своих страницах "скрытые ссылки" на этот адрес. В этом случае поисковые системы без труда найдут адрес вашего сайта в поисковых каталогах и улучшат ваш рейтинг.

  2. Обмен ссылками. Если вы нашли интересный сайт, который, как вы считаете, будет полезным для вашей аудитории, не стесняйтесь написать письмо администратору этого сайта с просьбой об обмене ссылками. Большинство людей с удовольствием обменяются ссылками, вы даже можете приобрести хороших друзей.

  3. Участие в клубах по обмену ссылками. Существует достаточно большое количество таких клубов. Попробуйте поискать их в англоязычной части интернета по ключевым словам "link clubs". Коэффицент Page Rank

«Технология поиска PageRank компании Google работает путем, в первую очередь, установления структуры ссылок во всей сети, а затем ранжируя каждую отдельную страницу, основываясь на числе и значимости ссылок на нее на других страницах».

Мэт Катс (Matt Cuts), инженер по программному обеспечению Google.

Page Rank в Google - один из основополагающих факторов, влияющих на релевантность страницы. Google воспринимает ссылку со страницы А на страницу В как голос, отданный страницей А в поддержку страницы В. Однако учитывается не только количество ссылок, полученных страницей В, но также качество этих ссылок. Нужно отметить, что Page Rank учитывает ссылки между страницами, а не между доменами, поэтому у страниц с одного домена может быть разный Page Rank, причем ссылки между страницами внутри домена тоже учитываются при определении Page Rank. Очень часто сайты строятся таким образом, что большинство страниц внутри домена ссылаются на корневую страницу, а также внешние ссылки в большинстве своем ведут на корень, поэтому наибольший Page Rank может быть именно у корневой страницы. Вычисление Page Rank R (A)= C*(R (B1)/N1+…+R (Bi)/Ni) - общая формула вычисления Page Rank

Page Rank страницы A, на которую ссылаются страницы В1…Вi, основан на определении суммы частных R (Bi)/Ni, где R (Bi) - Page Rank страницы Bi, Ni - кол-во ссылок на этой странице. С - некий коэффициент сглаживания, он присваивается странице или группе страниц и может использоваться для предотвращения преднамеренного ввода в заблуждение системы, для того чтобы получить больший Page Rank.

Из формулы видно следующее:

  • Чем больше ссылок с других страниц, тем выше Page Rank.

  • Чем выше Page Rank ссылающихся страниц, тем выше Page Rank.

  • Чем меньше количество ссылок на ссылающейся странице, тем выше Page Rank.

Еще можно заметить, что страницы внутри домена в некотором роде наследуют Page Rank корневой страницы. Например: имеется популярный сайт, на который ссылаются страницы с других доменов. Скорее всего, большинство ссылок ведут на корневую страницу и поэтому у неё большой Page Rank, в свою очередь, на корневой странице присутствует навигация по сайту. Page Rank страницы, на которую ссылается корень будет: R (корня)/N (ссылок из корня) - тоже довольно большой. Поэтому ссылки со страниц популярных сайтов имеют большой Page Rank. Общая формула определения рейтинга страницы, не учитывающая текстовое содержание, будет примерно следующая: Score=WA*Naccess + WR*Page Rank + WB*Nbacklinks + WF*Nforwardlink

Где:

WA - вес кол-ва входов на страницу (т.е. общее кол-во ссылок с разных мест страницы, с разных страниц)

WR - вес показателя Page Rank

WB - вес кол-ва ссылок с других страниц

WF - вес кол-ва ссылок со страницы на другие

Из всего выше сказанного следуют простые умозаключения:

Чем ближе к корню страница со ссылкой, тем больший вес она даст, но лучше всего получить ссылку с корневой страницы сайта.

Чем лучше организована навигация по сайту, тем больший вес будут иметь страницы.

PageRank позволяет эффективно отличить высококачественные страницы Web от низкокачественных, и данный параметр используется в механизме поиска Google.