- •Практическая работа № 15 «Joomla 2.5: Поисковая оптимизация и защита сайта. Перенос сайта»
- •Метаданные статьи
- •Карта сайта и навигационная строка
- •Запрет индексирования некоторых страниц (файл robots.Txt)
- •Статистика сайта. Маркировка страниц. Журналы сервера.
- •Безопасность сайтов
- •Перенос сайта на другой хостинг
-
Метаданные статьи
Метаданные помогают найти статью как при поиске через поисковую машину, так и при внутреннем поиске по сайту.
Ключевые слова помогают поисковой машине классифицировать статью. Они сравнивают список поисковых слов и содержимое страницы. Содержимое должно соответствовать ключевым словам, и это повысит ее рейтинг в индексе поисковика.
Задание 2. Для того чтобы изменить метаданные статьи, выберите ее в менеджере материалов и щелкните на кнопке Изменить. В правой части окна раскройте область Метаданные и заполните описание статьи и ключевые слова.
Сформируйте метаданные всех статей вашего сайта.
-
Карта сайта и навигационная строка
При наличии подробной карты сайта, поисковая машина проиндексирует все страницы вашего сайта.
Длина карты сайта обычно ограничена. Практически все расширения для построения карты сайта выводят первые N ссылок, остальные N переходят на следующую страницу, т.е. ссылки выводятся не одним документом, а постранично. В итоге поисковая машина проиндексирует только первые N ссылок, а остальные N поставит в очередь до следующего визита. Но позднее будут проиндексированы и все оставшиеся страницы сайта.
В Joomla 2.5 уже есть простая карта сайта, но внешние расширения позволили бы ее настроить более гибко. Просмотрите стандартную карту сайта.
По умолчанию Joomla не содержит дополнительных расширений для построения карты сайта, поэтому рассмотрим Хmар – популярное расширение для создания карты сайта. Сайт разработчиков Хmар http://www.jooxmap.com/.
Задание 3. Скачайте расширение Xmap и дополнительные компоненты к нему по прямой ссылке: http://www.jooxmap.com/downloads.html (или из папки, предложенной преподавателем). Установите это расширение и дополнения.
В панели управления компонентом Xmap во вкладке Расширения включите все компоненты Xmap.
С помощью панели управления компонентом Xmap во вкладке Карты создайте новую карту сайта. В свойствах меню «Карта сайта» привяжите к нему карту Xmap.
Навигационная строка (рис. 3) позволяет узнать, в каком разделе или категории сейчас находится пользователь, например: Ноmе→Книги→Linux.
Рис. 3. Навигационная строка.
Не все шаблоны ее поддерживают. Если вы установили шаблон, который не предусматривает вывод навигационной строки, откройте его для редактирования и щелкните «Изменить шаблон главной страницы». Добавьте в место желаемого отображения навигационной строки следующую запись:
<jdoc:include type="module" name="breadcrumbs" />
-
Запрет индексирования некоторых страниц (файл robots.Txt)
Иногда лучше, чтобы поисковая машина не индексировала некоторые страницы сайта. Например, не обязательно индексировать форумы, доски объявлений, каталоги cgi-bin, поскольку в индексировании этой информации нет практического смысла.
Таким образом, желательно, чтобы в корневом каталоге вашего сайта был файл robots.txt такого содержания:
User-Agent: *
Disallow: /cgi-bin/
Обратите внимание на то, что директива User-Agent: * обязательна и должна предшествовать директивам Disallow.
Директиву Disallow можно использовать только с одним операндом, т.е. вы не можете написать Disallow /cgi-bin /myforum/forum/. Для запрета индексирования N объектов нужно написать N директив Disallow – по одной на каждый объект.
В файле robots.txt пустые строки являются значимыми – они используются для разделения правил для разных роботов. Рассмотрим пример:
User-Agent: *
Disallow: /cgi-bin/
Disallow: /myforum/forum/
Первая директива Disallow применяется для всех роботов (*), а вторая вообще не будет применяться, поскольку она написана через пустую строку и перед ней нет директивы User-Agent, задающей имя робота. Другой пример:
User-Agent: *
Disallow: /cgi-bin/
User-Agent: yandex
Disallow: /myforum/forum/
Здесь индексирование каталога /cgi-bin/ запрещено для всех роботов, а каталога /myforum/forum – только для поискового робота Яндекса.
В директиве Disallow можете использовать только относительные пути к объекту, т.е. нельзя записать http://server.com/cgi-bin/ или просто server.com/cgi-bin.
Предположим, вам нужно запретить индексирование всего сайта. Для этого используются такие директивы:
User-Agent: *
Disallow: /
Обратите внимание на то, что вы должны записать именно директиву Disallow: /, а не Disallow *. В последнем случае будет запрещена индексация файлов, имена которых начинаются с символа *, а таких файлов нет.
Контролировать поведение робота можно также с помощью МЕТА-тегов в заголовке HTML-документа:
-
<META NAME="ROBOTS" CONTENT="NOINDEX"> – запрет индексирования документа.
-
<META NAME="ROBOTS" CONTENT="NOFOLLOW"> – если хотите запретить индексирование всего сайта, нужно вставить этот МЕТА-тег на главную страницу в index.html. Данный тег запрещает поисковому роботу следовать ссылкам с данной страницы.
Возможно, вы не хотите, чтобы индексировалась определенная часть текста на странице. Для этого в код страницы нужно вставить тег <NOINDEX>, в который нужно заключить текст, запрещенный для индексирования:
<NOINDEX>
Текст
</NOINDEX>
Задание 4. Сформируйте файл robots.txt с содержанием, соответствующим концепции вашего сайта. При необходимости более тонкой настройки поведения поискового робота задействуйте МЕТА-теги.
-
PageRank и тИЦ
PageRank – это система оценивания популярности страницы, созданная разработчиками Google. Разработчики Google никогда не предоставляли точной формулы, по которой рассчитывается PageRank. Сделано это умышленно – чтобы веб-дизайнеры не могли искусственно увеличить ранг страниц.
Самым популярным (т.е. самым посещаемым) сайтам присваивается ранг 10. В число таких сайтов входит сама Google, другие поисковые машины, например Yahoo!. Наименее популярным сайтам присваивается ранг, равный 1. Если ваш сайт забанен (вы пытались искусственно “накрутить” счетчик популярности Google) или же ваш сайт пока не был ранжирован поисковой машиной, то ему будет присвоен ранг 0.
Чем выше ранг, тем более популярна страница, тем выше место страницы в результатах поиска Google, и ее увидит больше пользователей.
Ранг вашей страницы можно увидеть с помощью утилиты Google Tool Ваr. После установки этой утилиты она интегрируется в ваш браузер и на специальной панели инструментов будет отображен ранг вашей страницы. Ранг страницы отображается не как число, а как особый индикатор “полоса Page Rank”. Если полоса PageRank полностью закрашена зеленым, значит, ранг вашей страницы равен 10, если же полоса вообще не закрашена, ранг равен 0.
Если у вашего сайта довольно высокий ранг и вы хотите показать его остальным пользователям сайта, тогда можно добавить на главную страницу следующий код:
<а href="http://www.prchecker.info/" target="_blank">
<img src="http://www.prchecker.info/PR2_img.gif" alt="Page Rank Tool "border=”0"></a>
Если вам не нравится внешний вид картинки, на странице http://www.prchecker.info/ можно выбрать другой ее вариант.
Самый лучший совет для увеличения ранга страницы – это создать действительно полезный сайт, который будет часто обновляться. Несомненно, многие пользователи проявят интерес к такому ресурсу, это и будет оценено поисковиком.
Примечание: Немного увеличит ранг страницы добавление ее в каталог Google или заказ рекламы вашей страницы в этом поисковике.
Тематический индекс цитирования поисковой системы Яндекс (тИЦ) – это количество внешних ссылок, указывающих на ваш сайт. Яндекс учитывает не только количество таких ссылок, но и их качество.
На качество ссылки влияет тематика сайта, который ссылается на ваш сайт. Если тематика вашего сайта схожа с тематикой сайта, который указывает на вас, то качество ссылки будет выше. При вычислении индекса цитирования не принимаются во внимание ссылки с форумов, конференций, сайтов, расположенных на бесплатных хостингах (если они не описаны в каталоге Яндекса). Также не учитываются ссылки с сайтов, которые не индексируются Яндексом.
По индексу цитирования Яндекс определяет релевантность ресурса в индексе и, следовательно, позицию вашего сайта в поисковой выдаче.