
Интернет-технологии
.pdf
Рисунок 334. Страница с компонентов поиска.
4.используя параметры компонента, можно настроить параметры поиска, например, ограничить область поиск только по типу инфоблока Новости ().
Рисунок 335. Параметры компонента Стандартная страница поиска.
Выполнение переиндексации
Обновление индексных таблиц выполняется с помощью формы Переиндексация сайта
(Настройки > Поиск > Переиндексация) (Рисунок 336).

Рисунок 336. Параметры индексации
Так как на сайте может быть представлен значительный объем информации, процедура переиндексации может занять довольно продолжительное время. Для того что сократить затраты времени, можно выполнить переиндексацию только измененных файлов (1), либо выбрать сайт и/или модуль, данные которых будут участвовать в переиндексации (3).
Индексирование производится поэтапно, продолжительность выполнения одного шага задается в поле Шаг (2).
Также существует возможность удаления поисковых фраз для подсказки (4), которые выводятся системой при заполнении текстового поля поиска.
Примечание: кроме того, ограничения на документы, участвующие в поиске, могут быть установлены в настройках модуля Поиск (Настройки > Настройки продукта > Настройки модулей > Поиск) (Рисунок 337).
Рисунок 337. Настройки параметров модуля «Поиск»
Поле Маска включения позволяет задать маску, по которой будут выбираться документы, участвующие в поиске. В данном случае, в поиске участвуют все файлы с расширением php, html и htm;
В поле Маска исключения определяется условие, на основе которого документы будут исключаться из индекса и поиска. Как видно из рисунка, в состав маски исключения входят системная директория /bitrix/, файл 404 ошибки, раздел авторизации и т.д.

Помимо полей включения и исключения существует возможность указывать максимальный размер индексируемого документа. Пустое значение означает отсутствие ограничения.
Поле Код свойства страницы, в котором хранятся теги позволяет задать значение кода свойства страницы, который будет использоваться для поиска в дальнейшем.
Включение морфологического поиска
Для активизации морфологического поиска нужно отметить соответствующую опцию в настройках модуля Поиск (Настройки > Настройки продукта > Настройки модулей > Поиск >
Морфология) и полностью переиндексировать сайт (Рисунок 338).
Рисунок 338. Настройки параметров морфологии
Алгоритм морфологического анализа разбивает предложения на слова, используя стандартные символы-разделители (пробел, точка, запятая и т.п.). В то же время, существуют символы, которые, не будучи буквами, все же являются частями слов (например, дефис в слове: южно-африканский).
Для того чтобы в подобных случаях разбивка слов не выполнялась, в поле Символы, по
которым не производится разделение документа на слова (при морфологическом анализе)
можно указать символы, которые морфологический анализатор должен рассматривать как части слов.
Выбор пользователем режима сортировки результатов поиска
Пользователь может выбрать режим сортировки на странице с результатами поиска, нажав на одну из двух ссылок в конце списка найденных документов: Сортировать по релевантности или Сортировать по дате (Рисунок 339).

Рисунок 339. Виды сортировки
Создание правил сортировки
Управление правилами сортировки осуществляется на странице Список правил сортировки (Настройки > Поиск > Правила сортировки) (Рисунок 340).
Рисунок 340. Страница «Правила сортировки»
Назначение или изменение правил сортировки делится на два этапа:
первый этап: управление правилами сортировки - создание, правка или удаление правил;
второй этап: обновление поискового индекса для вступления новых правил в силу.

Для создания нового правила служит кнопка Добавить, расположенная на контекстной панели (Рисунок 341).
Рисунок 341. Параметры правила сортировки
С помощью полей формы можно выбрать модуль, для элемента которого будет настроено правило сортировки.
для статических файлов можно указать приоритет для конкретного файла;
для информационных блоков можно указать приоритет для типа инфоблоков, отдельного инфоблока, раздела и элемента инфоблока;
для модуля форумов можно создать правило для форума, темы на форуме или отдельного сообщения (доступно начиная с редакции Стандарт).
При сохранении правило добавляется в общий список (Рисунок 342).
Рисунок 342. Список правил сортировки
После создания нового правила следует выполнить обновление поискового индекса с помощью кнопки Обновить (Рисунок 343).
Рисунок 343. Обновление поискового индекса
По окончании процедуры обновления индекса будет выведено сообщения о ее результатах (Рисунок 344).

Рисунок 344. Индикатор обновления поискового индекса
Примечание: чтобы после редактирования или удаления правил, изменения вступили в силу также нужно выполнить обновление индекса.
Например, пусть при использовании поиска по ключевому слову выставка на странице сайта получаются следующие результаты (Рисунок 345).
Рисунок 345. Результаты поиска по запросу Выставка по элементам инфоблока Новости компании.
То есть на поисковый запрос выставка выдается два элемента из инфоблока, где встречаются релевантные ответы. Предположим, что существует необходимость повысить позицию элемента Выставка «Книжный мир - 2007» в поисковой выдаче. В этом случае следует использовать правила сортировки. Необходимо создать новое правило сортировки со следующими параметрами (Рисунок 346).

Рисунок 346. Параметры нового правила сортировки.
В данном случае для элемента с ID 9 в инфоблоке (Выставка «Книжный мир - 2007») был установлен дополнительный вес 10. При сохранении правила сортировки и последующем обновлении поискового индекса, результаты поисковой выдачи должны быть следующими (Рисунок 347).
Рисунок 347. Результаты применения нового правила сортировки.

Просмотр статистики поисковых фраз
Результаты статистики поисковых фраз отображаются в разделе Статистика (Настройки > Поиск > Статистика). Статистику можно рассматривать в 3 разрезах:
Статистика переходов - развернутый отчет о поисковых фразах, времени ввода, места перехода, количества найденных документов и т.д.
Список фраз позволяет просмотреть список поисковых фраз, используемых людьми на сайте;
Список тегов - перечень установленных тегов сайта.
Задание для самостоятельного выполнения
1.В разделе Наши услуги создайте страницу Поиск по продукции.
2.Добавьте на страницу компонент Стандартная страница поиска.
3.Организуйте поиск только по элементам информационного блока Автомобили.
Контрольные вопросы
1.Какие функции выполняет модуль «Поиск» в «Битрикс: Управление сайтом»?
2.Какие ограничения накладываются на поиск правами доступа пользователя?
3.Какая информация на сайте участвует в индексировании?
4.Каким образом можно сократить время переиндексации в случае большого размера сайта?
5.Чем отличается морфологический поиск от обычного?
6.Какие способы сортировки результатов поискового запроса реализованы в «Битрикс: Управление сайтом»?
Лабораторная работа № 13 «Sitemaps и облака тегов»
Цель
Получить практические формирования sitemaps-файлов и облаков тегов в системе управления контентом «1С-Битрикс: Управление сайтом».
Теоретическое введение
Поисковая система
Поисковая система — программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы [1].
Наиболее популярными поисковыми системами в России являются Google и Яндекс.
Страница результатов поиска — веб-страница, генерируемая поисковой системой в ответ на поисковый запрос пользователя.
Поисковая оптимизация
Поисковая оптимизация (англ. search engine optimization, SEO) — комплекс мер для поднятия позиций сайта в результатах выдачи поисковых систем по определенным запросам пользователей. Обычно, чем выше позиция сайта в результатах поиска, тем больше заинтересованных посетителей переходит на него с поисковых систем *1+.
Мета-теги
Мета-теги (англ. meta-tags) — HTMLили XHTML-теги, предназначенные для предоставления структурированных метаданных о веб-странице. Мета-теги помещаются внутрь тега head в (X)HTML-документе, как правило, после тега TITLE. Мета-теги используются для указания описания страницы, ключевых слов и других данных.
У тега meta допустимы четыре атрибута: content, http-equiv, name и scheme. Из них обязателен только лишь атрибут content.
В общей форме метаданные записываются в следующем виде: в теге meta указывается атрибут name (имя) и связанный с ним атрибут content (содержимое), в котором описывается какой-либо аспект веб-страницы, например, ключевые слова:
<meta name="keywords" content="википедия, энциклопедия" />
Данный мета-тег поисковые системы используют для того, чтобы определить релевантность ссылки. При формировании данного тега необходимо использовать только те слова, которые содержатся в самом документе. Использование тех слов, которых нет на странице, не рекомендуется. Рекомендованное количество слов в данном теге — не более десяти.
Функции мета-тегов достаточно разнообразны, однако на данный момент не существует их четкой стандартизации. Тем не менее, можно выделить несколько основных направлений использования мета-тегов:
1.Мета-теги способны идентифицировать авторство Интернет-страницы, ее адрес, частоту ее обновлений;
2.Мета-теги используются поисковыми системами для индексации и создания заголовков гипертекстовых документов;
3.Не выводясь на экран, мета-теги влияют на режим отображения Интернет-страниц [1].
Sitemaps
Sitemaps (файлы карт сайтов) — это XML-файл с информацией для поисковых систем (таких как Google, Yahoo, Яндекс и др.) о страницах веб-сайта, которые подлежат индексации. Sitemaps может помочь поисковикам определить местонахождение страниц сайта, время их последнего обновления, частоту обновления и важность относительно других страниц сайта для того, чтобы поисковая машина смогла более разумно индексировать сайт.
Использование протокола Sitemaps не является гарантией того, что веб-страницы будут проиндексированы поисковыми системами, это всего лишь дополнительная подсказка для сканеров, которые смогут выполнить более тщательное сканирование сайта.
Формат протокола Sitemap состоит из XML-тегов. В файле необходимо использовать кодировку UTF-8.
Пример sitemaps-файла:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url>
<loc>http://example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority>
</url>
</urlset>
Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 10 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы его размер не превышал 10 МБ, и тем самым уменьшить требования к пропускной способности канала.
Рекомендуется располагать файл Sitemap в корневой директории сервера, чтобы ссылка выглядела так: http://example.com/sitemap.xml
Google Sitemap
Google Sitemap - инструмент управления доставкой информации о страницах сайта в базу данных Google, одной из самых мощных и популярных поисковых систем. Применение Google Sitemap особенно важно для динамических сайтов, страницы которых генерируются автоматически, поскольку это гарантирует наличие информации обо всех страницах сайта в базе данных Google.
Облако тегов
Облако тегов, Облако меток, или Облако ключевых слов (англ. tag cloud, wordle) — визуальное представление списка ярлыков (или категорий). Частота упоминаний, поисков, ссылок в интернете с определённого сайта неких слов, терминов, имён отображается в специальной