Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ВКР.docx
Скачиваний:
33
Добавлен:
20.03.2016
Размер:
1.28 Mб
Скачать

1.4 Продвижение информационного портала

На первый взгляд интернет СМИ, а также онлайновые версии печатных изданий имеют огромное преимущество перед типичными сайтами, разработчики обычных сайтов испытывают «контентный голод», то в новостных онлайн-проектах, контент присутствует в огромных количествах.

Исходя из этого, даже неоптимизированный сайт СМИ должен получать много посетителей из поисковиков по множеству низкочастотных запросов, если его страницы хорошо индексируются поисковыми роботами.В большинстве случаев, так оно и есть.

Но существуют определенные сложности. Во-первых большинство СМИ, кроме узкоспециализированных, пишут «обо всем и ни о чем», поэтому семантическое ядро для такого сайта обычными методами составить практически невозможно. Оно получается слишком обширным, так как СМИ охватывает практически все области человеческих интересов. Поисковый трафик для таких интернет СМИ малоэффективен и практически является нецелевым.

Во-вторых, новостные сюжеты актуальны от силы двое или трое суток. Бывают и «долгоиграющие сюжеты», но это исключения. Нужно успеть донести сюжет до аудитории через поисковые машины за то время, пока актуален материал.

Пути решения каждой из указанных проблем:

  • Ускорить индексацию СМИ;

  • Составить для СМИ семантическое ядро;

  • Отредактировать сайт для лучшей индексации.

  1. Ускорение индексации СМИ. Для начала следует разобраться, чем сайты СМИ отличаются от обычных сайтов.

Сайты СМИ отличаются характерными признаками:

  • Очень большое количество страниц на сайте;

  • Большое количество разнообразного текстового контента;

  • Быстрое устаревание контента;

  • Быстро меняющаяся первая страница сайта, где чаще всего отображается лента новостей, актуальные темы и часто обновляемый контент.

Ускорить индексацию такого сайта можно с помощью:

Закрытие страниц от поисковых роботов. При публикации одной статьи на сайте СМИ обычно появляется сразу несколько страниц: основная страница статьи, версия для печати, форма «отправить другу», страница комментариев пользователей для данной статьи. Иногда при неправильно спроектированной и реализованной системе публикации контента, страница с новостями появляется одновременно по нескольким адресам.

Из всего вышесказанного можно сформулировать правило для продвижения сайтов СМИ: для ускорения индексации сайта СМИ следует закрывать от роботов поисковых систем неинформативные и служебные страницы.

То есть можно и нужно направлять роботов поисковых систем на основной контент сайта с помощью сужения области индексации. Благодаря этому, роботы не только будут активнее индексировать новые страницы, но и чаще переиндексировать быстро изменяющиеся страницы. Дополнительным плюсом такого подхода будет также снижение исходящего трафика и нагрузки на сервер со стороны всевозможных поисковых роботов.

Обработка информации о датах. Для каждой страницы должна указываться дата ее создания или изменения, причем эта дата должна использоваться не только как время публикации новости, но и как служебная информация при обмене данными между веб-сервером и клиентом браузерами пользователей и поисковыми роботами.

При правильной работе веб-сервера и клиента строго по стандарту, если клиент уже забирал страницу и после этого страница не изменялась, то при повторном запросе той же страницы от того же клиента веб-сервер может просто вернуть специальную служебную информацию и не отправлять повторно саму страницу.

Таким образом, при большом количестве страниц на сайте снижается нагрузка на сервер и уменьшается исходящий трафик. Роботы поисковых систем не запрашивают одну и ту же страницу по многу раз, а обращаются к новым или изменившимся страницам.

На практике, как обычно, все не так просто. Роботы разных поисковых систем по-разному работают с датами изменения страниц. А в некоторых поисковых системах даже корректная работа сервера с датами может привести к недоиндексации – снижению количества запрашиваемых роботом страниц.

Это связано с тем, что чем выше доля неизменных страниц, тем меньше, по мнению поисковой системы, изменяется сайт. А статичные сайты индексируются реже, чтобы сэкономить ресурсы поисковой системы [22].

Создание RSS-потока. RSS-поток (RSS-лента) – это технология, разработанная для получения уведомления о новых материалах на сайте [23]. RSS-поток могут выдаваться полные тексты новостей или статей, поэтому чаще всего даже нет необходимости посещать сайт - достаточно подписаться с помощью браузера или специальной программы на получение RSS-ленты и читать новости с сайта в специальной программе.

Использование RSS-потоков на сайте более чем оправданно, поскольку позволит не только повторно привлекать на сайт активных интернет-пользователей, но и попасть в такие новостные сервисы-агрегаторы, как «Яндекс.новости», «Новотека» и др.

Новостные агрегаторы, наряду с традиционными поисковиками, играют роль генераторов трафика для СМИ, и могут довольно значительно добавить посетителей сайту СМИ, так что необходимо выполнять требования новостных агрегаторов по оформлению контента.

На этапе разработки сайта или запуска RSS-потоков следует связаться с соответствующими сервисами, так как у каждого сервиса могут быть свои требования к RSS. Например, «Яндекс» добавил свой дополнительный тег в разметку RSS-ленты, Новотека просит размещать полный текст материала в теге описания и при этом разбивать его на абзацы и т. д.

RSS-потоки могут также использоваться для ускорения индексации сайта в системах Google и Yahoo.

Важную часть в продвижении сайтов СМИ играют:

  • система публикации и управления контентом;

  • корректная работа «движка» сайта;

  • возможность закрывать неинформативные и служебные страницы от индексации поисковыми системами.

Также не менее важные некоторые другие технологические факторы, например: система управления рекламными баннерами, структура архива новостей, связывание статей в темы и сюжеты.

  1. Составление семантического ядра для СМИ. В первую очередь нужно определить, нужно ли это делать вообще.

Необходимо найти неизменную часть ядра. Неизменная часть семантического ядра существует и для сайта СМИ. Нужно ее определить и отделить от изменяющейся части. Многие сервисы статистики, в частности и «Рамблер» и «Яндекс», дают возможность сравнивать спрос за несколько месяцев. Предпочтение нежно отдовать тем запросам, которые демонстрируют стабильность спроса.

Важно обратить внимание на периодические события. Например, ежегодные отраслевые выставки.

Нужно помнить, что спрос появляется, где то за месяц до подобного события и продолжается также не очень долго по его окончании, то есть низкочастотность запроса в любое другое время еще ни о чем не говорит, важно только наличие его в списке запросов.

Оптимизировать такие запросы, нужно для того, что через год (месяц, квартал и т. п.) все повторится, а оптимизировать уже ничего не будет нужно, разве что поменять дату в «title» соответствующих страниц.

Такие периодические запросы обнаруживают себя, в частности, тем, что в них встречаются указания на годы либо на другие даты.

Нужно обратить внимание на номенклатуру названий. Каждая предметная область использует какие-то «номены» - имена собственные, например: названия компаний, фирм, организаций, торговые марки и т. п.

  1. Внесение изменений на сайте. Изменения будут зависеть от возможностей «движка» на котором расположен сайт СМИ. Идеальным является вариант, когда разработчики вносят изменения в движок в зависимости от специфики текстов конкретного издания по просьбе.

Иногда основную информационную нагрузку способны нести «лиды» или «брифы» (в различных изданиях их называют по-разному) - это краткое содержание или наиболее «ударный» абзац статьи, поэтому логично его использовать для автоматического формирования «title» и описания страницы.

Следовательно, из этого можно сформулировать следующий совет: определите наиболее информационно - ценные части статей конкретного издания,то есть сформулировать правила формирования «title» и описания страницы.

Сформулировать правила для автоматического заполнения нужных тегов. Даже если правила сработают только в части случаев, это более продуктивно.

Есть альтернативное решения, когда теги формируются автоматически в том случае, если это не было сделано вручную. Существуют программы автоматического реферирования текстов, сжимающие текст до нескольких строк, оставляя самые значимые места.

Хороший эффект ссылочного ранжирования дают внутренние ссылки между различными статьями, организовать которые можно по-разному, как в автоматическом, так и в полуавтоматическом режиме.

Для автоматического режима подходят различные сортировки - по рубрике, по дате, по номеру журнала, по сюжетам, связанные статьи и т.п., текст ссылок должен соответствовать тексту «title» статьи. Если решить проблему с информативностью заголовков - это неплохо работает. Нужно проследить, чтобы реализовано это было на прямых ссылках, а не на скриптах и других недоступных для поисковиков методах.

При полуавтоматическом режиме различные статьи перелинковываются по определенным ключевым словам, причем «адресную страницу», на которую ведут ссылки, выбираются исходя из сформированного списка соответствия.

Например, ссылки с текстом «страховая реклама» со всех статьей издания, где эта фраза встречается, ведут на страницу, которую поисковик выбрал наиболее релевантной по этому запросу. При этом желательно соблюдать правила юзабилити по максимальному количеству активных ссылок на одной странице, так как при большом количестве ключевых слов некоторые страницы могут превратиться в сплошные блоки ссылок.

Будет полезна возможность такого же автоматического удаления ссылок по указанному ключевому слову. Второе требование необходимо потому, что самые релевантные страницы на сайте могут изменяться со временем, могут изменяться ключевые слова и т. п. Удалять ссылки вручную - такая же трудоемкая задача, как их размещение.

Еще одной проблемой СМИ является частая смена текстов основных страниц, например главной страницы, где статьи выводятся в виде ленты по рубрикам либо по другому принципу. Между тем постоянные запросы, по которым сайт все же должен находиться, существуют, особенно для отраслевых и тематических изданий.

Решением является использование ключевых слов в тех фрагментах текста, которые не изменяются от номера к номеру, например: названия пунктов меню, рубрик и др. Также неплохо работает включение какого-либо «постоянного» текста как можно ближе к началу документа. Эти слова должны присутствовать в «title» и мета-тегах [24].