Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие 3000166.doc
Скачиваний:
59
Добавлен:
30.04.2022
Размер:
668.67 Кб
Скачать

Тема 13. Поиск информации в сети Интернет

Деятельность PR-специалиста — это определенный системный процесс, предполагающий последовательность различного рода операций, управленческих и коммуникационных. Однако чем бы ни занимался PR-специалист, если он не владеет методами и способами получения информации из Интернета, результаты его деятельности будут не столь эффективны.

Довольно легко вести поиск, направленный на получение информации о какой-либо персоне, о бренде, об организации, ее партнерах и конкурентах. Надо только уметь правильно искать эту информацию, а для это необходимо научиться грамотно формулировать запрос для поисковой системы.

Существует три вида поиска в Сети.

Информационный поиск осуществляют пользователи, которые действительно ищут необходимую им информацию в Сети. Они формулируют запрос так же, как в обычной речи, например: «Низкий гемоглобин». Это очень близко к классическому информационному поиску.

Навигационный поиск применяется, когда пользователь хочет попасть на определенный веб-сайт. При этом формулируется, например, такой запрос: «РосБизнесКонсалтинг». В этом случае то, что он действительно хочет найти, должно находиться непосредственно на сайте РосБизнесКонсалтинга (www.rbc.ru).

Деловой поиск осуществляется в том случае, если пользователь хочет сделать что-либо с помощью сети. Например это поиск интернет-магазина с целью покупки.

Поисковые машины

Чтобы понять, как происходит поиск в Сети и как его результаты появляются на странице при указании определенного ключевого слова, необходимо прежде всего понять, на чем базируется работа поисковых машин.

Поисковая машина — это комплекс программ, предназначенных для поиска информации, обычно являющийся частью поисковой системы. Поиско́вая систе́ма, в свою очередь, представляет собой веб-сайт, позволяющий осуществлять поиск информации в Интернете.

Поисковые системы состоят из пяти отдельных программных компонентов:

1) система выдачи результатов — извлекает результаты поиска из базы данных;

2) паук — программа, которая скачивает веб-страницы;

3) краулер — программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Следуя по найденным ссылкам, краулер осуществляет поиск новых документов, еще не известных поисковой системе;

4) индексатор — разделяет страницу на части (заголовки страниц, заголовки в тексте страницы, ссылки, собственно текст и его структурные элементы и др.) и анализирует их;

5) база данных — хранилище всех данных, которые поисковая система скачивает и анализирует.

Выделяют два типа поисковых машин (ПМ):

— индексные — Google, AltaVista, Рамблер, Апорт и др.;

— классификационные (каталоговые) — Рамблер, Yahoo и др.

По мнению исследователей, некоторые машины могут являться одновременно и индексными, и каталоговыми. Индексные поисковые машины индексируют информацию — заносят в свою базу данных ключевые слова той или иной страницы. Классификационные ПМ работают по принципу тематического каталога.

Поисковые машины не ищут сайт сразу при введении ключевого слова, они не просматривают сразу весь Интернет. Поиск осуществляется только в пределах собственной базы данных определенной поисковой машины. Крупные поисковики собирают информацию подобно каталогу в библиотеке. Базы данных поисковых машин постоянно обновляются.

Приоритет поисковых машин — обнаружение и индексация релевантных страниц (от англ. relevant — относящийся к делу). ПМ выдают страницы по степени релевантности, т. е. точности найденной информации запросу пользователя.

Поисковые алгоритмы (математические методы программирования, сортирующие найденные результаты) каждого из поисковых сервисов уникальны. В этом можно убедиться, введя ключевое слово или фразу, например, в поисковую систему www.yandex.ru и запомнив результаты, а затем повторив то же самое на www.rambler.ru или www.google.ru. В разных поисковых машинах полученная информация будет различна. Учитывая этот факт, к поиску в различных поисковых системах следует подходить по-разному, применяя индивидуальный подход.

Google. Чтобы ввести запрос, следует напечатать ключевые слова и нажать ENTER либо щелкнуть кнопку «Поиск в Google». Система Google использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы в соответствии с запросом. Для этого Google анализирует не только саму страницу, которая соответствует запросу, но и те страницы, на которых имеются на нее ссылки, чтобы определить ценность этой страницы для целей запроса. В настоящее время Google становится все более популярным поисковым сервисом.

Google реализует алгоритм ранжирования сайтов, который включает в себя более 100 различных критериев. Наиболее важными для Google в настоящее время являются следующие.

1. Ранжирование страницы — это абсолютная величина, которая регулярно вычисляется Google для каждой страницы, внесенной в его индекс. Необходимо помнить, что весьма важно количество и качество ссылок, ведущих с других сайтов. Последнее означает, что для увеличения удельного веса сайта связанные с ним сайты должны иметь высокий уровень ранжирования станицы, быть богатыми контентом и регулярно обновляемыми.

2. Мини Ренк / Локал Ренк (MiniRank / LocalRank) — это модификация Пейдж Ренк (PageRank), основанная на структуре ссылок единственного сайта. Так как поисковые машины ранжируют страницы, а не сайты, некоторые страницы будут ранжироваться с данными ключевыми словами выше, чем другие. Локал Ренк существенно влияет на общий Пейдж Ренк.

3. Текст ссылок (Anchor-текст) — это содержимое ссылок, ведущих на страницу.

4. Семантика — новый фактор, который приводит к наибольшим различиям в результатах. Это понятие относится к значению слов и их взаимоотношению. Согласно принципам прикладной семантики, краулер пытается определить, какие слова имеют одно и то же значение и какие всегда используются вместе.

Поисковый результат, выдаваемый Google, складывается из следующих факторов:

— Page Rank страницы;

— ключевые слова в Anchor-тексте (тексте ссылок);

— плотность ключевых слов на странице;

— близость ключевых слов друг к другу.

Ключевые слова имеют больший вес, если они выделены полужирным, имеют большой размер либо находятся внутри тэга <Н1>. Здесь следует пояснить, что такое тэги вообще и тэг <Н1>.

Тэги — это метки, которые используются для указания браузеру, как он должен показывать сайт. Все тэги имеют одинаковый формат: начинаются знаком < и заканчиваются знаком >. Тэги позволяют структурировать разрозненную по содержанию информацию. Они представляют собой ключевые слова, связанные с той или иной страницей. Существует несколько основных тэгов, которые должны присутствовать в тексте любой веб-страницы.

Каждая веб-страница обязана содержать тэг <HTML>, располагаемый в самом начале. Непосредственно за дескриптором <HTML> обычно следует тэг <HEAD>, который указывает на наличие текста, содержащего наименование страницы и дополнительные сведения о ней. В раздел HEAD обычно вложен тэг <TITLE>, служащий для обозначения наименования страницы. Затем следует тэг <BODY>, который указывает на начало собственно «тела» веб-страницы. Тэги <H1>..<H6> маркируют заголовки разных уровней.

Вернемся к поисковой системе Google. Google постоянно проверяет качество проиндексированных ресурсов и исключает их из своей базы при нарушении ряда правил — например, если на сайте используется скрытый текст и скрытые ссылки, скрытая переадресация, страницы, субдомены и домены, в значительной степени повторяющие содержание друг друга, и т. д.

Специалисты, в частности известный блогер и автор нескольких книг Евгений Ющук, дают ряд советов по поводу поиска с помощью Google.

Показ ключевых слов в результатах. Каждый раз в списке найденных страниц Google показывает отрывок из текста на странице, выделяя в этом отрывке ключевые слова.

Логическое «и». По умолчанию при написании слов запроса через пробел Google ищет документы, содержащие все слова запроса.

Логическое «или». Пишется с помощью написания логического «или» в виде вертикальной черты (|), подобно тому, как это делается в Яндексе.

Google не чувствителен к регистру букв. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку.

Google, подобно большинству поисковых машин, игнорирует стоп-слова. И, как и многие другие, имеет механизм принудительного включения стоп-слов в результаты поиска. К стоп-словам относятся большинство артиклей английского языка, союзов и предлогов русского языка.

Дополнительные операторы. Существенно расширяет возможности поиска использование специальных операторов:

— cache: поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию

страницы можно извлечь, если оригинальная страница недоступна (например, не работает сервер, на котором она хранится). Кэшированная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и сопровождается надписью наверху страницы о том, что это страница из кэша. Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом. Например, запрос [cache:www.jf.pu.ru] будет сразу выдавать версию страницы www.bstm.ru из кэша, а не проверять ее нынешнее состояние;

— info: позволяет увидеть информацию, которая известна Google об этой странице;

— site: ограничивает поиск конкретным доменом, т. е. если сделать запрос [учебные программы site:www.pu.ru], результаты будут получены со страниц, содержащих слова «учебные» и «программа» именно в домене pu.ru, а не в других частях Интернета;

— define: этот оператор выполняет роль своего рода толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.

Yandex. Поисковый робот Yandex индексирует страницы и на основании информации на них формирует поисковый индекс.

Система Yandex содержит в своем индексе следующие сведения о каждом слове текста:

— номер документа;

— номер предложения;

— номер слова в предложении;

— вес каждого слова.

Вся эта информация используется при поиске. При каждом запросе ищутся (и получают более высокий ранг) фразы, точно совпадающие с запросом, затем предложения, содержащие все слова запроса, и т. д. Важную роль играет относительное положение слов. Так, если запрос из четырех слов не имеет точного ответа в базе данных, будут отранжированы выше предложения, содержащие три слова из запроса, в которых слова стоят точно в той же последовательности, что и в запросе. Это дает возможность решить типичную поисковую задачу — искать документ по «неточному цитированию».

Важными тэгами для определения релевантности документа являются (в порядке значимости) слова, содержащиеся в тэгах <TITLE >, подписи к рисункам, а также текст документа.

Yandex подсчитывает так называемый ТИЦ — тематический индекс цитирования сайта. Однако этот параметр влияет не на результаты выдачи, а только на позицию сайта в каталоге Yandex.

При ранжировании результатов поиска используется ВИЦ — взвешенный индекс цитирования сайта, учитывающий тематический вес сайтов, содержащих ссылки. Робот Yandex хорошо умеет определять кодировку документа, а также индексировать следующие форматы документов: HTML, PDF, DOC, RTF и Flash.

Кроме того, существует ряд особенностей этой поисковой системы.

1.Yandex индексирует российскую сеть, поэтому в поисковую машину вносятся серверы в доменах su, ru, am, az, by, ge, kg, kz, md, ua и uz. Остальные серверы вносятся, только если на них найден текст на русском языке.

2. Переиндексация документа происходит примерно раз в две недели, но под каждый сайт робот подстраивается в отдельности. Все зависит от частоты обновления.

3. Информацию в заголовке (тэг <TITLE>) Yandex отображает в результатах поиска. Слова, находящиеся в тэге <TITLE >, имеют больший вес, чем все остальные. Если в заголовок включается ключевое слово страницы, у нее появится шанс оказаться выше в списке при поиске по данному ключевому слову.

Помимо перечисленных способов на релевантность слова влияет частота его использования в заголовках, во всплывающих подсказках и в тексте документа.

Вот какие советы по поиску информации дают специалисты поисковой системы Яндекс (http://yandex.ru/info/search2.html).

Проверяйте орфографию.

Используйте синонимы.

Ищите более чем по одному слову.

Не пишите большими буквами.

Используйте ссылку «Найти похожие документы».

Используйте знаки «+» и «–».

Mail.ru — национальная почтовая служба и поисковик.

Mail.Ru Group — крупнейшая интернет-компания в русскоязычном сегменте Сети и лидирующий игрок Рунета по числу ежемесячных уникальных посетителей. В состав Mail.Ru Group входит самый популярный в России сервис бесплатной электронной почты и два крупнейших в Рунете инстант-мессенджера — Mail.Ru Агент и ICQ. Компания оперирует двумя ведущими российскими социальными сетями: MoйМир@Mail.Ru и Одноклассники.ru, а также сети Вконтакте.

Кроме того, Mail.Ru Group развивает популярные и востребованные проекты направления E-commerce, среди которых стоит отметить платежную систему Деньги@Mail.Ru, представляющую собой комфортный и быстрый способ оплаты товаров и услуг.

Более 40 тематических медиа-проектов компании, ориентированных на различные категории пользователей, являются лидерами в своих сегментах и обеспечивают максимум информации по широкому кругу популярных у аудитории тем.

Mail.Ru Group — ведущий игрок рынка онлайн-игр, оперирующий многочисленными играми для социальных сетей, как созданных внутри компании, так и полученных по лицензии. В портфолио Mail.Ru Group входят более 30 игр для социальных сетей и 34 MMO-игры (по данным за август 2010 г.).

Рамблер (rambler.ru) — первая поисковая система русскоязычного сегмента сети Интернет, созданная в 1996 г. разработчиками из подмосковного Пущино. Со временем, добавив поисковые, почтовые и другие сервисы, из локальной городской сети «Рамблер» стал одним из лидеров по предоставлению медиа- и интернет-услуг русскоязычной аудитории Интернета во всем мире.

«Рамблер» сегодня — это портал, предоставляющий пользователям разнообразные качественные сервисы в сфере навигации, коммуникаций, медиа и развлечений в Интернете. В 2009 г. «Рамблер» стал обладателем «Премии Рунета» в номинации «Культура и массовые коммуникации». В 1991 г. в подмосковном городе Пущино сформировалась группа единомышленников, вдохновленных только что появившейся коммуникационной средой Интернета. Дмитрий Крюков, Сергей Лысаков, Виктор Воронков, Владимир Самойлов, Юрий Ершов — именно эти технически подкованные, творческие и смелые люди с активной жизненной позицией и стремлением к новому стали основателями «Рамблера». Компания «Стек» во главе с Сергеем Лысаковым занялась локальными сетями и подключением к Интернету. Нормальный, оперативный и эффективный обмен данными был необходим для реализации научных целей. «Стековцы» сами создали внутри города сеть, подключили Пущино к Москве и через нее — к мировому Интернету (это был первый IP-канал в России, выходящий за пределы Москвы), присоединились к сети Курчатовского института атомной энергии. В 1992 г. компания запустила собственные ftp- и mail-серверы. Через два года — свой первый www-сервер. 1996 г. — ключевой для развития русского киберпространства. Именно в этом году Сергей Лысаков и Дмитрий Крюков принимают решение разработать первую русскую поисковую систему для Интернета. Команда «Стека» прозорливо сделала ставку на программу-поисковик. Программист Дмитрий Крюков начал с того, что придумал проекту название. Для этого он открыл англо-русский словарь, и взгляд его упал на Rambler. Дмитрию понравилось значение слова «скиталец, странник, бродяга»: роботы поисковой машины действительно ходят по сайтам, собирая информацию круглые сутки, не зная покоя. Через несколько месяцев, к осени 1996 г., был готов окончательный вариант поисковика. 26 сентября был зарегистрирован домен rambler.ru, а 8 октября «Стек» активизировал систему. В тот момент в Рунете уже существовало две-три поисковых машины — но они не выдержали проверки временем и быстро исчезли, а «Рамблер» развивался, эволюционировал, запускал новые полезные сервисы. Но все хорошее когда-нибудь заканчивается. Так произошло и с Рамблером. В 2006 г. он обанкротился. К руководству пришли совершенно иные люди, которые произвели полную перетряску имеющихся ресурсов, постепенно выведя ресурс в режим прибыльной работы. Но время было упущено. Динамичный рынок заняли другие игроки.

Нигма (нигма.рф) — В рамках проекта «Интеллектуальная поисковая система Нигма.РФ» команда программистов работает над созданием системы, построенной на основе разработок в области искусственного интеллекта. Конечная цель проекта — создание поисковой системы, позволяющей анализировать содержание документов и выдавать конкретную информацию на запрос пользователя, а не ссылки на другие сайты.

Разработчиками были созданы такие сервисы, как «Нигмаматематика» (решение математических задач), «Нигма-химия» (решение химических задач), сервис ответов на вопросы пользователей, табличный поиск и многие другие.

Ежедневно пользователи поисковой машины «Нигма.РФ» делают более 1 млн. переходов на сайты, ежемесячная аудитория сайта «Нигма.РФ» составляет более 3 000 000 уникальных посетителей.

Президент компании — Виктор Лавренко — выпускник факультета Вычислительной математики и кибернетики (ВМиК) Московского государственного университета им. М.В. Ломоносова, ранее работавший в компании «Mail.ru» в должности вице-президента по стратегии и финансам.

Генеральный директор компании — Владимир Чернышов — выпускник ВМК МГУ и Stanford University, — начал работу над поисковой системой «Нигма.РФ» будучи еще студентом-старшекурсником. Научный руководитель проекта в МГУ им. М.В. Ломоносова — чл.-корр. РАН, зав. каф. АСВК факультета ВМиК МГУ им. М.В. Ломоносова — Л.Н. Королев.

Научный руководитель проекта в Stanford University — Гектор Гарсия Молина.

Нигма отвечает на вопрос еще до того, как пользователь введет его в строку поиска. Если пользователь начинает вводить запрос в Нигму, то она не просто предлагает варианты запросов, но мгновенно выдает ответ на вопрос справа от каждого варианта.

Как это работает?

1. Ответы на вопросы

1.1. Короткий запрос

Если ввести короткий запрос в строку поиска, то система сама подберет похожие варианты.

1.2. Энциклопедическая справка

Также если подвести указатель мыши к интересующему результату выдачи из автозаполнения, то выйдет подсказка с энциклопедической информацией.

1.3. Точный запрос

Если ввести более точный (подробный) запрос, то система выдаст подробную информацию об объекте поиска.

2. Цена и характеристика товаров

Набирая в поисковой строке Nigma названия товаров, пользователи видят их минимальную стоимость, даже не нажимая кнопку «Найти».

2.1. Название товара

Если начать набирать в строке поиска название товара, то сразу выйдет автозаполнение с ценами.

2.2. Категория товаров

Для наиболее востребованных категорий товаров поисковая система составляет списки, в первую очередь, предлагая самые дешевые и популярные.

Интернет-каталоги

Каталог сайтов Интернета, или каталог интернет-ресурсов, или просто интернет-каталог (англ. web directory), — структурированный набор ссылок на сайты с кратким их описанием. Сайты внутри каталога разбиваются по темам, а внутри тем могут быть ранжированы или по индексу цитирования (как в каталогах Яндекса или Google), или по дате добавления, или по алфавиту, или по другому параметру. Это один из старейших сервисов Интернета. Подавляющее большинство рейтингов посещаемости ресурсов имеют классификатор сайтов, но ранжирование всегда основано на посещаемости сайтов. В зависимости от широты тематики ссылок каталоги могут быть общими и специализированными (тематическими).

Каталоги подразделяются на две большие группы: глобальные и русскоязычные каталоги. К первой группе относятся следующие каталоги.

Open Directory Project, также известный как DMOZ — (от одного из своих первых доменных имен directory.mozilla.org) — многоязычный свободный каталог ссылок на сайты всемирной паутины, принадлежащий AOL, поддерживаемый виртуальным сообществом добровольных редакторов. Открытый Каталог был основан Ричардом Скрентой и Бобом Труелом. Его запуск состоялся 5 июня 1998 г. На первых шагах проект был известен как GnuHoo, NewHoo или же ZURL.

На 2008 г. в публичной части Открытого Каталога описано порядка 5 млн сайтов, находящихся в более чем 700 тыс. подразделах, созданы и размещены 79 языковых разделов, а 96 находятся в подготовительной стадии. За время существования в проекте приняли участие почти 90 тыс. редакторов. Раздел для сайтов на русском языке занимает 9-е место среди самых больших языковых разделов в Каталоге.

Известен также крупный проект, вдохновленный идеями и успехом Открытого Каталога, имеющий русскоязычную часть, — свободная энциклопедия Open Encyclopedia Project.

Каталог Yahoo! (http://dir.yahoo.com/) — поисковый каталог, организован в 2002 г. В настоящее время является одним из самых популярных в мире.

Содержит следующие директории: Arts & Humanities (Photography, History, Literature...), Business & Economy (B2B, Finance, Shopping, Jobs...), Computers & Internet (Hardware, Software, Web, Games...), Education (Colleges, K-12, Distance Learning...), Entertainment (Movies, TV Shows, Music, Humor...), Government (Elections, Military, Law, Taxes...), Health (Diseases, Drugs, Fitness, Nutrition...), News & Media (Newspapers, Radio, Weather, Blogs...), Recreation & Sports (Sports, Travel, Autos, Outdoors...), Reference (Phone Numbers, Dictionaries, Quotes...), Regional (Countries, Regions, U.S. States...) Science (Animals, Astronomy, Earth Science...), Social Science (Languages, Archaeology, Psychology...), Society & Culture (Sexuality, Religion, Food & Drink...) New Additions.

AboutUs.org (http://www.aboutus.org/) — Интернет-каталог веб-доменов, выполненный по технологии «вики». Основная цель AboutUs.org состоит в накоплении информации обо всех веб-сайтах в Интернете. Сайт создан на движке MediaWiki и это позволяет зарегистрированным пользователям изменять и дополнять статьи о разных сайтах.

Сайт AboutUs.org был создан командой, состоящей из пятерых человек. Сейчас штат сайта возрос до 30 человек и распределился на два континента: офис в Лахоре (Пакистан) и в Портленде (США). В мае 2007 г. Уорд Каннингем (Ward Cunningham), изобретатель технологии вики, вступил в AboutUs в качестве технического директора (CTO). В июле 2008 г. на сайте было зафиксировано 1,4 млн посетителей из США.

Каталог@mail.ru (http://list.mail.ru/index.html#) — каталог, созданный в результате покупки в 2002 г. крупнейшего на тот момент каталога list.ru. Благодаря этому он стал самым крупным каталогом и рейтингом российского Интернета. На сегодняшний момент это не просто интернет-каталог и самая большая почтовая служба Рунета — это гигантский информационный портал с большим количеством уникальных и пользующихся популярностью сервисов.

Яндекс.Каталог (http://yaca.yandex.ru/) — каталог, содержащий описания 102 577 сайтов, предоставляющий те или иные услуги, коллекция аннотированных ссылок на сайты, которую вручную собрали редакторы. Цель Каталога — предложить пользователю представительную подборку сайтов в каждой рубрике и облегчить поиск информации в Интернете. Для этого в Каталоге используется не только обычная тематическая рубрикация (Развлечения, Спорт, Работа и пр.), но и типовая (Товары и услуги, Советы и пр.) и географическая.

Каталог является рейтингом описанных в нем ресурсов. Сайты в рубриках расположены по убыванию их тематического индекса цитирования (тИЦ). Размещение сайта в каталоге обойдется в 12 500 руб.

Базы данных и энциклопедии

В данном случае мы видим прямой перенос докомпьютерных технологий в Сеть. Задолго до того, как появились глобальные коммуникации и электронные хранилища знаний, применялись разного рода бумажные способы сбора классификации и хранения данных. В частности, огромную роль в человеческой цивилизации играют энциклопедии и картотеки. Интернет сделал и то и другое простым, удобным в обращении глобальным по содержанию.

Мир энциклопедий (www.encyclopedia.ru)

На сайте «Мир энциклопедий» собраны русскоязычные энциклопедические и псевдоэнциклопедические издания (энциклопедии, энциклопедические словари, энциклопедические справочники) и литература и мнения о них читателей.

Аудиторией ресурса являются все интересующиеся энциклопедическими изданиями. Он носит справочно-образовательный статус. Его целями является предоставление системного взгляда на историю, современность и будущее развития русскоязычных энциклопедических изданий, а также сбор и систематизация информации по энциклопедическим изданиям, литературе и мнениям о них читателей (каталоги энциклопедий, энциклопедии, отзывы об энциклопедиях, энциклопедические новости, комментарии к новостям, частные объявления о покупке и продаже энциклопедий). Авторы ресурса: Сергей Волков (автор сайта) и Виктор Гульчинский (автор названия сайта, соавтор сайта на начальном этапе развития).

Рубрикон (www.rubricon.com)

Информационно-энциклопедический проект компании «Русспортал», в рамках которого пользователь получает одновременно удобный инструмент поиска лучших ресурсов сети Интернет и доступ к полным электронным версиям важнейших энциклопедий и словарей, изданных за последние сто лет в России. Прежде всего, это «Большая советская энциклопедия» (БСЭ). Здесь публикуется текст ее последнего, третьего издания, выходившего в 1969–1979 гг. Пользователь также найдет на сервере несколько энциклопедических изданий: «Иллюстрированный энциклопедический словарь» (1998), «Энциклопедический словарь Брокгауза и Ефрона» (1890–1906), Малая медицинская энциклопедия, «Толковый словарь живого великорусского языка» Владимира Даля (1863–1866), «Рок-энциклопедия» Сергея Кастальского (1998), Энциклопедический словарь «История Отечества», Энциклопедический словарь «Всемирная история», Всемирный биографический энциклопедический словарь, Популярная художественная энциклопедия, Энциклопедия «Москва» и др. Кроме того, на сайте можно найти электронные версии нескольких десятков энциклопедий и словарей.

Его девиз — «Река информации».

Мегаэнциклопедия «Кирилла и Мефодия» (http://mega.km.ru)

Интернет-проект KM.RU, разработанный компанией «Кирилл и Мефодий», стартовал в 1998 г. как справочно-энциклопедический ресурс, предложивший пользователям сети Интернет электронную версию энциклопедий «Кирилла и Мефодия» (MEGABOOK.ru).

С февраля 2001 г. проект развивается в рамках компании «KM онлайн», входящей в группу E-Style. Сегодня KM.RU — это универсальный интернет-портал, предоставляющий своим пользователям всевозможные сервисы, тематические порталы, а также круглосуточно обновляемую ленту новостей. Электронное периодическое издание KM.RU является СМИ и зарегистрировано Министерством РФ по делам печати, телерадиовещания и средств массовой информации.

Развитие мультипортала KM.RU в первую очередь нацелено на создание максимально комфортной среды для работы с информацией. Эта задача влечет за собой постоянное расширение и углубление контента, оптимизацию системы навигации и интерфейса, развитие все новых и новых сервисов. Ежедневно KM.RU посещает более 400 тыс. человек.

Мегаэнциклопедия является одним из ресурсов, реализованных компанией. Она составлена из десяти тематических энциклопедий (Универсальная, Автомобили, Вооружения, Животные, Здоровье, Кино, ПК, Кулинария, Музыка, Туризм) и двух словарей, выпущенных «К&М» сначала на CD-ROM2ах, а потом и онлайн.

Рассматривая интернет-энциклопедии невозможно пройти мимо Википедии (http://ru.wikipedia.org/wiki/)

15 января 2001 г. она была официально открыта. Джимми Уэйлс и Ларри Сэнгер предложили идею, заключающуюся в свободном размещении в Интернете словарных статей по самым различным отраслям знаний при минимальном количестве ограничивающих положений. Википедия, действительно, очень быстро завоевала популярность и международное признание. Первый домен, зарезервированный для неанглийской Википедии был deutsche.wikipedia.com (16 марта 2001 г.). В том же году появляется французская Википедия. А дальше — по нарастающей: китайский, нидерландский, эсперанто, иврит, итальянский, японский, португальский, русский, испанский, шведский, арабский и венгерский. С 2007 г. приблизительно 75% всех статей находились в пределах неанглийских разделов Википедии.

В декабре 2002 г. был создан первый родственный проект — Викисловарь. Он использует то же программное обеспечение, что и Википедия. 20 июня 2003 г. основаны Фонд Викимедиа и создан Викицитатник. Месяц спустя запущен «Wikibooks». 15 августа 2006 г. Фонд Викимедиа запускает Викиверситет.

Википедия стала реальным воплощением концепции выноса вовне интеллектуального ресурса цивилизации и тем самым стала первым практическим шагом к созданию «облаков» и «цифровой вселенной».

Видное место в Рунете занимает Библиотека Мошкова (www.lib.ru), в которой хранится бесчисленное количество литературных произведений на русском языке и других языках мира. Существует с 1994 г. Дизайн сайта с тех пор существенно не меняется по идеологическим соображениям. Отличается от прочих библиотек Рунета тем, что там находятся только юридически чистые тексты. Все современные авторы дают письменное согласие на их размещение в библиотеке. Отличается наличием большого количества «зеркал» и побочных сайтов, находящихся на одной платформе. Среди минусов — все тексты классических произведений получены путем сканирования бумажных версий, поэтому в них бездна грамматических и орфографических ошибок, а также ляпов и очевидных нелепостей.

Особое место занимают среди всех указанных источников информации юридические базы данных.

КонсультантПлюс (http://www.consultant.ru/)

Компания «Консультант Плюс», образованная в 1992 г., является разработчиком компьютерной справочной правовой системы КонсультантПлюс. Система КонсультантПлюс содержит свыше 5 800 000 документов.

Общероссийская Сеть распространения правовой информации КонсультантПлюс состоит из 300 региональных информационных центров, расположенных в крупных городах, и более 400 сервисных подразделений в небольших населенных пунктах. В настоящее время клиентами КонсультантПлюс являются более 300 000 организаций во всех регионах страны.

Все документы справочно-правовой системы распределены по следующим разделам: законодательство (Федеральное законодательство, Законодательство 83 субъектов РФ — 3 660 114 документов), судебная практика (Подборки судебных решений, Документы высших судебных органов, Практика Федеральных арбитражных судов всех 10 округов, Арбитражная практика округов по налоговым спорам, Судебные акты всех 20 арбитражных апелляционных судов, Решения арбитражных судов первой инстанции, судов общей юрисдикции разных субъектов РФ — 1 685 149 документов), финансовые и кадровые консультации (Путеводитель по налогам, Путеводитель по сделкам, Путеводитель по кадровым вопросам, Консультации в форме «вопрос-ответ», Схемы бухгалтерских проводок, Формы первичных учетных документов, Статьи из бухгалтерской прессы и книги — 271 596 документов), комментарии законодательства (Постатейные комментарии к законам и кодексам, Книги, монографии, учебные пособия, Статьи из юридической прессы, Консультации для юристов в форме «вопрос-ответ», Путеводители по судебной практике — 51 450 документов), формы документов (Формы типовых документов — договоров, заявлений, деклараций и т.д. — 57 400 документов), законопроекты (Тексты законопроектов и сопроводительные материалы, Организационные документы Государственной Думы ФС РФ — 79 550 документов), международные правовые акты (Международные договоры РФ со странами дальнего и ближнего зарубежья (СНГ) — 17 050 документов), правовые акты по здравоохранению (Нормативные документы по здравоохранению, Официальные справочники-реестры, Консультационные материалы по медицине и фармацевтике — 40 950 документов), технические нормы и правила (Нормативно-техническая информация по строительству — 13 500 документов). Новый раздел — консультации для бюджетных организаций (Путеводитель по бюджетному учету и налогам, Вопросы-ответы (бюджетные организации), Корреспонденция счетов (бюджетные организации), Пресса и книги (бюджетные организации) — 14 650 документов).

Характерной чертой данной базы является классификатор, который будучи сначала применен здесь, затем был распространен на все российское законодательство.

Гарант (www.garant.ru)

«Гарант» — основоположник сферы информационно-правовых услуг, на протяжении многих лет работы заслуженно занимающий в ней лидирующие позиции. Стремясь обеспечить профессионалов в области финансов и юриспруденции необходимой в их работе правовой информацией, компания смогла достичь поставленной цели и предоставить пользователям актуальные тексты документов и удобные инструменты работы с ними.

Уверенно удерживая позицию технологического лидера, «Гарант» постоянно расширяет спектр правовой помощи, предоставляя комплексное высокотехнологичное информационно-правовое обеспечение для юристов, бухгалтеров, руководителей и кадровых работников. Одна из самых крупных в Рунете баз юридических документов. По содержанию — полный аналог «Консультанта», но отличается способом внесения обновлений: сначала удаляется вся база, затем устанавливается новая. Иногда это может быть неудобным и сильно загружает сети.

Информационные агентства

Самое широкое развитие благодаря Интернету получили информационные агентства. Если в досетевую эпоху в стране было два информагентства: ТАСС и АПН, — то с конца 1990-х гг. их число стремительно увеличивается, достигнув количества нескольких тысяч.

Первое место по широте тематического охвата, по оперативности и глубине анализа, а также по использованию инновационных средств иллюстрирования информации и созданию принципиально новых информационных ресурсов, занимает РИА «Новости» (www.ria.ru).

До 2004 г. это агентство влачило, прямо сказать, достаточно жалкое существование на обломках государственного Агентства печати «Новости» (АПН), предназначенного для работы на заграницу, но с началом новой эпохи оставшегося не у дел. Помещения сдавались в аренду разного рода конторам, на оборудовании АПН снимались развлекательные телепередачи, новостную ленту читать не хотелось.

Все изменилось с приходом новой команды во главе со Светланой Миронюк. Под их началом РИА «Новости» стало ведущим мульти-медийным информационным агентством в России. Тексты, фотографии, инфографика, аудио, видео, анимации и карикатура — все эти современ-ные и традиционные форматы широко используются агентством для оперативного освещения событий в России и за рубежом. Современный мультимедийный ньюсрум агентства, запущенный в январе 2008 г., не имеет аналогов в России и является воплощением самых передовых технологий сбора, обработки и выпуска новостной информации.

РБК (Росбизнесконсалтинг) (www.rbc.ru)

До недавнего времени — лидер российского медийного интернет-пространства. Было создано в 1998 г. как агентство для сбора и распространения деловой информации и раскрытия отчетных данных компаний для акционеров. Росту популярности агентства помог финансовый кризис 1998 г., когда число читателей его совершенно деловой и «неинтересной» информации достигало сотен тысяч в сутки. Следующим ключевым этапом стал пожар на Останкинской телебашне в августе 2000 г., когда на бóльшей части страны прекратилось вещание центральных телеканалов, и все кинулись за новостями в Интернет. Нагрузка была такой, что центральный сервер РБК несколько раз «падал», не справляясь со всеми запросами. Благодаря стремительному росту доходов от рекламы РБК приобрел достаточный запас прочности для развития. Произошло объединение с Bloomberg’ом, что позволило РБК выйти на мировую арену.

В настоящее время РБК — это информационный холдинг мирового уровня, объединяющий собственно информационное агентство, печатные издания, телевидение, хостинг-центр и службу интернет-разработок (одну из лучших в стране).

Интерфакс (www.interfax.ru)

Одно из первых независимых информационных агентств в России. С 2006 г. является партнером Thomson Reuters, подразделение Thomson Corporation, ведущего поставщика информации и технологических решений для международного финансового сообщества. К сожалению, агентство не сумело удержаться в лидерах российского медийного рынка и сейчас находится в тени более успешных грандов.

ИТАР-ТАСС (www.itar-tass.ru)

Старейшее информационное агентство России, возникшее как региональное отделение агентства Вольфа. Затем оно называлось РОСТА (Российское телеграфное агентство), затем ТАСС (телеграфное агентство Советского Союза), наконец, в 1994 г. получило нынешнее название.

Всегда было официальным средством информации высших органов государственной власти. Особое значение всегда придавалось надежности связи с региональными отделениями и структурами власти, даже за счет некоторого пренебрежения скоростью передачи информации. В силу этого безнадежно проигрывает соревнование всем российским информационным агентствам, хотя в последнее время совершило немалый путь по превращению в СМИ XXI века.

Кабинеты, блоги и социальные сети.

Кабинеты (профили или профайлы) — существенная часть отдельного сайта, выделенная и обособленная его зона, в которой владелец кабинета самостоятельно размещает ту или иную информацию по собственному усмотрению. Кабинетами являются, например, личные ресурсы РИА «Новости». Для примера можно привести ресурс http://www.rian.ru/authors/troitsky/ Н.Я. Троицкого. То есть, ресурс полностью размещен на платформе РИА «Новости». Автор к тому же является его штатным сотрудником. Он доказал, что общий уровень его публикаций выше среднего по агентству и потому ему разрешили работать не в режиме «братская могила», а под собственным брендом.

Такие же блоги (они же кабинеты) есть и в других СМИ, например в «Эхо Москвы».

Блоги являются одним из самых замечательных изобретений Интернета. Все они являются составной частью блогосфер — открытых интернет-платформ, предоставляющих возможности для полного самовыражения. В настоящее время существуют следующие блогосферы: исторически первая — Livejournal, затем Liveinternet.ru и Diary.ru. В настоящее время свои блоговые сервисы предоставляют все поисковые машины: Блоги@mail.ru, блоги на Яндексе, блоги на Рамблере, блоги на Google и т. д.

Блоги бывают разные: личные (персональные, авторские, частные), псевдонимные или «призрачные», коллективные или социальные, корпоративные, рекламные и т. д. Существует сервис микроблогов Twitter, сервис фотоблогов, набирающий популярность в последнее время, Instagram.

Особое место в Интернете занимают социальные сети. С технической точки зрения это — глобальные кабинетные сервисы, пользователям которых предоставляется право самостоятельно определять свой круг общения в рамках этого сервиса. Кабинеты в социальных сетях называются аккаунтами. Крупнейшей социальной сетью в мире является Facebook, число аккаунтов которого превышает 500 миллионов. В России с огромным преимуществом лидирует социальная сеть ВКонтакте.

С помощью Интернета можно просматривать материалы других СМИ. Существует несколько путей, как это сделать. Самый простой — составить список веб-адресов приоритетных СМИ. Достаточно воспользоваться системой поиска по сайту, введя нужное ключевое слово. Через несколько секунд поиск выдаст список упоминаний ключевого слова в данном издании. Для тех, кому такой путь мониторинга СМИ покажется слишком долгим, существуют специализированные интернет-службы, которые позволяют просматривать десятки и сотни печатных СМИ по одному веб-адресу. Например, на сайте Публичной интернет-библиотеки (http://www.public.ru) находятся архивы огромного количества газет и журналов. Следует обращаться и к таким крупным медийным информационным системам, как «Медиалогия» (www.medialogia.ru) и «Интегрум» (www.integrum.ru). Если необходимо просмотреть информацию из зарубежных средств массовой информации, лучше всего использовать службу Lexis-Nexis (www.lexis-nexis.com).

В настоящее время делаются активные попытки использовать потенциальные информационно-коммуникационные возможности блогосферы для осуществления массово-информационной деятельности. С этой точки зрения представляется возможным предложить в качестве теоретического проекта блогово-кабинетный информационный сервис (БКИС).

Он представляет собой логически завершающий этап построения социальных информационных сетей. БКИС предназначен для создания информационных материалов на основе публикаций в блогах и в личных кабинетах пользователей. Редакции СМИ становятся информационными аттракторами, агрегаторами (точками сбора информации) от всех возможных источников информации региона. Причем, сами источники размещают свою информацию (тексты, видео, аудио, фото) самостоятельно на своих блогах (в своих кабинетах).

Текст-лидеры (контент-менеджеры, контент-лидеры — в настоящее время терминология только устанавливается) СМИ выбирают самое актуальное и интересное и создают на основе этих материалов тексты требуемых форматов, размещают на страницах региональных изданий или на полосах центрального издания, а также на лентах региональных новостей.

Основным требованием к журналисту сегодня является умение найти интересную информацию и красиво ее подать на страницах издания. Ключевыми фигурами в новой редакции становятся менеджеры по работе с информацией. На них возложена ответственность за новостийный интернет-серфинг и работу с поступающей информацией от авторизованных и неавторизованных источников. Как результат их работы формируется некий информационный полуфабрикат, с которым работают редакторы по тем или иным направлениям. Они должны дополнительно проверять эти сообщения, что позволяет с максимальной вероятностью выявлять первоисточник новости и, при необходимости, верифицировать ее с помощью своих агентов (авторизованных партнеров) из числа «гражданских журналистов» или местных СМИ, официальных источников и так далее.

Деятельность таких менеджеров (текст-лидеров) выстроена из четкого понимания того факта, что аудитория перекормлена интерпретациями событий во френдлентах и других медианосителей. Поэтому побеждает в борьбе за внимание читателя то СМИ, которое может быстрее и полнее других давать исчерпывающий анализ, объяснение того, что происходит. В этом роль редакторов (обозревателей) является преобладающей, поскольку ключевой задачей творческих сотрудников СМИ становится не поиск информации, а ее отбор, фильтрация, проверка, объяснение и интерпретация.

Масс-медиа 3.0 призваны не рассказывать новости, они должны их фильтровать и объяснять.

Вопросы для обсуждения:

  1. Каков алгоритм поиска в Интернете информации о конкретных людях, компаниях и товарах?

  2. Назовите и охарактеризуйте мировые поисковые машины.

  3. Назовите и охарактеризуйте поисковые машины Рунета.

  4. Назовите особенности, способности, инструменты Google.

  5. Назовите особенности, способности, инструменты Яндекс.

  6. Как грамотно формулировать вопросы в Google и Яндекс?

  7. Что такое интернет-каталог?

  8. Как структурирована информация в интернет-каталоге?

  9. Назовите глобальные интернет-каталоги.

  10. Назовите русскоязычные интернет-каталоги.

  11. Назовите крупнейшие базы данных и энциклопедии.

  12. Охарактеризуйте базы данных «Медиалогия» и «LexisNexis».

  13. Какие информационные агентства вы знаете?

  14. Как в поиске информации могут быть использованы форумы, чаты, блоги?

  15. Какими базовыми характеристиками (параметрами) должна обладать информация для журналистов?

Практическое задание:

  1. Подберите в Интернете библиографию на заданную тему.

  2. Найдите в Интернете ресурсы об интернет-поиске.

  3. Сравните скорость работы и удобство интерфейса различных поисковых систем.

  4. Сравните точность поиска и количество найденных ресурсов различными поисковиками.

  5. Сравните информацию на одну и ту же тему, полученную из разных источников: базы данных, информагентства, блога.

Список литературы:

1. Амзин А. Новостная интернет-журналистика / А. Амзин. – М.: Аспект Пресс, 2011. – 144 с.

2. Браун М. Методика поиска информации в Интернете / М. Браун. — М.: Новый издат. дом, 2005. — 136 с.

3. Калмыков А.А. Интернет-журналистика: учеб. Пособие / А.А. Калмыков, Л.А. Коханова. — М.: ЮНИТИ, 2005. — 383 с.

4. Калмыков А.А. Медиалогия интернета / А.А. Калмыков. – М.: Либроком, 2013. – 272 с.

5. Лукина М. СМИ в пространстве Интернета / М.М. Лукина, И.Д. Фомичева. — М.: Изд. фак. журналистики Моск. гос. ун-та, 2005. — 87 с.

6. Интернет-СМИ. Теория и практика// А. Алексеева [и др.]. – М.: Аспект Пресс, 2010. – 350 с.

7. Перевалов В.В. Основы интернет-журналистики: учеб. пособие / В.В. Перевалов. - М.: МГУП имени Ивана Федорова, 2012. — 232 с.