Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

учебник по инф. ВАЖНО

.pdf
Скачиваний:
78
Добавлен:
23.05.2015
Размер:
1.43 Mб
Скачать

Рассмотрим некоторые из наиболее распространенных операторов и символов, поддерживаемых АИПС для запроса информации наWWW. Обычно на стартовой странице АИПС есть ссылка на документ, описывающий возможности расширенного (интеллектуального) поиска на основе всех поддерживаемых системой операторов, например, «Апорт изнутри», «Расширенный поиск», «Помощь» в Rambler, ссылка на поисковые системы для тематического каталога Яndex. Поиск информации на других системах, например, в Usenet, FTP, Archie, имеет свои особенности, которые в данном пособии не рассматриваются.

Операторы включения и исключения. Большинство АИПС под-

держивают оба оператора. Оператор включения (знак «+») обозначает, что в результаты поиска необходимо включить веб-страницы, содержащие все перечисленные слова, что позволит сузить поиск до страниц, имеющих общий набор искомых слов-компонентов. Подобный эффект достигается при использовании оператора исключения, который чаще всего обозначается знаком «–». Например,

искусственный + интеллект искусственный + интеллект – игра.

Следует отметить, что запись слов и всех их вхождений в запросе без знака «+» действует точно так же как и она же со знаком в Yahoo!, в Alta Vista идет поиск вхождения только целых слов. Поэтому для поиска всех вхождений слова нужно применить нижеследующий прием.

Многие АИПС поддерживают использование специального символа усечения (wildcard character) – чаще всего символ звездочки «*», который традиционно обозначает неопределенность, усечение термина для поиска всех терминов или фраз, которые начинаются с одного определенного набора букв, например, с другим окончанием. Чаще всего

этот символ подразумевает любое количество букв и может стоять только в конце слова(правостороннее усечение). Так, в последнем примере можно исключить многие страницы, содержащие слова биб- лиотек-а (-е, -и, -ах, -у), используя этот символ в следующей записи – библиотек*. Надо иметь в виду, что, могут быть модификации этого приема, например, Alta Vista требует, чтобы слово, оканчивающееся на символ «*», состояло не менее чем из трех букв, а символ «*» обозначал не более пяти символов. Имея в виду большую изменчивость русских слов, при оформлении запроса имеет смысл заменить последние -не сколько букв практически каждого слова на символ«*». Так, поисковые механизмы некоторых АИПС уже включают эту возможность при формировании поискового предписания, например, в Rambler поиск

131

ведется с учетом морфологии, в Яndex – словосочетаний, синтаксических связей русского языка на основе сверки с собственным словарным сервером, в Magellan – с учетом идеи, близко связанной со словами запроса.

Поиск по фразе. Повышения результативности поиска можно достичь за счет включения поиска по фразе, которая заключается в кавычки. Введение кавычек в поисковую строку означает команду выведения списка документов, содержащих только данную фразу, а не отдельные слова или все слова фразы. Таким образом, данный прием рассчитан на поиск словосочетаний. Например, запись:

«язык программирования» «С++»

– означает поиск документов, в которых группа слов«язык программирования» стоят рядом, что исключит документы, в которых речь идет о языке художественной литературы или, аналогично, о языке «С».

Булевы логические операторы. Некоторые АИПС в усложненном запросе поддерживают использование булевых(логических) операторов – AND (И), OR (ИЛИ) и NOT (НЕ), которые являются эквивалентом операторов включения, пересечения и исключения. Оператор AND (или символ &) определяет поиск документов, содержащих оба слова, соединенных оператором (или несколько, если AND используется несколько раз между словами), что расширяет перечень найденных документов. Если в результате найдено слишком мало документов, то можно воспользоваться оператором OR (или символом « | »), который приведет к поиску документов, содержащих оба или одно из двух слов.

Для исключения нежелательных документов можно воспользоваться оператором NOT (или символом « ! »), который дает задание пренебречь документами, содержащими слово после этого оператора.

Кроме упомянутых операторов часто используются и другие, которые можно назвать модифицированными операторами И, так как по сути, они выполняют функцию операторов И с некоторыми дополнительными условиями. Все эти операторы определяют требуемое взаимное расположение слов в искомом тексте. К ним относятся следующие операторы:

·РЯДОМ (ADJ) – равносилен И, но слова в любом порядке должны следовать одно за другим;

·ПЕРЕД (BEFORE) – равносилен И, но слова должны располагаться в заданном порядке;

·НЕ ДАЛЬШЕ (NEAR) – равносилен И, но слова должны находиться друг от друга не дальше определенного расстояния; это расстояние

132

(в словах или символах) фиксировано для данной поисковой машины (чаще в пределах 10 слов) или может задаваться пользователем;

· НЕ БЛИЖЕ (FAR) – аналогичен оператору НЕ ДАЛЬШЕ, но слова должны находиться друг от друга не ближе заданного расстояния.

Булевы выражения (логические группы). Многие АИПС, которые поддерживают булевы операторы, позволяют использовать скобки для задания булева выражения подобно выполнению арифметических операций со скобками. Такое выражение позволяет задать условия поиска наиболее точно. В выражениях, созданных с применением скобок, АИПС оценивает выражение слева направо, кроме тех слов, которые заключены в скобки и будут восприняты первыми – то есть сначала выполняется операция внутри скобок, затем – между ними, например, (дисплей OR монитор) AND (Canon OR Sumsung). Согласно этим условиям поиска сначала будут запрошены документы, содержащие слова «дисплей» или «монитор» и документы о фирмах, а затем произведена операция AND, то есть в результате будет выдан набор документов, содержащих информацию о тех дисплеях или мониторах, которые были выпущены фирмами Canon или Sumsung.

В случае, если несмотря на использованные приемы поиска -ре зультатом является большой список ссылок, то уменьшение их количества возможно при повторном уточненном, скорректированном поиске среди найденных страниц, если АИПС поддерживает выполнение данной процедуры.

Кроме отдельных слов, операндами27 поискового выражения могут выступать и целые словосочетания (фразы). В синтаксисе ПМ словосочетание, которое должно выступать как фраза, заключается в кавычки. В некоторых ПМ при поиске фразы в тексте учитывается точное соответствие символьной последовательности фразы с фрагментом анализируемого текста, в других – допускаются некоторые отклонения (например, две фразы, в которых у подлежащего в одной из них присутствует, а в другой отсутствует определение, могут считаться эквивалентными). Следует заметить, что в известных нам ПМ «+» и «–» не могут использоваться совместно с операторами булевой алгебры.

После того, как информация найдена, она представляется в виде списка ссылок на документы, которые некоторыми АИПС сортируются по степени важности, которая определяется заложенными в программу

______________

27 Операнд (англ. operand) в языках программирования ― аргумент операции; грамматическая конструкция, обозначающая выражение, задающее значение аргумента операции; иногда операндом называют место, позицию в тексте, где должен стоять аргумент операции.

133

факторами релевантности или использованием набора операторов сравнения. Например, сортировка в соответствии с рейтингом веб-сайтов в баллах на основе условного«веса» терминов и, соответственно, документов; по количеству вхождений; дате создания и пр. Так, в Alta Vista степень важности определяется по нижеследующим формальным факторам:

·входят ли ключевые слова в заголовок документа;

·содержатся ли эти слова в первых нескольких строках документа;

·насколько близко друг к другу в тексте обнаружены ключевые слова.

Предъявляемая пользователю страница с результатами демонстрирует эффективность поиска, количественно характеризуя результат обработанного запроса и поисковый механизм, заложенный в АИПС. Тем не менее, формальный подход сортировки, реализованный на программном уровне в большинстве АИПС, зачастую не приводит к искомому результату получения качественной электронной информации. Это обстоятельство вынуждает пользователей знать и применять другие, неформальные критерии для оценки важности и качества найденной электронной информации, например, авторство, стиль изложения, аккуратность, актуальность и пр.

Э т о и н т е р е с н о

Магия первого места

Почти каждый второй пользователь нажимает на первую ссылку среди результатов поиска (42%), а вторую выбирают лишь 8%. Что интересно, даже если поменять местами эти ссылки, то все равно люди жмут на первую.

В преимуществе первого места нет ничего удивительного, она является релевантной поисковому запросу в 36% случаев, а вторая ссылка – в 26% случаев. Отсюда видно, что пользователи на самом деле слишком много внимания уделяют первой ссылке. Ученые пытаются как-то объяснить этот феномен. Есть две версии: 1) поисковики настолько хорошо работают, что они

почти всегда помещают самую релевантную ссылку на первое; место 2) пользователи жмут на первую ссылку не из-за того, что она чем-то лучше, а просто потому что она первая – это можно объяснить ленью или чем-то иным. Как показывает исследование, правильный ответ находится где-то посередине. С одной стороны, первая ссылка остается самой популярной, даже если она не является самой релевантной. С другой стороны, после перемены мест количество кликов на первую ссылку существенно уменьшилось: с 42 до 34%. То есть релевантность все-таки имеет значение, хотя магия первого места определенно существует28.

______________

 

 

 

28Магия первого места

[Электронный ресурс ].

URL:

http://webplanet.ru/news/internet/2005/9/29/ magic.html

134

Источники в помощь

1.Автоматизированный поиск информации в библиотеке: метод. пособие / под ред. О. В. Никитиной, Г. В. Гедримович. – СПб. : Изд-во СПбГУЭФ, 2008. – 110 с.

2.Голицына, О. Л. Информационные системы / О. Л. Голицына, Н. В. Максимов, И. И. Попов. – М. : Форум, 2009. – 496 с.

3.ГОСТ 7.74–96 Информационно-поисковые языки. – Введ. с 01.07.97. – Минск : Межгос. совет по стандартизации, метрологии и сертификации, 1997. – 34 с. – (Система стандартов по информации, библиотечному и издательскому делу).

4.Степанов, В. Поиск информации / В. Степанов, О. Шаргородская //

Библиотека. – 1997. – № 5. – С. 53–56.

5.Сукиасян, Э. Р. Сущность, объект, условия, принципы индексирования

/Э. Р. Сукиасян // Библиотека. – 2004. – № 3. – С. 51–53.

6.Ханжин, А. Г. О разрешимости проблем информационного поиска/ А. Г. Ханжин, А. А. Кожокару // Науч.-техн. информ. Сер. 2. – 2006. – № 10. –

С. 14–22.

7.Электронные каталоги и базы данных: поисковые техники // Новые информационные технологии в библиотечной деятельности вуза: учеб.- метод. пособие для библиотекарей и пользователей корпоратив. библ. систем

/Т. В. Еременко, Ю. И. Поклад, Л. К. Сагитова, Л. М. Федюнина ; под ред. Л. К. Сагитовой ; Белгор. гос. ун-т. – Белгород : БелГУ, 2004. – С. 62–75.

18. Веб-сайты: разработка и продвижение

Первый в мире сайт info.cern.ch появился в 1990 г. Его создатель, Тим Бернерс-Ли, опубликовал на нем описание новой технологии World Wide Web, основанной на протоколе передачи данныхHTTP, системе адресации URI29 и языке гипертекстовой разметки HTML. Также на сайте были описаны принципы установки и работы серверов и браузеров. Сайт стал и первым в мире интернет-каталогом, так как позже Тим Бер- нерс-Ли разместил на нем список ссылок на другие сайты.

Современные веб-сайты перестали быть просто набором статических страничек, они превратились в динамические веб-приложения, являющиеся связующим звеном между пользователем и корпоративной информационной системой.

______________

29 URI (англ. Uniform Resource Identifier)— унифицированный (единооб-

разный) идентификатор ресурса.

135

Унифицированного определения понятия «веб-сайт» не существует. Приведем несколько дефиниций (табл. 8).

 

 

 

Трактовка понятия «веб-сайт»

Таблица 8

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение

Источник

 

 

1. Место расположения информаци-

Воройский, Ф. С. Информатика. Но-

онного наполнения (контента) сер-

вый систематизированный толковый

вера. 2. Совокупность логически свя-

словарь-справочник (Введение в сов-

занных между

собой веб-страниц,

ременные информационные и

теле-

размещенных на одном компьютере.

коммуникационные технологии в тер-

3. Абонентский пункт, узел (сети)

минах и фактах) / Ф. С. Воройский. –

 

 

 

 

М.: ФИЗМАТЛИТ, 2006. – С. 513

Системное

многоуровневое объеди-

Современный экономический сло-

нение разных ресурсов и сервисов.

варь [Электронный ресурс]. – URL:

Дает пользователю четкую информа-

http://slovari.yandex.ru/dict/economic

цию,

осуществляет мгновенный дос-

 

 

 

туп к таким сервисам, как поисковые

 

 

 

системы, электронный шопинг, бес-

 

 

 

платная электронная почта, торговая

 

 

 

реклама, мгновенная рассылка сооб-

 

 

 

щений, веб-аукционы; обладает воз-

 

 

 

можностью как привлекать большое

 

 

 

число пользователей, так и собирать

 

 

 

информацию об их интересах

 

 

 

Совокупность веб-страниц с повто-

Cловарь по естественным наукам.

ряющимся

дизайном, объединенных

Глоссарий.ру [Электронный

ре-

по смыслу, навигационно и физически

сурс]. – URL: http://slovari.yandex.

находящихся на одном веб-сервере

ru/dict/gl_natural

 

 

Место в Интернете, которое определя-

Интернетско-русский

разговорник

ется своим адресом, имеет своего вла-

[Электронный ресурс]. – URL: http://

дельца и состоит из веб-страниц, кото-

slovari.yandex.ru/dict/Интернет

 

рые воспринимаются как единое целое

 

 

 

В компьютерной

сети объединенная

Википедия [Электронный

ресурс]. –

под одним адресом (доменным име-

URL: http://ru.wikipedia.org/wiki/%

нем

или IP-адресом) совокупность

D0%A1%D0%B0%D0%B9%D1%82

документов частного лица или орга-

 

 

 

низации. По умолчанию подразуме-

 

 

 

вается, что сайт располагается в сети

 

 

 

Интернет

 

 

 

 

 

Существует множество классификаций веб-сайтов, в основе которых лежат различные параметры и характеристики(табл. 9). Однако общепринятая классификация типов веб-сайтов отсутствует. Основания деления достаточно условны, часто наблюдается смешение видов.

136

 

Классификация веб-сайтов

 

 

Таблица 9

 

 

 

 

 

 

 

 

 

 

 

 

 

Признак

Вид сайта

 

 

 

 

 

По доступности сер-

Открытые – все сервисы полностью доступны для

 

висов

любых посетителей

 

 

 

 

 

 

Полуоткрытые – для доступа необходимо зарегист-

 

 

рироваться (обычно бесплатно).

 

 

 

 

 

 

Закрытые – полностью закрытые

служебные

сайты

 

 

организаций (в том числе корпоративные сайты), лич-

 

 

ные сайты частных лиц. Такие сайты доступны для

 

 

узкого круга людей. Доступ новым людям обычно

 

 

дается через так называемые инвайты (приглашения)

 

По природе содер-

Статические – все содержимое заранее подготав-

 

жимого

ливается. Пользователю выдаются файлы в том

 

 

виде, в котором они хранятся на сервере

 

 

 

 

Динамические – содержимое

генерируется

специ-

 

 

альными скриптами (программами) на основе дру-

 

 

гих данных из любого источника

 

 

 

 

По физическому

Внешние сайты сети Интернет

 

 

 

 

 

расположению

Локальные сайты – доступны

только в

пределах

 

 

локальной сети. Это могут быть как корпоративные

 

 

сайты организаций, так и сайты частных лиц в ло-

 

 

кальной сети провайдера

 

 

 

 

 

По схеме представ-

Интернет-представительства владельцев:

 

 

 

ления информации,

Сайт-визитка – содержит самые

общие

данные

о

ее объему и катего-

владельце сайта (организация или индивидуальный

 

рии решаемых задач

предприниматель). Вид деятельности, история, прайс-

 

 

лист, контактные данные, реквизиты, схема проезда

 

 

Каталог продукции – в каталоге присутствует под-

 

 

робное описание товаров/ услуг, сертификаты,

 

 

технические и потребительские данные, отзывы

 

 

экспертов и т. д. На таких сайтах размещается ин-

 

 

формация о товарах/ услугах, которую невозможно

 

 

поместить в прайс-лист

 

 

 

 

 

 

Интернет-магазин – веб-сайт с каталогом продук-

 

 

ции, с помощью которого клиент может заказать

 

 

нужные ему товары. Используются различные сис-

 

 

темы расчетов: от пересылки товаров наложенным

 

 

платежом или автоматической пересылки счета по

 

 

факсу до расчетов с помощью пластиковых карт

 

 

Промо-сайт – сайт о конкретной торговой марке

 

 

или продукте, на таких сайтах размещается исчер-

 

 

пывающая информация о бренде, различных рек-

 

 

ламных акциях (конкурсы, викторины, игры и т. п.)

 

137

 

 

 

 

Окончание табл. 9

Признак

 

 

Вид сайта

 

 

 

 

Информационные ресурсы:

 

 

 

 

Тематический

сайт – веб-сайт,

предоставляющий

 

 

исчерпывающую информацию о какой-либо теме

 

 

Тематический

портал – это очень большой веб-

 

 

ресурс, который предоставляет исчерпывающую ин-

 

 

формацию по определенной тематике. Порталы по-

 

 

хожи на тематические сайты, но дополнительно

 

 

содержат средства взаимодействия с пользователя-

 

 

ми и позволяют пользователям общаться в рамках

 

 

портала (форумы, чаты) – это среда существования

 

 

пользователя

 

 

 

 

 

Веб-сервис. Сервисные веб-сайты обычно решают

 

 

конкретную пользовательскую

задачу, связанную

 

 

с Интернетом:

 

 

 

 

 

·

поисковые сервисы – например, Яндекс, Google;

 

 

·

почтовый сервис;

 

 

 

 

·

форумы;

 

 

 

 

 

·

блоговый сервис;

 

 

 

 

· фотохостинг – например, Flickr, ImageShack,

 

 

 

Panoramio, Photobucket;

 

 

 

 

·

хранение видео – например, YouTube, RuTube.

 

 

·

доска объявлений;

 

 

 

 

·

каталог сайтов – например, Open Directory Project

 

По отношению к

Вовлекающий сайт

 

 

 

посетителю

Безразличный к посетителю

 

 

 

По цели создания

Коммерческий сайт – сайт для привлечения новых

 

 

 

клиентов и партнеров, поддержки существующих

 

 

клиентов и партнеров, проведения маркетинговых

 

 

мероприятий

 

 

 

 

 

Некоммерческий сайт – сайт, перед которым не

 

 

ставится извлечение прибыли. Как правило, такие

 

 

веб-сайты принадлежат различным органам власти,

 

 

социальным учреждениям, учебным заведениям,

 

 

отдельным личностям

 

 

 

Разработка сайта

Условно в работе по созданию сайта можно выделить5 основных этапов и 2 дополнительных. Последние не имеют прямого отношения к процессу, тем не менее являются важнейшими в «жизненном цикле» сайта.

138

1.Концепция сайта. Отправной точкой в работе по созданию сайта можно считать разработку основной идеи, вокруг которой строятся дизайн и программирование. Концепция сайта включает в себя:

а) структуру веб-сайта; б) техническое задание; в) план ведения работ.

2.Дизайн. Веб-дизайн (от англ. Web design) – в узком смысле – это визуальное оформление веб-страниц; в широком – отрасль вебразработки и разновидность дизайна, в задачи которой входит проек-

тирование пользовательских веб-интерфейсов для сайтов или - веб приложений. Он играет такую же роль для сайта, как полиграфический дизайн и верстка для бумажного издания. Задача дизайнера – найти баланс между визуально эффектной графикой и легким интерфейсом

спонятной навигационной структурой.

Веб-дизайнеры проектируют логическую структуру веб-страниц, продумывают наиболее удобные решения подачи информации, а так же занимаются художественным оформлением веб-проекта. В результате пересечения двух отраслей человеческой деятельности грамотный веб-дизайнер должен быть знаком с последними веб-технологиями и обладать соответствующими художественными качествами. Услуги веб-дизайна предоставляют как специальные компании, так и частные лица (веб-дизайнеры или веб-мастеры). Основные характеристики сайтов, необходимые при разработке дизайна:

·содержание (контент),

·структура сайта и навигация,

·графический дизайн и схема страницы,

·технические аспекты,

·присутствие в веб-среде.

Разработка дизайна сайта начинается с определения целей, задач, а также анализа информации, которая будет представлена на страницах веб-сайта.

3.Оптимизация материалов. Оптимизация материалов заключается в подготовке текстов, корректировке возможных стилистических, орфографических ошибок.

4.Верстка и программирование. На данном этапе программисты объединяют воедино идеи и дизайн, с использованием прогрессивных технологий (ActiveX, Active Server Pages, Parser) и языков программи-

рования (C++, Java, Visual Basic, Perl). При необходимости они делают возможным доступ к базам данных, защиту от несанкционированного доступа к конфиденциальной информации, наполняют сайт интерактивными сервисами, сделав его динамичным, размещают систему управления сайтом.

139

Система управления сайтом позволяет менять всю текстовую и большинство графической информации на сайте, работать с собственным электронным магазином, проводить опросы и голосования, редактировать гостевую книгу, подгружать документы для закачки, гибко управлять подпиской, вести базу полезных советов, пополнять собственную баннерную систему и многое другое. Например, следующие программные модули и решения:

·витрина товаров;

·управление потоком новостей;

·визуальный контент-редактор;

·электронный буклет;

·версия для печати;

·менеджер закачки;

·авторизация пользователя;

·менеджер подписки;

·гостевая книга;

·конференция;

·чат;

·голосование;

·анкетирование;

·рекламный блок;

·«Совет дня»;

·ротатор текстов;

·динамическая карта сайта;

·поиск и др.

5.Тестирование. На этом, заключительном этапе работ, программисты совместно с дизайнерами проверяют веб-сайт в работе: от соответствия стандартам экранной типографики, правильности ссылок, работоспособности сервера в различных условиях до проверок защищенности.

6.Размещение сайта.

7.Поддержка сайта.

Библиотечные сайты

Библиотечная практика в области создания собственных веб-сайтов позволила сформулировать некоторые методические рекомендации [12]. Как показало исследование контента (содержания) 50 библиотечных вебсайтов учебных заведений в разных странах, проведенное в1996 г. ирландским преподавателем Л. А. Клайдом, типовая модель библиотечного сайта состоит из следующих рубрик:

·название учебного заведения и библиотеки,

·ссылки на избранные ресурсы Интернета,

140