Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Сл1_Технология поиска информации в Интернет,48

.pdf
Скачиваний:
36
Добавлен:
06.03.2016
Размер:
1.66 Mб
Скачать

2.10 Системы поиска людей

Системы поиска людей – это специальные сервера, которые позволяют осуществлять поиск людей в Интернет, пользователь может указать Ф.И.О. человека и получить его адрес электронной почты и URL-адрес. Однако, следует отметить, что системы поиска людей, в основном, берут информацию об электронных адресах из открытых источников, таких как конференции Usenet. Среди самых известных систем поиска людей можно выделить:

WhoWhere? - поиск адресов e-mail в специальные графы поиска контактные данные (First Name.

City, Last Name, Phone number), Вы можете найти интересующую Вас информацию.

Системы поиска людей - это большие

сервера, их базы данных содержат порядка 6 000 000 адресов.

21

3. Заключение

Мы рассмотрели основные технологии поиска информации в Интернет и представили в общих чертах поисковые инструменты, которые существуют на данный момент в Интернете, а также структуру поисковых запросов для наиболее популярных русскоязычных и англоязычных поисковых систем и, подводя итог вышесказанному, хотим отметить, что единой оптимальной схемы поиска информации в Интернет не существует. В зависимости от специфики нужной Вам информации, Вы можете использовать соответствующие поисковые инструменты и службы. А от того, как грамотно будут подобраны поисковые службы, зависит качество результатов поиска.

Источник: http://www.seonews.ru/masterclasses/detail/29812.php

========================================

Далее – детализация поисковых запросов у наиболее распространенных поисковиков…

22

Приложение. Краткие сведения о поисковых системах

 

Оглавление

 

1. Основные иностранные поисковые системы..................................................................................................................................................................

24

Google (www.google.com, www.google.ru) ...................................................................................................................................................................................

24

Yahoo! (search.yahoo.com)..............................................................................................................................................................................................................

26

MSN (search.msn.com).....................................................................................................................................................................................................................

27

Teoma (www.teoma.com) .................................................................................................................................................................................................................

28

WiseNut ...............................................................................................................................................................................................................................................

29

Exalead (www.exalead.com) ............................................................................................................................................................................................................

30

2. Основные российские поисковые системы .....................................................................................................................................................................

31

Апорт! ..................................................................................................................................................................................................................................................

31

Яндекс .................................................................................................................................................................................................................................................

32

Рамблер..............................................................................................................................................................................................................................................

33

3.Основные адреса ..........................................................................................................................................................................................................................

34

Начальный поиск ..............................................................................................................................................................................................................................

34

Каталоги..............................................................................................................................................................................................................................................

35

Индексы ..............................................................................................................................................................................................................................................

36

Метапоиск...........................................................................................................................................................................................................................................

37

Поиск файлов ....................................................................................................................................................................................................................................

38

Поиск карт и спутниковых фотографий ......................................................................................................................................................................................

39

Тексты книг.........................................................................................................................................................................................................................................

40

Новости ...............................................................................................................................................................................................................................................

41

Конференции Usenet и списки рассылки ....................................................................................................................................................................................

42

Поиск изображений..........................................................................................................................................................................................................................

43

Сайты, посвященные поисковым системам ..............................................................................................................................................................................

44

Поиск работы.....................................................................................................................................................................................................................................

45

Разное .................................................................................................................................................................................................................................................

46

23

1. Основные иностранные поисковые системы

Google (www.google.com, www.google.ru)

Операторы.

- (минус), OR

+ — по умолчанию Google перебирает грамматические формы английских слов. Оператор +, поставленный перед словом, устраняет такой перебор. Кроме того, оператор + ставится перед служебными словами (or, the, a, in и т. д.), чтобы попытаться включить их в поиск.

~ — поиск слова и всех его синонимов. По запросу ~smel1 найдутся страницы, где есть слова «nose», «taste» «smells» и т. д.

Оператор по умолчанию. AND.

Скобки. Отсутствуют.

Фразы. Допускаются. Ищутся все слова, составляющие фразу (в том числе и служебные).

Шаблоны. Знак * заменяет слово при поиске фразы.

Регистр. Не учитывается.

Типы файлов. HTML, PDF, PS, DOC, XLS, TXT, PPT, RTF, ASP, WPD1.

Префиксы:

intitle — поиск в заголовках, например: intitle:hamlet

link — показывает сайты, ссылающиеся на заданный2, например:

Link:www.spillikins.ru

allinanchor — ищет в текстах ссылок,

например: allinanchor:"пойди туда не знаю куда"

related — находит страницы, похожие на заданную3, например: related:Iove.me.tender.com

24

inurl — ищет только в документах, чей адрес содержит заданный фрагмент, например: inurl:cold_beer

site — ищет только на указанном сайте, например:

site:earth.com atlantida

filetype — указывает, в каких файлах искать, например: filetype:pdf

pricerange — указывает разброс цен в долларах. Полезен при поиске товаров. Например,

поиск материнской платы ценой от 80 до 100 долларов можно задать так: pricerange:80-120 motherboard

define — ищет определение слова или фразы, следующих непосредственно за define:

define:happiness

1Формат файлов текстового редактора

WordPerfect.

2Не сочетается с другими операторами и префиксами.

3Этот префикс действует аналогично ссылке Similar Pages (Схожие страницы) в результатах поиска.

25

Yahoo! (search.yahoo.com)

Операторы. AND, OR, NOT1, -2.

Оператор по умолчанию. AND.

Скобки. Присутствуют.

Фразы. Допускаются.

Шаблоны. Отсутствуют.

Регистр. Не учитывается.

Типы файлов. HTML, PDF, XLS, PPT, DOC, XML, TXT.

Префиксы:

title — поиск в заголовках, например: title:hamlet

link — показывает сайты, ссылающиеся на заданный3, например: link:http://www.mysite.com

linkdomain — показывает сайты, ссылающиеся на заданный домен, например:

linkdomain:mysite.com

site — ищет только на указанном сайте, например: site:www.searchiq.com exalead

inurl — ищет страницы, где есть заданный фрагмент адреса: inurl:hamlet

originurlextension: — задает тип файла, например: originurlextension:pdf

feauture: acrobat — поиск страниц, содержащих ссылки на pdf-файлы.

feature:audio — поиск страниц, содержащих ссылки на аудиофайлы, например: feature-.audio placebo — поиск записей группы Placebo.

feature: video — поиск страниц, содержащих ссылки на видеофайлы.

1Логические операторы задаются прописными буквами.

2Оператор - нельзя использовать вместе с логическими операторами.

3Перед именем сайта нужно указать http://.

26

MSN (search.msn.com)

Операторы. +, -, OR, AND и NOT.

Оператор по умолчанию. AND.

Скобки. Допускаются.

Фразы. Допускаются.

Шаблоны. Отсутствуют.

Регистр. Не учитывается.

Типы файлов. HTML, PDF, PPT, XLS, DOC.

Префиксы:

site — ищет только на указанном сайте: site:www.searchenginewatch.com exalead

filetype — задает тип файла, например: filetype:pdf "arithmetic coding"

link — поиск сайтов, ссылающихся на данный сайт или страницу1, например:

link:www.spi11ikins.com

linkdomain — поиск сайтов, ссылающихся на любую страницу, принадлежащую указанному домену: linkdomain:www.mysite.com

loc — ограничивает поиск двухбуквенным кодом страны: родина мать loc:ru

intitle — поиск в заголовках страниц, например: intitle:hamlet

inurl — ищет страницы, где есть заданный фрагмент адреса2: inurl:treasure

inanchor — поиск в текстах ссылок: inanchor:"Изучаем Си"

language — ограничивает язык страниц: language:ru

contains — ищет страницы, где есть ссылки на файлы с указанным расширением. Пример — страницы, со словом Queen и ссылки на файлы МРЗ: contains:mp3 queen

url — проверяет, есть ли такой адрес в индексе MSN, например: url:krupnik.newmail.ru

1 Ищется ссылка в точности на указанный адрес. По запросу link:www.nanie.com, ищутся страницы, которые ссылаются на www.name.com, но не на www.name.com/dir.

2 После inurl: может стоять только отдельное слово, но не фраза.

27

Teoma (www.teoma.com)

Операторы. AND, OR, +1 и -.

Оператор по умолчанию. AND.

Скобки. Не допускаются.

Фразы. Допускаются.

Шаблоны. Отсутствуют.

Регистр. Не учитывается.

Типы файлов. HTML, PDF.

Префиксы:

intitle — поиск в заголовках, например: intitle:Shakespeare

inuri — ищет только в документах, чей адрес содержит заданный фрагмент, например: inuri:red_vine

site — ищет только на указанном сайте, например:

site:www.piraticisland.com treasure

last — показывает страницы, измененные в течение указанного периода времени. Можно указать такие периоды: week (неделя), 2weeks (2 недели), month (месяц), 3months (3 месяца), 6months (6 месяцев), year (год), 2years (2 года). Пример — поиск слова «tennis» на страницах, измененных в течение последней недели: last:week tennis

afterdate:yyyymmdd — поиск страниц, модифицированных после указанной даты,

например: afterdate:20120507 putin

beforedate: yyyymmdd — поиск страниц, модифицированных до указанной даты.

betweendate: yyyymmdd, yyyymmdd — поиск страниц, модифицированных в указанном промежутке времени

.

1 Используется для включения в поиск служебных слов, например: +what, +the.

28

WiseNut

Операторы. +1 и -.

Оператор по умолчанию. AND.

Скобки. Не допускаются.

Фразы. Допускаются.

Шаблоны. Отсутствуют.

Регистр. Не учитывается.

Типы файлов. HTML.

Префиксы. Отсутствуют.

1 Только для включения служебных слов.

29

Exalead (www.exalead.com)

Операторы. OR, AND, NOT1.

NEAR — задает близость в 16 слов, например: «отдай NEAR прощу» — между «отдай» и «прощу» должно быть не более 16 слов.

+ — задает поиск в точности указанного слова: +apple. По умолчанию Exalead ищет все

грамматические формы, то есть apple, apples и т. д. Кроме того, оператор + заставляет Exalead искать служебные слова (the, a, of, or, and).

- — задает поиск страниц, где нет указанного слова, например:

Klinton -Lewinsky

sort:new — показывает первыми самые «свежие» страницы.

sort:old — показывает первыми самые «старые» страницы.

Оператор по умолчанию. AND.

Скобки. Допускаются.

Фразы. Допускаются.

Шаблоны. При поиске micro* найдется и «microsoft», и «microbe».

Регистр. Не учитывается.

Типы файлов. HTML, PDF, PPT, XLS, DOC, RTF, SWF, TXT.

Префиксы:

intitle — поиск в заголовках страниц, например: intitle:shakespeare

site — ищет только на указанном сайте, например:

site:www.searchenginewatch.com exalead

1 Вcе операторы должны быть записаны строчными буквами.

30