Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСЭ.doc
Скачиваний:
7
Добавлен:
07.05.2019
Размер:
2.17 Mб
Скачать

51. Поиск информационных ресурсов в Интернете

Наиболее мощными поисковыми машинами,  на сегодняшний день в мире являются:

Google (google.com),

Bing (bing.com)

Alta Vista (www.altavista.digital.com),

Yahoo! (www.yahoo.com),

Infoseek (www.infoseek.com),

Baidu (baidu.com)

GoTo (www.goto.com),

FTP search (ftpsearch.ntnu.no - поиск в системе FTP),

а также отечественные:

Yandex (yandex.ru),

Rambler (www.rambler.ru),

Compass (compass.tsu.ru),

Russian FTP search (ftpsearch.city.ru - поиск в системе FTP).

Популярность приобретают метапоисковые (мультипоисковые) машины, которые переадресовывают запрос на поисковые машины, а за тем суммируют полученное и удаляют дублируемые записи. Например, Metabot.ru, nigma.ru

Функционирование поисковой машины включает два процесса:

1) индексирование ресурсов Internet (автоматическое построение и обновление индекса);

2) поиск по индексу информации, соответствующей запросу пользователя.

Поисковая машинаэто программа, которая составляет и хранит предметный указатель Интернета (индекс) и находит в нем заданные ключевые слова, а затем адреса сайтов.

Основной действующий элемент машины – это робот-паук (программный агент) систематически посещающий сайты, считывающий адреса сайтов, которые необходимо индексировать.

За тем создается индекс.

Специфика индекса заключается в том, что в нем по алфавиту хранятся только основы слов содержащих ссылки на номера web-страниц, где они присутствуют.

Индексная запись имеет следующую структуру:

Основа (номер страницы, номер страницы, …, номер страницы).

Основа это ключевое слово специально обработанное (без окончания).

Если в обычном тексте мы идем от страницы к словам, то поисковая машина идет от слов к страницам.

Поэтому индекс поисковой машины называется инвертированным (перевернутым).

 Поисковая программа в соответствии с запросом пользователя перебирает индексы и выдает результаты, содержащие текстовую копию страниц Интернета.

Поисковые машины могут просмотреть не более трети всех сайтов в Интернете (по другим данным не более 10%).

Существует еще  невидимый и закрытый Интернет.

Роботы, являясь программными агентами, отвечают за извлечение документов из сети. Все поисковые агенты делятся на

- неспециализированные и

- специализированные.

Неспециализированные агенты обеспечивают поиск по ключевым словам и устойчивым словосочетаниям. Такие системы агентов объединяют ссылки на сайты, найденные множеством машин поиска. Используя агентов такого класса можно уменьшить число результирующих документов.

Специализированные агенты приспособлены искать сайты по видам (новости, музыка, акции, книги, видеоклипы и т.д.).

Распознавание смысла запроса в Internet

52. Классификация и кодирование информационных ресурсов

В управленческой документации одна часть данных кодируется, а вторая – нет (адреса, фамилии и т.д.).

Кодирование необходимо для сокращения затрат на ввод документов и упрощения операций по их обработке.

Коды находятся в классификаторах, содержащих также систематизированный свод наименований объектов и их группировки. 

Для того чтобы получить коды объектов, они предварительно классифицируются.

Классифицирование - это деление множества объектов на классы в соответствии с нужным признаком.

Если признаков несколько и между ними существует иерархическая соподчиненность, то получают иерархическую классификацию.

Х Х Х ХХ

Признак Б

Признак А

Признак В

Признак Г



Правила построения иерархического классификатора:

1.                   

2.                  Определить число признаков, указать их наименование и соподчиненность (например, А (факультет) старше Б (специальности), Б старше В (группы), В старше Г (номера студента в группе).

3.                  Определить число значений, принимаемых каждым признаком и выбрать максимальное (например, А принимает максимальное значение 5, Б – 3, В – 4, Г - 25).

4.                  Построить классификационное дерево.

5.                  Построить структуру кода по схеме

М

М1

М2

М3

М4

Мn

М21

М22

М23

М221

М222

М223

М224

Признак В

Признак Б

Признак А

М2221

М2222

М2223

Признак Г

 


Если между признаками нет иерархической зависимости, то имеет место одноуровневая многопризначная (фасетная) классификация.

Классы-фасеты получают путем отнесения объектов в классы согласно значениям признаков одновременно.

Множество студентов можно разделить по трем признакам: пол, успеваемость и место проживания (регион).

Фасеты позволяют с помощью операций пересечения, объединения и др.  получить ответы на различные вопросы.

Существует три уровня классификаторов экономической информации: общегосударственные, отраслевые и локальные (классификаторы предприятий).

А. Общегосударственные классификаторы делятся на следующие группы:

1.                  Классификаторы управленческих документов, видов деятельности, экономических и социальных показателей

-                                                   Общероссийский классификатор продукции (ОКП);

-                                                   Общероссийский классификатор управленческой документации (ОКУД);

-                                                   Общероссийский классификатор видов экономической деятельности (ОКВЭД);

-                                                   Общероссийский  классификатор валют (ОКВ);

-                                                   Общероссийский  классификатор единиц измерения (ОКЕИ) и др.

2.                  Классификаторы организационных структур.

-                                 Общероссийский классификатор органов государственной власти и управления (ОКОГУ);

-                                 Общероссийский  классификатор предприятий и организаций (ОКПО);

-                                 Общероссийский  классификатор отраслей народного хозяйства (ОКОНХ)  и др.

3.                  Классификаторы информации о населении и кадрах.

-                                            Общероссийский  классификатор информации по социальной защите населения (ОКИСЗН);

-                                            Общероссийский классификатор специальностей по образованию (ОКСО);

-                                            Общероссийский классификатор профессий рабочих, должностей служащих и тарифных разрядов (ОКПДТР).

Код унифицированной формы документа (код) состоит из 8 знаков

Б. Отраслевые классификаторы - создаются отраслей производства или видов деятельности (коды бухгалтерских счетов, коды видов оплат и удержаний, виды операций с материальными ценностями и т.д.).

В. Локальные классификаторы – для отдельных предприятий или организаций (табельные номера, коды структурных подразделений, коды поставщиков и т.д.).

Коды необходимы для упрощения процедур автоматического поиска информации, ее группировки, сортировки и получения сводных результатов вычислений.

Кодирование – это  процесс присвоения условного обозначения объектам. Коды могут быть цифровыми, буквенными и буквенно-цифровыми.

Распространены системы кодирования: порядковая, серийная, позиционная, мнемоническая (код повторения), шахматный код.

Порядковая система кодирования предполагает присвоение всем позициям кодируемой номенклатуры порядковые номера без пропусков..

Серийная система ориентирована на кодирование объектов, которые предварительно сгруппированы в серии.

Позиционная система кодирования отражает иерархическую соподчиненность признаков классификации.

В бухгалтерском учете распространены позиционные двух и трехпризначные коды.

Мнемонический код повторяет характеристики объекта, например коды гаечных ключей, могут быть следующими: ключ 12 на 14 кодируется как 1214, ключ 14 на 17 – как 1417 и т.д.

Шахматный код применятся для кодирования двухпризначных номенклатур, например

 

Причины  простоя

              Виновники простоя

Поставщики

Администрация

Рабочие

Отсутствие  электроэнергии

11

12

13

Отсутствие  инструментов

21

22

23

Отсутствие  комплектующих

31

32

33

Коды играют определяющую роль в процессе подготовки исходных данных сокращая  затраты на ввод, перенося справочные данные в макет ввода первичного документа.

Коды используются при оформлении входных документов.

Например, в бухотчетности указываются коды организаций, отрасль, организационно-правовая форма и т.д.