Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОСы / МИР.docx
Скачиваний:
37
Добавлен:
04.01.2020
Размер:
78.23 Кб
Скачать
  1. Классификация источников информации в интернете

В качестве внутренних источников информации могут выступать: транзакционные системы, предназначенные для операционной работы, в том числе с клиентами, включая клиентов филиалов и представительств; система внутрифирменного электронного документооборота; документы из электронных хранилищ; документы на бумажных носителях. К внешним источникам информации относятся: материалы и данные информационных агентств как в электронном виде, так и на бумажных носителях;

законодательные и нормативные материалы регулирующих органов; материалы и данные, представленные клиентами и партнерами предприятия в электронном виде или на бумажных носителях. АИС должна обеспечить возможность комплексного использования всей гаммы информационных источников для решения традиционных и нерегламентированных аналитических задач. Для этого система поддержки принятия решений должна базироваться на концепции единого информационного пространства.

Ключевыми направлениями в создании информационной системы, отражающей указанную концепцию, являются внедрение электронного документооборота и возможности работы с электронными образами бумажных документов, а также создание информационного хранилища 

  1. Средства поиска информации в интернете

Основными поисковыми средствами в Интернете являются поисковые системы и каталоги.  Поисковые системы – это специализированные базы данных. Состоят из трех частей:  n робот - программа. n индексные массивы (информация о документах и ссылки на них); n программа, которая, просматривая в соответствии с запросом пользователя индексные массивы, отбирает и выдает потребителю найденные документы. В каталогах имеются иерархические тематические рубрики.  3. Указание адреса страницы. Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа. Передвижение по гиперссылкам. Это наименее удобный способ, так как с его помошыо можно искать документы, только близкие по смыслу текущему документу. Если текущий документ посвящен, например, музыке, то, используя гиперссылки этого документа, вряд ли можно будет попасть на сайт, посвященный спорту.

    1. Работа поисковых машин

Поисковые системы состоят из следующих основных компонентов: Spider (паук) - браузероподобная программа, которая скачивает веб-страницы. Spider скачивает веб-страницы тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т.д.), паук же не имеет никаких визуальных компонент и работает с html-текстом страницы (вы можете сделать «просмотр html-кода» в вашем браузере, чтобы увидеть «сырой» html-текст). Crawler (краулер, «путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Crawler выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе. Indexer (индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Indexer разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д. Database (база данных) – хранилище скачанных и обработанных страниц. Database - это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы. Search engine results engine (система выдачи результатов) – извлекает результаты поиска из базы данных. Search Engine Results Engine занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной – именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы рассмотрим отдельные факторы, влияющие на ранжирование результатов. Web server (веб-сервер) – веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы. Как правило, на нем присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Веб-сервер также отвечает за выдачу результатов пользователю в виде html-страницы. Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи описанные общие черты.