Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР_1 блок.doc
Скачиваний:
4
Добавлен:
10.08.2019
Размер:
134.66 Кб
Скачать

Лабораторная работа №1 «Анализ и оценка поисковых систем»

Цель: научиться выделять эффективные средства анализа Интернет-ресурсов для позиционирования электронного предприятия на глобальном рынке.

Поисковая система (поисковик) – это сайт, предоставляющий необходимые средства для поиска информации в сети по каким-либо ключевым словам. Система не только предоставляет необходимую информацию пользователю, но и осуществляет мониторинг сети с последующим сохранением и результатами анализа в собственной базе данных. Для этого в систему встроены следующие средства и ресурсы:

  • Паук – программ, которая, скачивает найденные в интернете файлы в базу данных. Принцип работы похож на работу браузера, только работа программы осуществляется с исходным кодом веб-страницы.

  • Индексатор – программа, анализирующая скаченную информацию пауком.

  • Веб-сервер – сайт, к которому обращается пользователь за поиском.

  • Паук «путешественник» – программа, путешествующая по ссылкам в интернете и определяющая дальнейший путь паука.

  • База данных – хранилище скаченных пауком и проиндексированных индексатором информационных страниц.

  • Система выдачи результатов – выдает из базы данных список веб-страниц при запросе пользователя.

Рассмотрим механизм работы поисковиков скрытых от глаз пользователя. Принцип работы поисковых систем во многом схож, но каждая система использует собственную технологию (алгоритм) поиска, поэтому и результаты ответов на запрос несколько отличается.

С начала на сайт попадает паук и осуществляет необходимые подготовительные мероприятия по скачиванию страницы с последующей ее разбивкой на части. Уже скопированную страницу посещает индексатор, разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д. После чего страница попадает в базу данных, которую еще называют индексом поисковой системы.

Извлекает результаты поиска из базы данных так называемая система выдачи результатов (Search engine results engine), которая и занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной – именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче.

Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи описанные общие черты.

Все поисковые системы объединяют несколько основных задач. Это поиск новых сайтов, оценка сайта и максимально точный ответ пользователю на запрос. С первой задачей многие поисковики справляются хорошо, а вот для решения второй задачи им приходиться прикладывать большие усилия и каждая добивается разных результатов. Вот почему одни пользуются большей популярностью, другие меньшей.

Умение находить информацию в интернете в скором будущем будет являться востребованным делом и прибыльным бизнесом. И современный интернет-предприниматель, не имея этого навыка в своем арсенале, подвергает себя и свой бизнес на бесславное путешествие в финансовой стране Интернета. Для того чтобы овладеть этим навыком необходимо постоянно практиковаться, узнавать все новые и новые возможности поиска, и использовать все полученные знания на практике. Ниже представлены советы по поиску информации. Выполняя их на практике, вы сможете приобрести бесценный опыт, который вам как Интернет-предпринимателю необходим:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]