
KTNI_Козлов(ответы) / 07
.doc7. Интернет поисковые системы Scirus, Google, Yandex, Yahoo, Rambler, Mail, Aport, Alta Vista. Критерии поиска. Отображение результата.
Поисковые системы
1. Яндекс (www.yandex.ru, www.ya.ru) — посещаемость 110,000,000 человек в день
2. Google (www.google.ru) — посещаемость 70,000,000 человек в день
3. Поиск@Mail.ru (go.mail.ru) — посещаемость 19,000,000 человек в день
4. Рамблер (www.rambler.ru) — посещает около 2,400,000 уникальных человек в день;
5. Bing (www.bing.com) — около 1,300,000 уникальных посетителей в день в день, от компании Microsoft, ранее известна как MSN Search (http://search.msn.com/), Windows Live Search (http://search.live.com/), Live Search (http://www.live.com/).
5. Апорт (www.aport.ru) — трансформировалась в поиск товаров и услуг
http://www.yahoo.com http://www.altavista.com http://www.google.com
Scirus – наиболее обширный инструмент для поиска научной информации в интернете.
Задачи поиска информации. Критерии поиска информации.
-
Полнотекстовый поиск — поиск по всему содержимому документа.
-
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д.
-
Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии.
Методы поиска
-
Адресный поиск - процесс поиска документов по чисто формальным признакам, указанным в запросе (условия - наличие у документа точного адреса, обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы)
-
Семантический поиск - процесс поиска документов по их содержанию. (условия: перевод содержания с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса, составление поискового описания, в котором указывается дополнительное условие поиска)
-
Документальный поиск - процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя (виды: библиотечный, направленный на нахождение первичных документов; библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей)
-
Фактографический поиск - процесс поиска фактов, соответствующих информационному запросу. (виды: документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты; фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации)
Критерии поиска
-
Критерий соответствия - Признак или совокупность признаков, по которым определяется степень соответствия между запросом или поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.
-
Критерий смыслового соответствия, критерий релевантности (документов, данных) - Признак или совокупность признаков, по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос , обрабатываемый системой.
-
Критерий формального соответствия - Признак или совокупность признаков, по которым определяется степень формального соответствия между поисковым предписанием и поисковым образом документа , самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.
-
Релевантность - Характеристика степени соответствия смыслового содержания документа, найденного в результате поиска, содержанию информационного запроса.
-
Пертинентность - Характеристика степени соответствия документа или данных, найденных в результате поиска, информационной потребности пользователя, выраженной в его запросе.
-
Точность поиска, коэффициент точности поиска/выдачи - Количественная характеристика результатов информационного поиска . Точность поиска определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность ) документов на общее число выданных документов (релевантных и не релевантных). Данный показатель используется также для оценки качества информационно-поисковых систем .
-
Коэффициент информационного шума, коэффициент шума - Количественная характеристика информационного поиска. Коэффициент информационного шума (ИШ) определяется путем деления количества выданных в результате выполнения поиска нерелевантных документов (см. релевантность ) на общее число выданных документов (релевантных и не релевантных). Будучи выраженным в процентах, ИШ = 100%;- ТП=0 . Данный показатель используется также для оценки качества информационно-поисковых систем .
-
Полнота поиска, коэффициент полноты поиска - Количественная характеристика результатов информационного поиска, которая определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность) документов на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Данный показатель используется также для оценки качества информационно-поисковых систем,
-
Коэффициент потерь - Количественная характеристика результатов информационного поиска. Коэффициент потерь (КП) определяется путем деления количества не выданных в результате выполнения поиска релевантных документов (см. релевантность ) на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Будучи выраженным в процентах, КП = 100% - полнота поиска. Данный показатель используется также для оценки качества информационно-поисковых систем.
-
Оперативность (время) поиска - время, затрачиваемое на выполнение поиска, с момента формирования задания и выдачи команды на производство поиска до момента получения его результатов; в ЭВМ - Время, затрачиваемое головкой чтения/записи дисковода (накопителя), для того, чтобы достичь определенного элемента данных, записанного на диске, дискете или другом носителе данных внешней памяти ЭВМ.