Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Справочные сведения.doc
Скачиваний:
7
Добавлен:
09.09.2019
Размер:
232.45 Кб
Скачать

Как работает Яndex

Система просматривает все указанные ей тексты, преобразует каждое русское слово в нормальную форму (для существительных – это именительный падеж единственного числа, для глаголов – неопределенная форма и т.д.) и запоминает подробный адрес каждого слова. Алгоритмы морфологического разбора, которыми мы занимаемся, позволяют проанализировать слово, определить его характеристики и найти все формы, например: идти – идешь – шел; ребенок – дети; окно – окон; отзывать – отозвали.

Яndex обеспечивает индексацию одновременно с морфологическим разбором. Это позволяет создавать компактный индекс – около 30% исходных текстов, сохраняя достаточно высокую скорость индексации – 1-2 Мб/мин. Такая технология дает возможность почти полного снятия омонимии на этапе индексации.

Морфология базируется на словаре из 90 тыс. слов, к которому добавлены алгоритмы словообразования, а также на механизме построения гипотез для слов, отсутствующих в словаре. Создан и пополняется словарь имен собственных.

Русский интерфейс к поисковой системе AltaVista

Р аботу морфологии Яndex можно использовать не только на самом поисковом сервере Яndex, но и на примере русского поиска с помощью системы AltaVista (http://www.comptek.ru/alta.html). Как известно, слова в AltaVista проиндексированы просто как последовательность символов, что заставляет пользователя при поиске специально думать о том, как русские слова изменяются при склонениях и спряжениях . При запросе же через Яndex в запрос системы автоматически подставляются все допустимые формы требуемых слов.

Апорт! http://www.Aport.Ru

П оисковая система Апорт! – это проект фирмы Агама при поддержке российского отделения Intel. Система задумана и реализована как Web-индекс для осуществления поиска в Российской части Интернета, на русскоязычных серверах СНГ и мирового Интернета. Рассмотрим в качестве примера образец результатов поиска Апорта-2000 (см. рис. 8.5).

Основной блок выдачи начинается с символа «домик», который обозначает сайт (в противоположность символу «страничка», обозначающему отдельный документ).

Апорт-2000 дает весьма информативное представление найденных при поиске страниц. В блоке каждого сайта Апорт приводит информацию об одной (самой подходящей) из найденных на сайте страниц (8). При этом кроме типичного для поисковых машин «джентельменского набора» (адрес, заголовок, размер и дата файла, и т.п.) Апорт выдает цитаты из документа (9). Важно, что цитаты выбираются из полного текста документа и содержат слова, которые вы искали. Читая цитаты, зачастую легко понять, интересует вас документ или нет. Это очень удобно.

Проблемы при работе Internet Explorer

Если вы встретились с ситуацией, которую расцениваете как ошибку в программе, то для начала следует обратиться к меню справки по программе и выбрать пункт Техническая поддержка. Будет загружена страница технической поддержки по Internet Explorer с сервера Microsoft. Вполне вероятно, что вы не первый столкнулись с этим и в разделе наиболее часто задаваемых вопросов можно будет найти советы по разрешению ситуации.

К типичным сообщениям относятся те, что выдают серверы Интернета или сам браузер при невозможности найти запрашиваемые страницы:

  • 404 Not Found – браузер не может найти указанной страницы. Убедитесь в правильности указанного в адресной строке адреса. Страница могла быть перемещена в другое место, переименована или удалена.

  • 403 Forbidden/Access Denied – для доступа к узлу требуются дополнительные разрешения, например, указать верный пароль.

  • 503 Service Unavailable – попробуйте просмотреть страницу позже. В данное время этот сервер недоступен.

  • Bad File Request – ошибка кода интерактивной формы.

Если вы не нашли ответов на свои вопросы на странице «Наиболее часто задаваемые вопросы», то можно попробовать задать их напрямую техническому персоналу Microsoft, для чего загрузить страницу обратной связи и отправить электронное письмо в российское представительство Microsoft (russia@microsoft.com). Особо стоит упомянуть о таком источнике помощи, как телеконференции UseNet. На общедоступном сервере новостей msnews.microsoft.com есть группы, посвященные обсуждению русскоязычных локализованных программных продуктов Microsoft. В их числе есть группы телеконференций по Internet Explorer и Outlook Express (microsoft.public.ru.ie5).

Полезно также просмотреть страницы технической поддержки на сервере вашего провайдера и позвонить по его телефону службы сервиса. Вполне возможно, что с помощью провайдера вы сможете найти подходящее решение и разрешить проблему.