- •История создания
- •Индексация сайтов
- •Проблемы с авторскими правами
- •Синтаксис запросов
- •Поиск в найденном
- •Википоиск
- •Голосовой поиск
- •Поисковый механизм (search engine)
- •Внутренний язык intradb
- •Зависимости (dependencies)
- •Установка (installation)
- •Запуск (starting)
- •Google знает, как найти
- •Об авторе
- •Объем документов, загруженных роботами поисковых систем с thermo.Karelia.Ru, Мбайт
- •Google тестирует систему безопасного входа Sesame
Поисковый механизм (search engine)
intradb - это CGI-приложение для создания справочной информационной системы в веб-среде. Проект intradb направлен на решение ИТ-задач, связанных с организацией интегрированных систем поиска и агрегации информации, которая хранится в различных базах данных.
Поисковый сервис intradb решает задачи поиска общих объектов учета в разных базах данных, которые могут быть выделены в общем информационном фонде непосредственно пользователем системы. Описание предметных сущностей, с которыми должен работать поисковик, осуществляется через набор метаданных, которые задаются специально для нужд идентификации объектов учета внутри информационного фонда. Поисковый сервис intradb ищет данные и выводит результаты поиска в рамках единого пользовательского веб- интерфейса.
Область где поисковый механизм intradb может быть применен - это справочная информационная поддержка пользователей, когда главная задача поисковика состоит в том, чтобы построить обобщенный реферат для конкретного объекта учета из многих несвязанных между собой массивов данных. При этом задачи ввода/редактирования этой информации выведены за рамки поискового сервиса intradb и осуществляются в контексте других приложений.
Внутренний язык intradb
Поисковый сервис intradb строит свою работу на разборе семантических карт, которые содержат описательные инструкции к выделяемым объектам учета. Очевидно, такие инструкции должны содержать описания входных(поисковых) и выходных характеристик, критерии поиска одинаковых предметных сущностей в разных базах данных, правила формирования пользовательского интерфейса с учетом информационных потребностей конкретного пользователя. Семантические карты записываются при помощи лингвистического средства, которое может быть разобрано внутри intradb. Разбор семантических карт сервисом intradb даст на выходе информационно-поисковую веб- систему, работающую с разными базами данных.
Что собой представляет лингвистическое средство intradb? Это некоторый внутренний язык, который является главным и единственным средством, обеспечивающее инвариантность информационной системы относительно предметной области. Модуль intradb считывает инструкции внутреннего языка из набора конфигурационных файлов, в которых содержится разноплановая информация, необходимая для формирования поискового веб-сервиса. Семантика внутреннего языка разработана по таким правилам, что бы на нем можно было формулировать предложения для представления баз данных в форме поисковой системы.
CGI-модуль поискового сервиса intradb
Для функционирования поискового веб-сервиса intradb требуется наличие в локальной сети веб-сервера. Таким образом реализуется схема “тонкого-клиента”, когда для работы с программой на рабочем месте пользователя потребуется только веб-браузер (стандартное ПО, входящее в поставку любой современной операционной системы). Технология веб-сети позволяет обеспечить свободное подключение любого числа сетевых пользователей к поисковому сервису intradb.
Поисковый сервис intradb очень просто разворачивать на платформе Linux. Так как это cgi- приложение, то при использовании ОС Linux на стороне сервера все необходимые компоненты, которые требуются для функционирования системы, входят в состав дистрибутива: в качестве веб-сервера применяется Apache, в качестве СУБД — MySQL.
Программный код intradb написан на С++ и Javascript. В качестве инструментальной платформы для разработки выбрана библиотека Qt4 языка программирования C++. Это позволяет организовать кросплатформенную разработку. При необходимости исходный код intradb можно компилировать на платформах Linux или Windows.
Одно из главных направлений развития intradb состоит в том, чтобы делать систему как можно более проще с точки зрения применения специализированных средств разработки. Использование мощных, но часто сложных в эксплуатации средств на платформах Oracle, Java или .Net может приводить к тому, что система теряет свойство мобильности, становится тяжеловесной и не может работать в условиях ограниченных аппаратных ресурсов (частый пример из реальной практики внедрения).