
- •Материалы для самостоятельного изучения по дисциплине "Корпоративные информационные системы"
- •1. Две составляющие информационных систем
- •3. Вторая составляющая более изменчива.
- •2. Понятие корпорации и основные характеристики корпораций
- •3. Принципы построения корпоративных сетей
- •4. Архитектура корпоративных сетей
- •Приложения, свойства и службы
- •Приложения
- •Свойства и службы
- •5. Классификация технологий интеграции информационных систем
- •6. Информационно-поисковые системы предприятий
- •1. Специализированные информационно-поисковые системы.
- •2. Информационно-поисковые системы общего назначения.
- •7. Новые концепции хранения и анализа корпоративных данных
- •Отличия Data Mining от других методов анализа данных
- •9. Cистемы управления взаимодействием с клиентами
1. Специализированные информационно-поисковые системы.
Такие поисковые системы, как правило, поставляются вместе с базами данных, с которыми они работают. Это базы данных по законодательству, адресные справочники, оболочки словарей и другие подобные продукты.
Доступ к таким базам данных предприятие получает, приобретя лицензии на использование, либо приобретая сам программный продукт вместе с базой данных, либо оформив платный доступ по подписке.
Можно выделить как минимум два полезных момента от работы со специализированными базами. Во-первых, получение доступа к необходимым данным, которые уже структурированы и снабжены возможностью поиска. Польза очевидна и когда принимается решение о покупке такого продукта, он оценивается прежде всего по этому критерию.
Второй момент не так очевиден. В том случае, если вместе с данными была приобретена и сама программная оболочка, можно ее использовать для собственных внутренних целей.
В настоящее время появились комплексные информационно-поисковые предложения, позволяющие проводить поиск по тематическим базам данных, Интернет и одновременно с этим по массиву корпоративной информации.
2. Информационно-поисковые системы общего назначения.
Поисковые системы общего назначения работают, как правило, со слабоструктурированными массивами данных большого объема. Наиболее известные примеры — это поисковые системы Интернет, которые подразделяются на два вида:
каталоги ресурсов (Directory) — отличаются хорошо продуманной структурой ресурсов и точностью поиска, но малой полнотой охвата информационных массивов (поиск проводится только по кратким реферативным описаниям ресурсов);
полнотекстовые поисковые системы (Fulltext Search Engine) — отличаются широким охватом информации, т. е. поиск проводится по всем текстам документов, но с меньшей точностью по сравнению с поиском по каталогам ресурсов.
В настоящее время наблюдается их интенсивное «сращивание», так что практически любая поисковая система, претендующая на успех, сейчас предлагает оба вида поиска или их комбинацию.
Можно выделить ряд полезных для работы предприятия возможностей этого типа ИПС.
а) Поиск информации в публичных источниках. Наиболее частый вид использования поисковых систем этого типа, который обеспечивает поисковым серверам высокую популярность у пользователей.
б) Комплекс маркетинговых мероприятий. Прежде всего, это реклама предприятия на информационно-поисковых системах Internet, т. е. использование поисковых систем как канала для продвижения своего сайта, привлечение на него посетителей (возможных клиентов, поставщиков, партнеров). Особо следует отметить такой ее специфичный вид, как реклама по ключевым словам или контекстная реклама.
в) Еще один вариант использования — проведение маркетинговых исследований с использованием больших информационных массивов, которые поддерживаются крупными поисковыми системами. Данная форма использования также стала широко использоваться маркетинговыми и информационными отделами предприятий и организаций.
г) Организация поиска по корпоративному серверу (сайту). При установке поисковой системы на корпоративный сайт, как правило, преследуется цель — обеспечить удобство работы и скорость доступа посетителя к интересующей его информации.
Для решения данной задачи в настоящее время предлагаются самые разнообразные решения. В одних случаях требуется установить соответствующее программное обеспечение на корпоративном сервере. В других случаях достаточно установить код поисковой формы на страницах, все остальные хлопоты по обеспечению и поддержке поиска берет на себя поставщик поискового решения. Данный тип получил название «поисковый хостинг» и стал достаточно распространенной формой организации поиска.
3.Корпоративные информационно-поисковые системы.
Принципиальное отличие корпоративных поисковых систем от рассмотренных ранее состоит в том, что они работают с внутренними документами предприятия (создаваемыми внутри организации, либо вовлеченными в его документооборот извне). Доступ к таким системам может быть организован через корпоративные сети и Internet.
Системы этого типа призваны решать существенно больший круг задач. Как уже отмечалось, в определенный момент количество документов, созданных и используемых в работе организации достигает критичного значения, когда сам поиск нужного документа становится отдельной задачей, требующей затрат времени и усилий. Подобное положение отражается практически на всех уровнях предприятия: документооборот, связи с партнерами и клиентами, управление деятельностью и персоналом, анализ ситуации и принятие управленческих решений.
Одним из вариантов решения проблемы является внедрение на предприятии систем электронного документооборота, позволяющих упорядочить и внести стройность в потоки документов. Однако, как показывает практика, с помощью них удается упорядочить около 20% информации, используемой предприятием. Остальные 80% приходятся на неструктурированные данные, архивы, корреспонденцию и другое.
Таким образом, для более полного охвата информационного массива предприятия возникает потребность в использовании специализированных информационно-поисковых решений, и при проектировании корпоративной ИПС речь идет уже не только об обеспечении возможности поиска по информационным ресурсам, но и о создании единого, структурированного и подчиненного определенным правилам массива информации предприятия.
Некоторые требованиях, которым должны отвечать современные корпоративные информационно-поисковые системы.
а) Поддержка поиска документов в различных электронных форматах (гипертекстовые, MS Word, MS Excel и другие форматы, которые используются на предприятии). Необходимо отметить возможность подключения дополнительных модулей для поддержки новых форматов, которые могут появиться в будущем.
б) Поддержка языков обрабатываемых документов.
В том случае, если в документообороте предприятия циркулируют документы на разных языках, должна быть обеспечена возможность поиска на любом из них. Большая роль поддержки языка определяется не только необходимостью полного охвата всего массива документов, но и влияет на важнейший параметр оценки качества работы поискового механизма — релевантность результатов поиска, поскольку позволяет использовать лексическую информацию при вычислении меры соответствия документа запросу.
в) Масштабируемость.
При росте нагрузки на весь программный комплекс или его отдельные компоненты возможности системы (ее отдельных компонентов) должны увеличиваться простым наращиванием вычислительных мощностей.
г) Высокая скорость индексации и поиска, компактность хранения поискового индекса, возможность тонкой настройки базовых математических алгоритмов для обеспечения качества поиска, максимально адаптированного под нужды предприятия.
д) Возможность задания разного уровня доступа к документам.
Это требование продиктовано необходимостью обеспечения конфиденциальности и безопасности корпоративной информации.
г) Гибкий язык запросов, возможность ограничения областей поиска (например, по дате создания, по языку, по источнику и другим формальным параметрам), а также возможность целевой настройки форматов выдачи результатов поиска (количество документов на одной странице результатов, взаимосвязь документов между собой, группировки документов по различным формальным признакам и т. п.).
д) Поиск как по структурированной, так и по неструктурированной информации в рамках единого поискового ядра. Это обусловлено необходимостью создания единого поискового пространства для разнородных источников информации (БД, E-mail, архивы и т. п.).
е) Централизованное индексирование территориально распределенных источников информации, т. е. система, установленная на одном из компьютеров локальной или глобальной сети, автоматически собирает информацию с удаленных машин.
ж) Статистическо-аналитические надстройки.
Это подразумевает, что поисковая система не только обеспечивает поиск, но и дает статистику как по работе поискового механизма (анализ запросов, наиболее востребованных документов и т. д.), так и позволяет получить аналитическую информацию по всему массиву документов предприятия (какие документы и в каком количестве появились за выбранный промежуток времени, количественное распределение языков документов, форматов, сколько информации дублируется на разных носителях и т. д.).
Сюда же следует отнести возможность аналитического наращивания поискового механизма различными сервисными функциями (получение уведомления о появлении интересующего документа, автоматическое рубрицирование полнотекстовых массивов по формальным признакам, по тематике и другое).