- •Министерство образования и науки российской федерации
- •Государственное образовательное учреждение
- •Высшего профессионального образования
- •«Курский государственный технический университет»
- •Учебное пособие курск 2006
- •Оглавление
- •Предисловие
- •Введение
- •1. Экономическая информация, её виды, источники и основные свойства
- •Информация и её роль в жизни общества
- •1.2. Виды и источники экономической информации
- •1.3. Классификация экономической информации по функциям
- •Количество и качество информации
- •2. Информационные технологии и их свойства
- •2.1. Понятие информационной технологии
- •2.2. Основные компоненты информационной технологии
- •2.3. Возникновение и эволюция информационных технологий
- •2.4. Роль ит в развитии экономики и общества
- •2.5. Свойства информационных технологий
- •3. Классификация информационных технологий
- •3.1. Понятие предметной технологии
- •3.2. Классификация ит по типу пользовательского интерфейса
- •3.3. Стандарты пользовательского интерфейса для диалоговых ит
- •3.4. Объектно-ориентированные технологии
- •3.4.1. Возникновение объектно-ориентированных технологий
- •3.4.2. Особенности объектно-ориентированных технологий
- •3.4.3. Жизненный цикл разработки приложения при использовании
- •4. Электронный офис
- •4.1. Электронный офис и система телекоммуникаций
- •4.2. Офисные задачи
- •4.3. Технология работы с документами в офисе
- •4.4. Интегрированные пакеты для офиса
- •Состав интегрированных пакетов для офиса
- •4.4. Ит обработки текстовой информации
- •4.5. Технология обработки табличной информации
- •4.6. Ит обработки графической информации
- •4.7. Издательские системы
- •4.8. Автоматизированное рабочее место
- •5. Сетевые информационные технологии
- •5.1. Определение и назначение компьютерных сетей
- •Классификация сетевых технологий
- •5.2. Технология открытых систем
- •5.3. Операционная система и архитектура открытых сетей
- •5.4. Электронная почта
- •6. Локальные компьютерные сети
- •6.1. Основные характеристики локальных вычислительных сетей
- •Сетевая плата
- •6.2. Сетевое программное обеспечение
- •6.3. Преимущества работы в локальной сети
- •7. Глобальные компьютерные сети и технология
- •7.1. Глобальная компьютерная сеть
- •7.2. Гипертекстовые технологии
- •7.3. Применение гипертекстовых технологий в Интернет
- •7.4. Методы поиска информации в Интернет
- •1. Объем поискового индекса
- •3. Используемые поисковые технологии
- •3. Средства контекстного поиска:
- •7.5. Наиболее распространены поисковые системы в сетевой
- •7.6. Роль всемирной сети Интернет в бизнесе
- •8. Экономические информационные системы
- •8.1. Информационная систем и её роль в процессах управления
- •8.2. Информационная система как коммуникационный центр
- •8.3. Классификация экономических информационных систем
- •8.4. Структура и состав информационной системы
- •8.4.1. Компоненты системы обработки данных
- •8.4.2. Организационные компоненты ис
- •8.5. Тенденции развития информационных систем
- •9. Процессы создания информационных технологий и
- •Особенности проектирования информационных технологий
- •Содержание и методы ведения проектировочных работ
- •9.3. Средства и системы автоматизации информационных технологий
- •Вопросы для повторения
- •10. Автоматизированные информационные технологии
- •10.1. Общая характеристика информационной системы бухгалтерского учета
- •Технология обработки документов в бухгалтерских информационных системах
- •Программное обеспечение бухгалтерских информационных систем
- •10.4. Технология компьютерной обработки учетных задач на малом
- •Вопросы для самоконтроля
- •11. Информационные технологии и системы в
- •11.1. Принципы создания автоматизированных банковских систем
- •11.2. Особенности информационного обеспечения банковских систем
- •11.3. Технические решения банковских технологий
- •11.4. Программное обеспечение информационных технологий в банках
- •11.5. Функциональные задачи и модули банковских систем
- •11.6. Автоматизация межбанковских расчетов
- •12. Компьютерные системы поддержки принятия
- •12.1. Управление, как информационный процесс
- •12.2. Классификация ис по принципу структурированности решаемых задач
- •12.3. Структура сппр
- •12.4. Архитектура сппр
- •13. Технологии использования искусственного интеллекта
- •13.1. Экспертные системы
- •13.2. Нейросетевые технологии и области их применения
- •14. Защита информации в экономических
- •14.1. Виды угроз безопасности эис
- •14.2. Методы и средства защиты информации в эис
- •14.3. Основные виды защиты, используемые в аит банковской
- •Список сокращений
- •Библиографический список
1. Объем поискового индекса
Поисковые системы периодически просматривают узлы Интернет и формируют постоянно обновляемые индексы документов. Из-за экспоненциального расширения Всемирной сети исчерпывающее индексирование всего содержимого Web и создание одного огромного индекса практически невозможно. В настоящее время даже лучшие поисковые системы индексируют не более трети всего содержимого Сети.
Самый больший объем индексируемой информации собран на узле HotBot (34%); несколько меньший — на Alta Vista (28%), Northern Light (20%) и Excite (14%). Список замыкает Lycos, поисковая машина которого индексирует только около 3% всей информации.
Метод выбора серверов для просмотра (опроса)
Генерация поискового индекса требует систематического обхода Web-узлов и определения местонахождения каждого документа. Структура Web аналогична структуре ориентированного графа, поэтому здесь применимы алгоритмы обхода графа. Существуют четыре метода такого обхода:
случайный выбор первого URL-адреса для инициализации поиска. Программа индексирует начальный документ, выделяет URL-адреса, указывающие на другие документы, а затем анализирует эти URL для поиска «преимущественно в ширину» или «преимущественно в глубину»;
поиск начинается с набора URL-адресов, определяемых на основе популярности Web-узлов;
пространство Web делится на разделы на основе системы имен Интернет или кодов стран, а для полного исследования этих разделов выделяется одна или несколько программ-роботов;
такой метод используется чаще, чем первые два;
частота опроса — каждые несколько часов, каждый день каждый месяц. Частота опроса является важной характеристикой качества работы системы, т. к. определяет актуальность и полноту индекса.
3. Используемые поисковые технологии
По этому критерию поисковые системы можно разбить на 4 категории:
Тематические каталоги.
Специализированные каталоги (онлайновые справочники).
Поисковые машины (полнотекстовый поиск).
Средства мета-поиска.
Тематические каталоги предусматривают обработку документов и отнесение их к одной из нескольких категорий, перечень которых заранее задан. Фактически — это индексирование на основе классификации.
Индексирование может проводиться автоматически либо вручную с помощью специалистов, которые просматривают популярные Web-узлы и составляют краткое описание документов-резюме (ключевые слова, аннотация, реферат).
Например, в ИПС Yahoo каталог построен на основе фасетно-иерархической классификации. Иерархически организованный тематический каталог Web генерируется полуавтоматически. Ссылки на различные ресурсы собираются двумя способами: присылаются пользователями и извлекаются программами-роботами, считывающими новые ссылки из известных источников. Тематика каталога разделена на большие классы, например. Компьютеры, Правительство, которые далее детализируются по иерархическому принципу.
В ИПС Magellan индексируются Web-узлы, серверы FTP и Gopher, а также новости Usenet и сеансы Telnet. Коллектив редакторов и авторов просматривает Web-узлы и ранжирует их по таким факторам, как полнота и простота исследования. Пользователи могут присылать для рецензии свои URL-адреса. Критерий выдачи оценивается на основе частоты вхождения терминов запроса в документ. Более релевантными считаются те документы, которые содержат указанные в запросе термины в заголовке, дескрипторе МЕТА или URL-адреса. Результаты запроса ранжируются.
Специализированные каталоги или справочники создаются по отдельным отраслям и темам, по новостям, по городам, по адресам электронной почты и т. п.
Поисковые машины (самое развитое средство поиска) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов. Например, в индексе популярной ИС AltaVista около 60 млн. URL-адресов. Запрос может быть сформулирован как запрос к полнотекстовой базе данных, распределенной в сети. Поскольку это база огромных размеров, характер запроса очень сильно влияет на результат. При формировании запроса в ПС могут использоваться следующие инструменты:
1. Отдельные ключевые слова — этот вид запроса целесообразно использовать только для узко специальных терминов. В противном случае количество найденных документов может достигать нескольких десятков тысяч, т. е. такой поиск становится бессмысленным.
2. Логические операторы (булев поиск).
