
- •Основи шформаційних систем Навчальний посібник
- •03680, М. Київ, просп. Перемоги, 54/1
- •1.2. Системи, системи управління, системний підхід в організаційному управлінні: основні терміни та визначення
- •1.3. Створення комп'ютерної технології управління народним господарством — органічна складова об'єктивного процесу інформатизації сучасного суспільства
- •Запитання для самоперевірки
- •Розділ 2. Характеристика інформаційних систем в управлінні народним господарством
- •2.1. Основні етапи розвитку інформаційних систем
- •2.2. Класифікація інформаційних систем
- •2.3. Структура інформаційних систем
- •2.4. Перспективні засоби і напрямки розвитку інформаційних систем
- •Запитання для самоперевірки
- •Розділ 3. Економічна інформація як об'єкт автоматизованої обробки
- •3.1. Поняття економічної інформації, її види та властивості
- •3.2. Структура, форми подання та відображення економічної інформації
- •3.3. Оцінювання економічної інформації
- •3.4. Інформаційні процедури
- •Запитання для самоперевірки
- •4.1. Характеристика засобів формалізованого описання економічної інформації
- •Основні національні статистичні класифікації україни
- •4.2. Методи класифікації економічної інформації
- •Утворення класифікаційних угруповань
- •4.3. Методи кодування економічної інформації
- •4.4. Єдина система класифікації та кодування техніко-економічної інформації
- •4.5. Категорії класифікаторів, порядок їх розробки, упровадження та ведення
- •4.6. Штрихове кодування інформації
- •4.7. Моделювання елементів економічної інформації
- •Запитання для самоперевірки
- •Розділ 5. Органзація позамашинної інформаційної бази
- •5.1. Поняття позамашинної інформаційної бази, склад робіт з її організації
- •5.2. Носії інформації, їхній склад та характеристика
- •5.3. Уніфікована система первинної документації, поняття, склад та вимоги
- •5.4. Вихідні документи. Розробка форм та вибір засобів виводу
- •Запитання для самоперевірки
- •Розділ 6. Організація машинної інформаційної бази
- •6.1. Поняття машинного інформаційного забезпечення
- •6.2. Передумови створення та основні переваги бд
- •6.3. Поняття і класифікація абд
- •6.4. Склад абд
- •6.5. Характеристика інфологічної та дат алогічної моделі баз даних
- •6.6. Методи створення оптимальної моделі баз даних
- •6.7. Теорія нормалізації відношень
- •6.8. Побудова логічної моделі даних
- •6.9. Поняття сховищ даних та основи їх створення
- •6.9.1. Архітектура сховищ даних
- •6.9.2. Моделі сховищ даних
- •Запитання для самоперевірки
- •Розділ 7. Основи створення комп'ютерних технологій
- •7.1. Характеристика та класифікація технологічних операцій
- •7.2. Технологічні процеси автоматизованої обробки економічної інформації
- •7.3. Типові технологічні операції та їх виконання в інформаційних системах обробки даних
- •Запитання для самоперевірки
- •Розділ 8. Режими роботи еом та їх особливості
- •8.1. Загальна характеристика режимів роботи еом
- •8.2. Організація пакетного режиму обробки інформації
- •8.3. Організація діалогового режиму обробки інформації
- •Запитання для самоперевірки
- •Розділ 9. Організаційно-методичні основи створення та функціонування інформаційних систем
- •9.1. Стадії та етапи розробки
- •9.2. Організація робіт, спрямованих на створення та впровадження інформаційних систем
- •9.3. Документація на розробку інформаційних систем
- •Запитання для самоперевірки
- •Розділ 10. Інформаційні системи організаційного управління
- •10.1. Концепція розподільної обробки інформації в управлінських інформаційних системах
- •10.2. Характеристика і призначення інтегрованих інформаційних систем
- •10.3. Банківські інформаційні системи
- •10.3.1. Структура автоматизованої банківської системи
- •10.3.2. Функціональна структура абс
- •10.3.3. Модульний підхід до структуризації абс
- •10.3.4. Програмно-технічна платформа абс
- •10.4. Інформаційні системи в фінансах
- •10.4.1. Автоматизована система фінансових розрахунків (асфр)
- •10.4.2. Аіс у податкових органах України
- •10.4.3. Аіс в страхуванні
- •10.5. Інформаційні системи у статистиці
- •Запитання для самоперевірки
- •Розділ 11. Системи підтримки прийняття рішень
- •11.1. Розвиток і впровадження систем підтримки прийняття рішень
- •11.1.1. Сутність і загальна характеристика сппр
- •11.1.2. Сфери застосування та приклади використання сппр
- •11.2. Компоненти систем підтримки прийняття рішень
- •11.2.1. Інтерфейс користувач—система
- •11.2.2. База даних і система управління базою даних
- •11.2.3. Бази моделей і системи управління базами моделей
- •11.2.4. Управління поштою (повідомленнями) в сппр
- •11.3. Групові системи підтримки прийняття рішень
- •11.3.1. Групові рішення
- •11.3.2. Групове забезпечення
- •Функціональні можливості (призначення) продукції гсп
- •11.3.3. Визначення та призначення гсппр
- •11.3.4. Підтримувальні засоби гсппр
- •11.4. Виконавчі інформаційні системи
- •11.4.1. Визначення і призначення віс
- •Інформаційні потреби опр, реалізовані засобами віс
- •Вимоги щодо моделювання в віс
- •11.4.2. Використання віс
- •11.4.3. Доступне програмне забезпечення віс
- •Запитання для самоперевірки
- •Розділ 12. Інтелектуальні інформаційні системи в економіці
- •12.1. Загальні аспекти розробки систем зі штучним інтелектом
- •12.2. Експертні системи та їх характеристика
- •12.3. Поняття знань та відмінності їх від даних
- •12.4. Модель продукції
- •Запитання для самоперевірки
- •Розділ 13. Інформаційно-пошукові системи в економіці
- •13.1. Поняття інформаційно-пошукової системи
- •13.2. Інформаційно-пошукова мова та її використання в аіпс
- •13.4. Інформаційно-пошуковий тезаурус
- •13.5. Шформаційно-пошукові системи internet
- •13.5.1. Подання інформаційних ресурсів у internet
- •13.5.2. Механізми пошуку в Internet
- •13.5.3. Інформаційно-пошукова мова системи
- •13.5.4. Інтерфейс системи
- •13.5.5. Інструментальні засоби пошуку в Internet
- •Російські та російськомовні пошукові системи Каталоги і пошукові системи
- •Пошук інформації в системі телеконференцій Usenet
- •Метапошукові системи
- •Списки російськомовних пошукових ресурсів
- •Міжнародний пошук
- •Метапошукові системи
- •Спеціалізований пошук
- •Списки пошукових ресурсів
- •Пошук людей
- •Запитання для самоперевірки
- •Розділ 14. Корпоративні шформащйш системи
- •14.1. Загальна характеристика корпоративних інформаційних систем
- •14.2. Корпоративна інформаційна система r/3
- •14. 3. Система управління бізнесом і фінансами scala 5
- •14. 4. Система управління ресурсами підприємства oracle application
- •14.5. Інформаційна система управління ресурсами підприємств baan—IV
- •14.6. Комплексна система управління діяльністю підприємства галактика
- •Запитання для самоперевірки
- •Література
13.5. Шформаційно-пошукові системи internet
Мережа Internet з'явилась близько двадцяти років тому в США. Нині це вже глобальна міжнародна інформаційна система, яка може бути використана як для інформаційного пошуку, так і у комерційних цілях для інформаційного обміну як корпоративна мережа. Загальну схему інформаційно-пошукової системи Internet зображено на рис. 13.2.
Рис. 13.2. Типова схема інформаційно-пошукової системи
Клієнт — це програма перегляду конкретного інформаційного ресурсу. Найбільш популярні сьогодні мультипротокольні програми типу Netscape Navigator. Така програма забезпечує перегляд документів WWW, Gopher, Wais, FTP-архівів, поштових списків розсилки і груп новин Usenet. У свою чергу всі ці інформаційні ресурси є об'єктом пошуку інформаційно-пошукової системи.
Інтерфейс користувача — це не просто програма перегляду, у разі інформаційно-пошукової системи під цим словосполученням розуміють також спосіб спілкування користувача з пошуковим апаратом, системою формування запитів і перегляду результатів пошуку.
Пошукова машина — застосовується для трансляції запиту на інформаційно-пошукову мову (ІПМ), у формальний запит системи, пошуку посилань на інформаційні ресурси мережі і видачі результатів цього пошуку користувачеві.
Бази даних індексів — це основний масив даних ІПС, використовуваних для пошуку адреси інформаційного ресурсу. Архітектура індексу влаштована таким чином, щоб пошук відбувався максимально швидко і при цьому можна було б визначити цінність кожного із знайдених інформаційних ресурсів мережі.
Запити користувача — зберігаються в його (користувача) особистій базі даних. На відлагодження кожного запиту йде досить багато часу, і тому надзвичайно важливо запам'ятовувати запити, на які система дає гарні відповіді.
Робот-індексувальник — застосовується для сканування Internet і підтримки бази даних індексу в актуальному стані. Ця програма є основним джерелом інформації про стан інформаційних ресурсів мережі.
WWW sites — це весь Internet або точніше — інформаційні ресурси, перегляд яких забезпечується програмами перегляду.
Розглянемо тепер призначення і принципи побудови кожної з цих компонентів докладніше і визначимо, в чому відмінність даної системи від традиційної ІПС для локального типу.
13.5.1. Подання інформаційних ресурсів у internet
Інформаційними ресурсами в ІПС Internet документи шести основних типів: WWW-сторінки, Gopher-файли, документи Wais, записи архівів FTP, новини Usenet і статті поштових списків розсилки. Усе це досить різнорідна інформація, подана у вигляді різних, ніяк неузгоджених один з одним форматів даних: тексти, графічна і аудіоінформація тощо.
У традиційних ІПС використовується поняття пошукового образу документа — ПОД. Цим терміном позначають щось, що замінює собою документ і що використовується при пошуку замість реального документа. Найбільш популярною моделлю створення ПОД є векторна модель, в якій кожному документу приписується список термінів, що найбільш адекватно відображають його тематику. Документу приписується вектор розмірності, рівний числу термінів, якими можна скористатися при пошуку. Якщо використовується булєва векторна модель, то елемент вектора рівний 1 або 0, в залежності від наявності або відсутності терміну в ПОД. У більш складних моделях терміни зважуються — елемент вектора рівний не 1 або 0, а деякому числу (вазі), що відображає відповідність даного терміну документу. Саме остання модель стала найбільш популярною в ІПС Internet. Лінійна модель застосовується в системах Lycos, WebCrawler, AltaVista, OpenText і AliWeb.
Перша задача, яка вирішується в ІПС, — це визначення списку ключових слів, які характеризують документ чи інший інформаційний ресурс. Ця процедура називається індексуванням. Іноді процедуру індексування називають складанням файла інвертованого списку, в якому кожному терміну індексування ставиться у відповідність список документів, в яких він зустрічається. Така процедура є тільки окремим випадком, а точніше, технічним аспектом створення пошукового апарату ІПС.
Під час роботи у World Wide Web індексування виконують спеціальні програми, що називаються роботами-індексувальни-ками, які виконують сканування мережі. Робот переглядає мережу, знаходить нові ресурси, приписує їм терміни і вміщує в базу даних індексу. Головне питання полягає в тому, які терміни приписувати документам, звідки їх брати, адже ряд ресурсів взагалі не є текстом. Сьогодні роботи звичайно використовують для індексування наступні джерела для поповнення своїх віртуальних словників: гіпертекстові посилання, заголовки, анотації, списки ключових слів, повні тексти документів, а також повідомлення адміністраторів про свої Web-сторінки. Для індексування telnet, gopher, ftp, нетекстовій інформації використовуються головним чином URL, для новин Usenet і поштових списків поля Subject і Keywords. Найбільший простір для побудови ПОД дають HTML документи. Однак не треба думати, що всі терміни з перелічених елементів документів потрапляють до їх пошукових образів. Дуже активно застосовуються списки заборонених слів (stop-words), які не можуть бути вжиті для індексування, загальних слів (прийменники, сполучники і т. п.). Таким чином навіть те, що в OpenText, наприклад, називається повнотекстовим індексуванням, реально є вибором слів з тексту документа і порівнянням з набором різних словників, після якого термін надходить до ПОД, а потім і до індексу системи. Для того щоб не збільшувати словників і індексів (індекс системи Lycos вже сьогодні рівний 4 Тбайт), застосовується таке поняття, як вага терміна. Документ звичайно індексується через 40—100 найбільш вагомих термінів.