- •Основи шформаційних систем Навчальний посібник
- •03680, М. Київ, просп. Перемоги, 54/1
- •1.2. Системи, системи управління, системний підхід в організаційному управлінні: основні терміни та визначення
- •1.3. Створення комп'ютерної технології управління народним господарством — органічна складова об'єктивного процесу інформатизації сучасного суспільства
- •Запитання для самоперевірки
- •Розділ 2. Характеристика інформаційних систем в управлінні народним господарством
- •2.1. Основні етапи розвитку інформаційних систем
- •2.2. Класифікація інформаційних систем
- •2.3. Структура інформаційних систем
- •2.4. Перспективні засоби і напрямки розвитку інформаційних систем
- •Запитання для самоперевірки
- •Розділ 3. Економічна інформація як об'єкт автоматизованої обробки
- •3.1. Поняття економічної інформації, її види та властивості
- •3.2. Структура, форми подання та відображення економічної інформації
- •3.3. Оцінювання економічної інформації
- •3.4. Інформаційні процедури
- •Запитання для самоперевірки
- •4.1. Характеристика засобів формалізованого описання економічної інформації
- •Основні національні статистичні класифікації україни
- •4.2. Методи класифікації економічної інформації
- •Утворення класифікаційних угруповань
- •4.3. Методи кодування економічної інформації
- •4.4. Єдина система класифікації та кодування техніко-економічної інформації
- •4.5. Категорії класифікаторів, порядок їх розробки, упровадження та ведення
- •4.6. Штрихове кодування інформації
- •4.7. Моделювання елементів економічної інформації
- •Запитання для самоперевірки
- •Розділ 5. Органзація позамашинної інформаційної бази
- •5.1. Поняття позамашинної інформаційної бази, склад робіт з її організації
- •5.2. Носії інформації, їхній склад та характеристика
- •5.3. Уніфікована система первинної документації, поняття, склад та вимоги
- •5.4. Вихідні документи. Розробка форм та вибір засобів виводу
- •Запитання для самоперевірки
- •Розділ 6. Організація машинної інформаційної бази
- •6.1. Поняття машинного інформаційного забезпечення
- •6.2. Передумови створення та основні переваги бд
- •6.3. Поняття і класифікація абд
- •6.4. Склад абд
- •6.5. Характеристика інфологічної та дат алогічної моделі баз даних
- •6.6. Методи створення оптимальної моделі баз даних
- •6.7. Теорія нормалізації відношень
- •6.8. Побудова логічної моделі даних
- •6.9. Поняття сховищ даних та основи їх створення
- •6.9.1. Архітектура сховищ даних
- •6.9.2. Моделі сховищ даних
- •Запитання для самоперевірки
- •Розділ 7. Основи створення комп'ютерних технологій
- •7.1. Характеристика та класифікація технологічних операцій
- •7.2. Технологічні процеси автоматизованої обробки економічної інформації
- •7.3. Типові технологічні операції та їх виконання в інформаційних системах обробки даних
- •Запитання для самоперевірки
- •Розділ 8. Режими роботи еом та їх особливості
- •8.1. Загальна характеристика режимів роботи еом
- •8.2. Організація пакетного режиму обробки інформації
- •8.3. Організація діалогового режиму обробки інформації
- •Запитання для самоперевірки
- •Розділ 9. Організаційно-методичні основи створення та функціонування інформаційних систем
- •9.1. Стадії та етапи розробки
- •9.2. Організація робіт, спрямованих на створення та впровадження інформаційних систем
- •9.3. Документація на розробку інформаційних систем
- •Запитання для самоперевірки
- •Розділ 10. Інформаційні системи організаційного управління
- •10.1. Концепція розподільної обробки інформації в управлінських інформаційних системах
- •10.2. Характеристика і призначення інтегрованих інформаційних систем
- •10.3. Банківські інформаційні системи
- •10.3.1. Структура автоматизованої банківської системи
- •10.3.2. Функціональна структура абс
- •10.3.3. Модульний підхід до структуризації абс
- •10.3.4. Програмно-технічна платформа абс
- •10.4. Інформаційні системи в фінансах
- •10.4.1. Автоматизована система фінансових розрахунків (асфр)
- •10.4.2. Аіс у податкових органах України
- •10.4.3. Аіс в страхуванні
- •10.5. Інформаційні системи у статистиці
- •Запитання для самоперевірки
- •Розділ 11. Системи підтримки прийняття рішень
- •11.1. Розвиток і впровадження систем підтримки прийняття рішень
- •11.1.1. Сутність і загальна характеристика сппр
- •11.1.2. Сфери застосування та приклади використання сппр
- •11.2. Компоненти систем підтримки прийняття рішень
- •11.2.1. Інтерфейс користувач—система
- •11.2.2. База даних і система управління базою даних
- •11.2.3. Бази моделей і системи управління базами моделей
- •11.2.4. Управління поштою (повідомленнями) в сппр
- •11.3. Групові системи підтримки прийняття рішень
- •11.3.1. Групові рішення
- •11.3.2. Групове забезпечення
- •Функціональні можливості (призначення) продукції гсп
- •11.3.3. Визначення та призначення гсппр
- •11.3.4. Підтримувальні засоби гсппр
- •11.4. Виконавчі інформаційні системи
- •11.4.1. Визначення і призначення віс
- •Інформаційні потреби опр, реалізовані засобами віс
- •Вимоги щодо моделювання в віс
- •11.4.2. Використання віс
- •11.4.3. Доступне програмне забезпечення віс
- •Запитання для самоперевірки
- •Розділ 12. Інтелектуальні інформаційні системи в економіці
- •12.1. Загальні аспекти розробки систем зі штучним інтелектом
- •12.2. Експертні системи та їх характеристика
- •12.3. Поняття знань та відмінності їх від даних
- •12.4. Модель продукції
- •Запитання для самоперевірки
- •Розділ 13. Інформаційно-пошукові системи в економіці
- •13.1. Поняття інформаційно-пошукової системи
- •13.2. Інформаційно-пошукова мова та її використання в аіпс
- •13.4. Інформаційно-пошуковий тезаурус
- •13.5. Шформаційно-пошукові системи internet
- •13.5.1. Подання інформаційних ресурсів у internet
- •13.5.2. Механізми пошуку в Internet
- •13.5.3. Інформаційно-пошукова мова системи
- •13.5.4. Інтерфейс системи
- •13.5.5. Інструментальні засоби пошуку в Internet
- •Російські та російськомовні пошукові системи Каталоги і пошукові системи
- •Пошук інформації в системі телеконференцій Usenet
- •Метапошукові системи
- •Списки російськомовних пошукових ресурсів
- •Міжнародний пошук
- •Метапошукові системи
- •Спеціалізований пошук
- •Списки пошукових ресурсів
- •Пошук людей
- •Запитання для самоперевірки
- •Розділ 14. Корпоративні шформащйш системи
- •14.1. Загальна характеристика корпоративних інформаційних систем
- •14.2. Корпоративна інформаційна система r/3
- •14. 3. Система управління бізнесом і фінансами scala 5
- •14. 4. Система управління ресурсами підприємства oracle application
- •14.5. Інформаційна система управління ресурсами підприємств baan—IV
- •14.6. Комплексна система управління діяльністю підприємства галактика
- •Запитання для самоперевірки
- •Література
13.2. Інформаційно-пошукова мова та її використання в аіпс
Кожна ІПС містить певний набір семантичних засобів (куди належить, зокрема, інформаційно-пошукова мова), методи індексування документів та запитів, методи пошуку. Основу семантичних засобів становить ІПМ. Інформаційно-пошукова мова — це спеціалізована штучна мова, яка призначена для опису центральних тем чи предметів і формальних характеристик документів, а також для опису інформаційних запитів і наступного виконання пошуку.
Іноді в АІПС одну мову використовують для індексації документів, а іншу — для індексації інформаційних запитів.
До ІПМ ставиться цілий ряд вимог:
-
ІПМ повинна мати достатній набір лексико-граматичних засобів для точного вираження центральних тем або змісту будь-якого тексту (документа) і теми довільного інформаційного запиту;
-
ІПМ має бути однозначною, тобто кожний запис нею повинен мати лише одне семантичне тлумачення;
-
ІПМ має бути зручною для порівняння та повного чи часткового порівняння ПОБ і ПР;
-
ІПМ має бути компактною, мати невелику вартість та бути відкритою для можливого розширення та внесення змін.
Жодна з природних мов не може бути використана як ШМ через недостатню структуризацію, велику кількість граматичних винятків, неоднозначність та велику надлишковість природної мови. Наприклад, у російській мові надлишковість досягає 75—85 %.
В ІПМ не допускається наявність характерних для природної мови синонімів та омонімів, оскільки вони спричинюються до семантичної неоднозначності мови.
Основними елементами ІПМ є алфавіт, лексика, граматика, парадигматичні (базові) відношення, правила побудови індексів та їх ідентифікація.
Алфавітом називається система графічних знаків, що використовуються для фіксації слів і словосполучень мови.
Лексика мови — це сукупність слів, що використовуються в ній.
Граматика — це сукупність діючих засобів та правил побудови висловлювань засобами цієї мови.
Відношення між словами, які не залежать від контексту, де вони використовуються і спричинені не мовними, а логічними зв'язками, називаються парадигматичними відношеннями. Ці відношення називаються ще аналітичними, або базовими. Завдяки предметно-логічним зв'язкам слова на основі тієї чи іншої семантичної ознаки можуть об'єднуватися в лексико-семантичні групи, які називаються парадигмами. Наприклад, слова «магнітна стрічка», «магнітний диск», «перфокартка», «перфострічка», «гнучка магнітна дискета» утворюють тематичну групу «носії інформації». У середині цієї групи перелічені слова можна об'єднати в лексико-семантичні парадигми «носії паперові», «носії магнітні».
Іншим типом відношень, що пов'язують слова будь-якої мови, є такі лінійні відношення, які безпосередньо установлюються при об'єднанні слів у словосполучення та фрази. Такі відношення називаються синтагматичними. Одним із найпростіших видів синтагматичних відношень є таке, коли до того чи іншого поняття приєднується ще одне, яке пояснює перше і вказує на те, що воно є власним ім'ям, визначенням чи певним видом діяльності. Так, наприклад, якщо документ стосується винахідника і його винаходу, то поняття, які стосуються винаходу та винахідника, відмічаються окремо, щоб уникнути плутанини при виконанні пошуку, наприклад, «Дизель» (винахідник) і «дизель» (двигун).
Із щойно сказаного можна зробити такий висновок: парадигматика спирається на певну сукупність (перелік) пов'язаних між собою мовних одиниць, а синтагматика потребує певних правил об'єднання цих одиниць у словосполучення. Тому парадигматику мови можна з певним припущенням порівнювати з її лексикою, а синтагматику мови — з її граматикою.
При розробці ІПМ слід ураховувати таке:
специфіку галузі чи предмета, для якого ця мова розробляється;
особливості текстів (документів), які утворюють пошуковий масив;
характер інформаційних потреб, для задоволення яких створюється ІПС.
Доцільність використання тієї чи іншої мови багато в чому залежить від призначення інформаційної системи, рівня її оснащення технічними засобами та рівня автоматизації. Для збері-
гання документів у бібліотеках і технічних архівах використовують, як правило, мови, якими поширюються традиційні бібліотечно-бібліографічні класифікації. Словниковий склад цих мов задається у вигляді фіксованого списку слів і словосполучень. Ці мови належать до класифікаційного типу, причому розглядаються такі системи класифікації: ієрархічна, алфавітно-предметна, фасетна.
З огляду на ріст інформаційних потоків та інформаційних потреб перелічені мови класифікаційного типу не задовольняють вимог сучасних інформаційних систем. Адже мова цього типу має дуже обмежений словниковий запас, поповнювати який дуже нелегко, а тому мови цієї групи використовуються в дуже вузько-спеціалізованих системах. Більш поширені інформаційно-пошукові мови дескрипторного типу. Ця мова характеризується тим, що її словник складається із окремих ізольованих слів та словосполучень, розміщених в алфавітному порядку. Дескрипторна мова грунтується на методі координатного індексування, який дає змогу виражати зміст документа шляхом встановлення відповідності між текстом цього документа і деякою множиною ключових слів чи дескрипторів. Тому дескрипторні мови називають посткоор-динатними, а в противагу їм традиційні бібліотечно-бібліографічні мови належать до передкоординатних. До посткоординатних мов належать дескрипторні мови, а також семантичні коди та синтагматична мова. Загальна класифікація ІПМ має такий вигляд:
1. Передкоординатні ІПМ.
1.1. Ієрархічна класифікація.
1.2. Алфавітно-предметна класифікація.
1.3. Фасетна класифікація.
2. Посткоординатні ІПМ.
2.1. Дескрипторні мови.
2.2. Семантичні коди.
2.3. Синтагматичні мови.
Розглянемо докладніше дескрипторну мову.
13.3. ДЕСКРИПТОРНА ІНФОРМАЦІЙНО-ПОШУКОВА МОВА ТА ПРИНЦИПИ її ПОБУДОВИ
У сучасних АІПС дескрипторна мова експлуатується в двох варіантах:
1. Обробка документів і запитів за допомогою інформаційно-пошукового тезаурусу.
2. Безтезаурусний ввід і пошук документів.
При використанні дескрипторної мови основний зміст запиту чи документа виражається у вигляді деякої сукупності слів чи словосполучень природної мови. Слова та словосполучення є іменами деяких класів понять. Слово чи словосполучення, яке входить до пошукового образу, задає координати документа в багатовимірному просторі ознак.
Для координатного індексування документів чи запитів можна як лексичні одиниці ІПМ використовувати слова, які безпосередньо вибираються з індексованих текстів. Такі слова та словосполучення називаються ключовими словами.
Як уже зазначалося, пошук в ІПС зводиться до формального порівняння пошукового образу документа та пошукового розпорядження (запиту).
Проте простий вибір ключових слів із тексту для послівного порівняння ПОБ і ПР є складним через наступні причини:
-
можливе різне написання одних і тих самих слів;
-
серед ключових слів є дуже багато синонімів та омонімів;
-
ключові слова не визначають родово-видові відношення між словами.
Наприклад, темою запиту є отримання документації про напівпровідникову продукцію, що виготовляється на заводі. При виконанні запиту документація, що містить інформацію про транзистори, не буде видана як відповідь на запит, незважаючи на те, що поняття «напівпровідник» охоплює вужче поняття — «транзистор».
Для усунення цих недоліків при розробці дескрипторної мови виконується спеціальний лексикограматичний контроль, будуються спеціальні словники, схеми, таблиці, які дають змогу виразити парадигматичні відношення між термінами індексування. Для дескрипторної мови розробляється спеціальний синтаксис.
Лексикографічний контроль полягає в тому, що всі ключові слова зводяться до нормального вигляду, тобто до одної форми написання і повного усунення синонімії, омонімії та різного роду багатозначностей за допомогою спеціального нормативного словника. У цьому словнику в єдиній морфологічній формі перелічені всі ключові слова. Зі списку ключових слів вибираються слова, які в межах даної ІПМ є синонімами. Ці ключові слова групуються в класи умовної еквівалентності (парадигми). Із кожної такої групи вибирається одне слово чи словосполучення, яке є семантичною домінантою групи, тобто найповніше визначає зміст слів відповідної групи. Ці слова стають дескрипторами, тобто лексичними одиницями ІПМ. Звідси й походить назва «дескрипторна мова».
Отже, дескриптори — необхідні для координатного індексування документів та інформаційних запитів. Це нормативні ключові слова, які відібрані з основного словникового складу природної мови так, аби серед них не було омонімів, синонімів та багатозначності.
Дескрипторною називається спеціалізована інформаційно-пошукова мова, словниковий склад якої становлять дескриптори, а граматика — способи побудови пошукових образів та пошукових розпоряджень координацією відповідних дескрипторів.
Словниковий склад ІПМ можна розбити на дві частини.
-
Основний словниковий склад, до якого належать дескриптори однієї галузі.
-
Ключові слова, які позначають чи виражають власні імена, вузькі чи нові поняття, специфічні найменування, кількісні характеристики і т.ін.
Дескриптори та ключові слова з певної галузі записуються в алфавітному порядку і утворюють нормативний словник.