
- •9.3.1. Психологічний аспект
- •Контактний шар (s11)
- •Процедурний шар (s12)
- •Когнітивний шар (s13)
- •3.3.2. Лінгвістичний аспект
- •Р ис.3.11. Лінгвістичний аспект витягу знань
- •Понятійна структура (s22)
- •Словник користувача (s23)
- •3.3.3. Гносеологічний аспект витягу знань
- •Гносеологічний ланцюжок: факт узагальнений факт емпіричний закон теоретичний закон.
- •Внутрішня погодженість (s31)
- •Системність (s32)
- •Об'єктивність (s33)
- •Історизм (s34)
- •Е_3. Побудова ідеалізованої моделі
- •Е_4. Пояснення і прогнозування моделей
3.3.2. Лінгвістичний аспект
Лінгвістичний (А2) аспект стосується досліджень мовних проблем, тому що мова – це основний засіб спілкування в процесі витягу знань.
Відразу ж слід домовитися про, що оскільки тема даної книги обмежена викладом теорії і технології інженерії знань, то область розробки природно-мовних інтерфейсів і весь спектр проблем, зв'язаних з нею – лексичних, , семантичних, прагматичних і т.д. [Виноград, 1976; Мальковский, 1985; Попов, 1982], – не розглядається.
В інженерії знань можна виділити три шари лінгвістичних проблем (Рис.3.11 ):
А2 = {S21, S22, S23) = (“загальний код, понятійна структура, словник користувача).
Р ис.3.11. Лінгвістичний аспект витягу знань
“Загальний код” (S21)
“Загальний код” вирішує проблему мовних ножиців між професійною термінологією експерта і повсякденною літературною мовою інженера по знаннях і включає наступні компоненти:
S21 = {s21_i} = {загальнонаукова термінологія; спеціальні поняття з професійної літератури; елементи побутового мови; неологізми, сформовані за час спільної роботи; професійний жаргон і ін.).
Деталізація схеми спілкування (див. Рис.3.8) на Рис.3.11 дозволяє представити засіб спілкування як два потоки [Горелов, 1987], у яких нас цікавлять компоненти V1 і V2 – мови, на яких говорять аналітик і експерт (V1', V2' – невербальні компоненти). Розходження мов V1 і V2 і обумовлює “мовний бар'єр” чи “мовні ножиці” у спілкуванні інженера по знаннях і експерта.
Ці дві мови є відображенням “внутрішньої мови” експерта й аналітика, оскільки більшість психологів і лінгвістів вважають, що мова – це основний засіб мислення поряд з іншими знаковими системами “внутренішнього користування” (універсальний семантичний код – УСК [Мартынов, 1977], мови “змісту” [Мельчук, 1974], концептуальні мови [Шенк, 1980] і ін.).
Мова аналітика V1 складається з трьох компонентів:
s21_1 – загальнонаукової термінології з його “теоретичного багажу”;
s21_2 – термінів предметної області, що він почерпнув зі спеціальної літератури в період підготовки;
s21_3 – побутові розмовні мови, яким користається аналітик. Мова експерта V2 включає:
s21_1 – загальнонаукову термінологію;
s21_2 – спеціальну термінологію, прийняту в предметній області;
s21_3 – побутова мова;
s21_4 – неологізми, створені експертом за час роботи, тобто його професійний жаргон.
Якщо вважати, що побутова і загальнонаукова мови в двох учасників спілкування приблизно збігаються (хоча реально обсяг другого компонента в експерта істотно більше), то деяка загальна чи мова код, якім необхідно виробити партнерам для успішної взаємодії, буде складатися з потоків, представлених на Рис.3.12.
Надалі цей загальний код перетвориться в деяку понятійну (семантичну) мережу, що є прообразом поля знань предметної області. Вироблення загального коду починається з виписуванням аналітиком усіх термінів, уживаних експертом, і уточнення їхнього змісту: Фактично це складання словника предметної області. Потім випливає групування термінів і вибір синонімів (слів, що означають те саме). Розробка загального коду закінчується складанням словника термінів предметної області з попереднім угрупованням їх за змістом, тобто по понятійній близькості (це вже перший крок структурування знань).
На цьому етапі аналітик повинний з великою увагою віднестися до всіх спеціальних термінів, намагаючись максимально вникнути в суть розв'язуваних проблем і термінологію. Освоєння аналітиком мови предметної області – перша сходинка на підступах до створення адекватної бази знань.
Рис.3.12. Структура загального коду
Малюнок 3.12 дає представлення про процес неоднозначності інтерпретації термінів двома фахівцями. У семіотиці, науці про знакові системи, проблема інтерпретації є однієї з центральних. Інтерпретація зв'язує “знак” і “ означуваний предмет ”. Тільки в інтерпретації знак одержує зміст. Так, на Рис.3.13 слова “прилад Х ” для експерта означає якусь конкретну схему, що відповідає схемі оригіналу приладу, а в голові починаючого аналітика слова “прилад Х” викликають порожній чи образ деякого чорного ящику з ручками.
Рис.3.13. Неоднозначність інтерпретації
Увага до лінгвістичного аспекту проблеми витягу знань сприяє зближенню образа 1 з образам 2 і інтерпретації I1 з інтерпретацією I2, а слова “прилад Х” перейдуть у дійсно “загальний” код.
Таким чином, шар S21 включає вивчення і керування процесом розробки спеціальної проміжної мови, необхідно] для взаємодопомоги інженера по знаннях і експерта.