Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ES_Lek-9-2009_EU.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
266.24 Кб
Скачать

3.3.2. Лінгвістичний аспект

Лінгвістичний (А2) аспект стосується досліджень мовних проблем, тому що мова – це основний засіб спілкування в процесі витягу знань.

Відразу ж слід домовитися про, що оскільки тема даної книги обмежена викладом теорії і технології інженерії знань, то область розробки природно-мовних інтерфейсів і весь спектр проблем, зв'язаних з нею – лексичних, , семантичних, прагматичних і т.д. [Виноград, 1976; Мальковский, 1985; Попов, 1982], – не розглядається.

В інженерії знань можна виділити три шари лінгвістичних проблем (Рис.3.11 ):

А2 = {S21, S22, S23) = (“загальний код, понятійна структура, словник користувача).

Р ис.3.11. Лінгвістичний аспект витягу знань

Загальний код” (S21)

“Загальний код” вирішує проблему мовних ножиців між професійною термінологією експерта і повсякденною літературною мовою інженера по знаннях і включає наступні компоненти:

S21 = {s21_i} = {загальнонаукова термінологія; спеціальні поняття з професійної літератури; елементи побутового мови; неологізми, сформовані за час спільної роботи; професійний жаргон і ін.).

Деталізація схеми спілкування (див. Рис.3.8) на Рис.3.11 дозволяє представити засіб спілкування як два потоки [Горелов, 1987], у яких нас цікавлять компоненти V1 і V2 – мови, на яких говорять аналітик і експерт (V1', V2' – невербальні компоненти). Розходження мов V1 і V2 і обумовлює “мовний бар'єр” чи “мовні ножиці” у спілкуванні інженера по знаннях і експерта.

Ці дві мови є відображенням “внутрішньої мови” експерта й аналітика, оскільки більшість психологів і лінгвістів вважають, що мова – це основний засіб мислення поряд з іншими знаковими системами “внутренішнього користування” (універсальний семантичний код – УСК [Мартынов, 1977], мови “змісту” [Мельчук, 1974], концептуальні мови [Шенк, 1980] і ін.).

Мова аналітика V1 складається з трьох компонентів:

  • s21_1 – загальнонаукової термінології з його “теоретичного багажу”;

  • s21_2 – термінів предметної області, що він почерпнув зі спеціальної літератури в період підготовки;

  • s21_3 – побутові розмовні мови, яким користається аналітик. Мова експерта V2 включає:

  • s21_1 – загальнонаукову термінологію;

  • s21_2 – спеціальну термінологію, прийняту в предметній області;

  • s21_3 – побутова мова;

  • s21_4 – неологізми, створені експертом за час роботи, тобто його професійний жаргон.

Якщо вважати, що побутова і загальнонаукова мови в двох учасників спілкування приблизно збігаються (хоча реально обсяг другого компонента в експерта істотно більше), то деяка загальна чи мова код, якім необхідно виробити партнерам для успішної взаємодії, буде складатися з потоків, представлених на Рис.3.12.

Надалі цей загальний код перетвориться в деяку понятійну (семантичну) мережу, що є прообразом поля знань предметної області. Вироблення загального коду починається з виписуванням аналітиком усіх термінів, уживаних експертом, і уточнення їхнього змісту: Фактично це складання словника предметної області. Потім випливає групування термінів і вибір синонімів (слів, що означають те саме). Розробка загального коду закінчується складанням словника термінів предметної області з попереднім угрупованням їх за змістом, тобто по понятійній близькості (це вже перший крок структурування знань).

На цьому етапі аналітик повинний з великою увагою віднестися до всіх спеціальних термінів, намагаючись максимально вникнути в суть розв'язуваних проблем і термінологію. Освоєння аналітиком мови предметної області – перша сходинка на підступах до створення адекватної бази знань.

Рис.3.12. Структура загального коду

Малюнок 3.12 дає представлення про процес неоднозначності інтерпретації термінів двома фахівцями. У семіотиці, науці про знакові системи, проблема інтерпретації є однієї з центральних. Інтерпретація зв'язує “знак” і “ означуваний предмет ”. Тільки в інтерпретації знак одержує зміст. Так, на Рис.3.13 слова “прилад Х ” для експерта означає якусь конкретну схему, що відповідає схемі оригіналу приладу, а в голові починаючого аналітика слова “прилад Х” викликають порожній чи образ деякого чорного ящику з ручками.

Рис.3.13. Неоднозначність інтерпретації

Увага до лінгвістичного аспекту проблеми витягу знань сприяє зближенню образа 1 з образам 2 і інтерпретації I1 з інтерпретацією I2, а слова “прилад Х” перейдуть у дійсно “загальний” код.

Таким чином, шар S21 включає вивчення і керування процесом розробки спеціальної проміжної мови, необхідно] для взаємодопомоги інженера по знаннях і експерта.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]