Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
100587_Lytvyn.doc
Скачиваний:
164
Добавлен:
07.02.2016
Размер:
6.01 Mб
Скачать

3.3. Текстологічні методи

Група текстологічних методів об’єднує методи видобу­вання знань, засновані на вивченні спеціальних текстів з підручників, моно­графій, статей, методик та інших носіїв професійних знань.

У буквальному розумінні текстологічні методи не належать до текстології – науки, яка сформувалася в руслі філології з метою кри­тичного читання літературних текстів, вивчення та інтерпретації дже­рел з вузькоприкладної задачі – підготу­вання текстів до видання.

Зараз текстологія розширила свої межі завдяки ас­пектам су­міжних наук – герменевтики (науки правильного тлумачення древніх текстів – біблії, античних рукописів тощо), семіотики, психолінг­віс­тики тощо.

Текстологічні методи видобування знань, безумовно, вико­ристовуючи основні положення текстології, відрізняються принципово від її методології, по-перше, характером і приро­дою своїх джерел (професійна спеціальна література, а не ху­дожня, що живе за своїми власними законами), а по-друге, жорсткою граматичною спрямо­ваністю видобування конкрет­них професійних знань.

Серед методів видобування знань ця група є найменш роз­роб­леною, до неї майже немає бібліографії, тому подальший виклад є наче введенням в методи вивчення текстів в тому ви­гляді, як це уявляють автори.

Задачу видобування знань з текстів можна сформулювати як задачу розуміння і виокремлення суті тексту. Сам текст на звичайній мові є лише провідником суті, а задум і знання авто­ра лежать у вторинній структурі (змістовній структурі чи мак­роструктурі тексту), побудованій над звичайним текстом, або, як сформульовано в роботі [123], “текст не містить і не передає суті змісту, а є тільки інст­рументом для автора тексту”.

Можна виділити дві такі змістові структури:

М1зміст, який намагався вкласти автор, це його модель світу, і M2 зміст, який розуміє читач, у нашому випадку інженер зі знань (рис. 3.5), у процесі інтерпретації I. T – це словесна оболонка M, тобто результат вербалізації V.

Рис. 3.5. Схема видобування знань зі спеціальних текстів

Складність процесу полягає в принциповій неможливості збігу знань, що утворюють М1 і М2 через те, що М1 утворюється з усієї сукупності уявлень, потреб, інтересів та досвіду автора, лише невелика частина яких відображена у тексті Т. Відповідно і M2 утворюється в процесі інтерпретації тексту Т внаслідок залучення всієї сукупності наукового та людського багажу читача. Отже, два інженери зі знань видобудуть з одного Т дві різні моделі М1 і М2 .

Постає завдання: з’ясувати, як можна досягти максимальної адекватності М1 і М2, пам’ятаючи, що розуміння завжди відносне, ос­кільки це синтез двох змістів “своє – чуже”.

Розглянемо детальніше, які джерела живлять модель М1 і створюють текст Т. У роботі [34] вказані два компоненти будь-якого наукового тексту. Це перший матеріал спостережень  та система наукових понять β в момент створення тексту. На додаток до цього, на наш погляд, крім об’єктивних даних експериментів та спостережень, в тексті обов’язково є суб’єктивні погляди автора , як результат його особистого досвіду, а також деякі “загальні місця” або “вода” . Крім цього, будь-який науковий текст містить запозичення з інших джерел (статей, монографій) тощо, і всі компоненти занурені в мовне середовище L. Можна записати:

Т = (,,,,)L.

Отже, компоненти наукового тексту можна подати у вигляді та­кої схеми (рис. 3.6). Компоненти ,  частина  входять і в модель М1.

Рис. 3.6. Компоненти наукового тексту

Видобуваючи знання, аналітику, який інтерпретує текст, дово­диться розв’язувати задачу декомпозиції цього тексту на перераховані вище компоненти для виділення справді важли­вих для реалізації баз знань фрагментів. Складність інтерпре­тації наукових і спеціальних текстів полягає і в тому, що будь-який текст набуває значення тільки в контексті, де під контекстом розуміється оточення, в яке “занурений” текст.

Розрізняють мікро- та макроконтекст. Мікроконтекст – це най­ближче оточення тексту. Так, речення отримує зміст в контексті абза­цу, абзац – в контексті розділу тощо. Макрокон­текст – це вся система знань, пов’язана з предметною облас­тю (тобто знання про особливості та властивості, явно не вка­зані в тексті). Іншими словами, будь-яке знання набуває сенсу в контексті деякого метазнання.

Тепер детальніше про центральну ланку процедури вилучен­ня знання – про розуміння тексту. Класичним в текстології є визначення німецького філософа і мовознавця В. фон Гум­больдта:

“...Люди розуміють один одного не тому, що передають спів­бесіднику ознаки предметів, і навіть не тому, що взаємно налашто­вують один одного на точне і повне відтворення іден­тичного поняття, а тому, що взаємно зачіпають один в одному одну й ту саму ланку чуттєвих уявлень і початків внутрішніх понять, доторкаються до одних і тих самих клавіш інструмен­та свого духа, завдяки чому у кожного спалахують у свідомості відповідні, а не тотожні розуміння”.

Спілкуючись мовою сучасного мовознавства, розуміння – це фор­мування “другого тексту”, тобто семантичної структури (по­няттєвої структури). У нашій термінології – це спро­ба відтворення семантичної структури М1 у процесі формуван­ня моделі М2, тобто – це перший крок структурування знань.

Як відбувається процес розуміння І? Одна з можливих схем викладена в роботі [117]. Ми внесли деякі зміни в цю схему у зв’язку з тим, що в ній трактується розуміння тексту іно­земною мовою, а нас цікавить розуміння тексту в новій для люди­ни, що пізнає, предметній області. Крім цього, доповнимо її де­якими положеннями герменев­тики. Загалом одержана схема узгоджується зі стратегією вивчення всьо­го нового.

Основними моментами розуміння тексту є:

  • висування попередньої гіпотези про суть усього тексту (перед­бачення);

  • визначення значень незрозумілих слів (тобто спеціальної термі­нології);

  • виникнення загальної гіпотези про зміст тексту (про знання);

  • уточнення значення термінів та інтерпретація окремих фрагментів тексту під впливом загальної гіпотези (від цілого до частин);

  • формування деякої змістової структури внаслідок вста­новлення внутрішніх зв’язків між окремими важливими (ключовими) сло­вами, фрагментами, а також у процесі ви­никнення абстрактних понять, що узагальнюють окремі фрагменти знань;

  • корекція загальної гіпотези стосовно фрагментів знань, що міс­тяться в тексті (від частин до цілого);

  • прийняття основної гіпотези, тобто формування М2.

Варто зауважити наявність як дедуктивної (від цілого до частин), так і індуктивної (від частин до цілого) складових процесу розуміння. Такий двоєдиний підхід дає змогу охоплю­вати текст як змістову єдність особливого роду, з її основними ознаками, такими як зв’язність, цілісність, завершеність тощо.

Центральними поняттями процесу І є кроки 5 та 7, тобто формування змістової структури чи виділення “опірних”, ключових слів чи “змістових віх”, а також завершальне зв’язування “змістових віх” в єдину семантичну структуру.

Аналізуючи текст, важливо виявити внутрішні зв’язки між окре­мими елементами тексту та поняттями. Традиційно виділяють два види зв’язків у тексті – експліцитні (явні зв’язки), які виражаються у зов­нішньому подрібненні тексту, та імпліцитні (приховані зв’язки). Екс­пліцитні зв’язки ділять текст на параграфи за допомогою пере­лічення компо­нентів, вставних слів (або конекторів) типу “по-пер­ше...”, “по-друге...”, “проте” тощо. Імпліцитні (внутрішні) зв’язки між окре­мими “змістовими віхами” викликають основні склад­нощі для розуміння.

Отже, семантична структура тексту виникає у свідомості суб’єкта, який пізнає за допомогою знань про мову, знань про світ, а та­кож загальних (фонових) знань у тій предметній об­ласті, якої стосується текст: “тексти пишуть для посвяче­них”. Іншими словами, якщо текст не є науково-популярним, то для його адекватного читання потрібна деяка підготовка.

Отже, відстань до знань збільшується ще на одну ланку. Якщо раніше ми говорили, що самі текстологічні методи рідко вжи­вають як самостійний метод видобування, а зазвичай вико­ристовують як деяку підготовку до комунікативної взаємо­дії, то тепер стверджуємо, що і для читання текстів потрібна підготовка. Яка саме?

Підготовкою для читання спеціальних текстів є вибір ра­зом з екс­пертами деякого “базового” списку літератури, який поступово введе аналітика в предметну область. У цьому спис­ку можуть бути підручники для початківців, розділи і фраг­менти з монографій, по­пулярні видання. Лише після ознайом­лення з “базовим” списком доцільно переходити до читання спеціальних текстів.

Отже, на процес розуміння (чи інтерпретації) І та модель М2 впливають такі компоненти (рис. 3.7):

  • екстракт компонентів (,,,)’, почерпнутий з тексту Т;

  • попередні знання аналітика про предметну область ПО;

  • загальнонаукова ерудиція аналітика ;

  • його особистий досвід D.

М2=[(,,,)’, ПО, , D].

Процес I – це складний процес, що не піддається формалізації, на який істотно впливають такі суто індивідуальні компоненти, як когні­тивний стиль пізнання, інтелектуальні характеристики тощо.

Рис. 3.7. Компоненти формування змісту тексту

Але процедури розбиття тексту на частини (“змістові гру­пи”), а потім згущення, стиснення вмісту кожного змістового шматка у “змістову віху” є, очевидно, основою для будь-якого індивідуального про­цесу розуміння. Така компресія (стиснен­ня) тексту у вигляді набору ключових слів, що передають ос­новний зміст тексту, може слу­гу­вати зручною методологічною основою для здійснення тексто­логічних процедур видобуван­ня знань.

Як ключове слово може слугувати будь-яка частина мов­лення (іменник, прикметник, дієслово тощо) або їх поєднан­ня. Набір клю­чових слів (НКС) – це набір опірних точок, за якими розгортається текст у процесі кодування в пам’ять і усвідом­люється у процесі де­кодування; це семантичне ядро цілості.

Приклад

Як приклад подано результати експерименту з формування НКС. Знання видобували з такого тексту.

“Теорія фреймів належить до психологічних понять, які стосу­ють­ся розуміння того, що ми бачимо та чуємо. Ці способи сприйняття трак­ту­ють з погляду послідовності, на їх основі здійснюється кон­цептуальне моделювання, доцільність одер­жаних моделей досліджу­єть­ся разом з різними проблемами, що виникають в цих двох областях”.

Для усвідомлення того факту, що задана інформація в цих облас­тях має єдиний зміст, людська пам’ять передусім повин­на бути здатною вказувати цю інформацію зі спеціальними концептуальними об’єктами. В іншому випадку не вдається систематизувати інформа­цію, яка виглядає різною. В основу теорії фреймів покладено сприйняття фактів через зіставлення одержаної ззовні інформації з конкретними елементами та значеннями.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]