Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Собственно текст документа.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
8.39 Mб
Скачать

3.3. Теоретические аспекты извлечения знаний

Поскольку основной проблемой инженерии знаний является процесс извлечения знаний, инженеру по знаниям необходимо четко понимать природу и особеннос­ти этих процессов. Для того чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой процедуры (рис. 3.7):

А = {Al, А2, A3} = {психологический, лингвистический, гносеологический}.

Рис. 3.7. Теоретические аспекты инженерии знаний

3.3.1. Психологический аспект

Из трех аспектов извлечения знаний психологический - А1 - является ведущим, поскольку он определяет успешность и эффективность взаимодействия инжене­ра по знаниям (аналитика) с основным источником знаний - экспертом-профес­сионалом. Психологический аспект выделяется еще и потому, что извлечение знаний происходит чаще всего в процессе непосредственного общения разработ­чиков системы. А в общении психология является доминантной.

Общение, или коммуникация (от лат. communicatio - связь), - это междисцип­линарное понятие, обозначающее все формы непосредственных контактов между людьми - от дружеских до деловых. Оно широко исследуется в психологии, фи­лософии, социологии, этологии, лингвистике, семиотике и других науках. Суще­ствует несколько десятков теорий общения, и единственное, в чем сходятся все авторы, - это сложность, многоплановость процедуры общения. Подчеркивает­ся, что общение - не просто однонаправленный процесс передачи сообщений и не двухтактный обмен порциями сведений, а нерасчлененный процесс циркуля­ции информации, то есть Совместный поиск истины [Каган, 1988] (рис. 3.8).

Итак, общение есть процесс выработки новой информации, общей для общаю­щихся людей и рождающей их общность. И хотя общение - первый вид деятель­ности, которым овладевает человек в онтогенезе, по-настоящему владеют куль­турой и наукой общения единицы.

Рис. 3.8. Структура процесса общения

Можно выделить четыре основных уровня общения [Сагатовский, 1980].

1. Уровень манипулирования, когда один субъект рассматривает другого как сред­ство или помеху по отношению к проекту своей деятельности.

2. Уровень «рефлексивной игры», когда в процессе своей деятельности человек учитывает «контрпроект» другого субъекта, но не признает за ним самоцен­ность и стремится к «выигрышу», к реализации своего проекта.

3. Уровень правового общения, когда субъекты признают право на существова­ние проектов деятельности друг друга и пытаются согласовать их хотя бы вне­шне.

4. Уровень нравственного общения, когда субъекты внутренне принимают общий проект взаимной деятельности.

Стремление и умение общаться на высшем, четвертом, уровне может характе­ризовать степень профессионализма инженера по знаниям. Извлечение зна­ний - это особый вид общения, который можно отнести к духовно-информа­ционному типу. Согласно работе [Каган, 1988] общение делится на мате­риально-практическое; духовно-информационное; практически-духовное. При этом информационный аспект общения для инженера по знаниям с прагмати­ческой точки зрения важнейший.

Известно, что потери информации при разговорном общении велики [Мицич, 1987] (рис. 3.9).

Рис. 3.9. Потери информации при разговорном общении

В связи с этим рассмотрим проблему увеличения информативности общения аналитика и эксперта за счет использования психологических знаний. Можно выделить такие структурные компоненты модели общения при извлече­нии знаний:

• участники общения (партнеры);

• средства общения (процедура);

• предмет общения (знания).

В соответствии с этой структурой выделим три «слоя» психологических проблем, возникающих при извлечении знаний (рис. 3.10):

Al = {Sll, S12, S13 } = {контактный, процедурный, когнитивный}.

Рис. 3.10. Психологический аспект извлечения знаний

Контактный слой (S11)

Практически все психологи отмечают, что на любой коллективный процесс вли­яет атмосфера, возникающая в группе участников. Существуют эксперименты, результаты которых неоспоримо говорят, что часто дружеская атмосфера в кол­лективе больше влияет на результат, чем индивидуальные способности отдель­ных членов группы [Немов, 1984]. Особенно важно, чтобы в коллективе раз­работчиков складывались кооперативные, а не конкурентные отношения. Для кооперации характерна атмосфера сотрудничества, взаимопомощи, заинтересо­ванности в успехах друг друга, то есть уровень нравственного общения, а для от­ношений конкурентного типа - атмосфера индивидуализма и межличностного соперничества (более низкий уровень общения).

В настоящее время прогнозировать совместимость в общении со 100%-й гаран­тией невозможно. Однако можно выделить ряд факторов и черт личности, ха­рактера и других особенностей участников общения, несомненно, оказываю­щих влияние на эффективность процедуры.

Разработка проблематики контактного слоя позволила выявить следующие па­раметры партнеров, влияющие на результаты процедуры извлечения знаний: S11 = {s11_i} = {пол, возраст, личность, темперамент, мотивация и др.}, часть из которых впоследствии вошли в формирование модели пользователя.

Значения параметров пола (s11_l) и возраста (s11_2) хотя и влияют на эффек­тивность контакта, но не являются критическими. В литературе [Иванов, 1986] отмечается, что хорошие результаты дают гетерогенные пары (мужчина/женщи­на) и соотношение:

20>(Вэ - Ва)>5,

где Вэ — возраст эксперта; Ва — возраст аналитика.

Под личностью (s11_3) обычно понимается устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые компо­ненты s11_3 исследованы в работе [Гаврилова, 1990] и дополнены качествами из руководства для журналистов в работе [Schouksmith G, 1978]. s11_3 = (доброже­лательность, аналитичность, хорошая память, внимание, наблюдательность, во­ображение, впечатлительность, большая собранность, настойчивость, общитель­ность, находчивость).

Со времен Галена и Гиппократа, выделивших четыре классических типа темпе­рамента (s11_4), вошли в научную терминологию понятия s11_4= (холерик, сангвиник, меланхолик, флегматик).

Известно, что флегматики и меланхолики медленнее усваивают информацию [Лунева, Хорошилова, 1987]. И для обеспечения психологического контакта с ними не следует задавать беседе слишком быстрый темп, торопить их с ответом. Зато они гораздо лучше усваивают новое, в отличие от холериков, для которых свойственно поверхностное усваивание информации. Последних следует специ­ально наводить на размышление и рефлексию. У меланхоликов часто занижена самооценка, они застенчивы и в беседе их надо подбадривать. Таким образом, наиболее успешными в рамках слоя S11 являются сангвиники и холерики.

На эффективность коллективного решения задач влияет также и мотивация (s11_5), то есть стремление к успеху. Инженер по знаниям в зависимости от ус­ловий разработки должен изыскивать разнообразные стимулы для экспертов (включая, разумеется, и материальные). Эксперт передает аналитику один из са­мых дорогих в мире продуктов - знания. И если одни люди делятся опытом доб­ровольно и с удовольствием, то другие весьма неохотно приоткрывают свои про­фессиональные тайны. Иногда полезно, оказывается, возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооператив­ности в коллективе).

Процедурный слой (S12)

Параметры процедурного слоя S12 описывают непосредственно процесс прове­дения процедуры извлечения знаний. Фактически это профессиональные пара­метры:

S12 = {s12_i} - {ситуация общения (место, время, продолжительность); оборудо­вание (вспомогательные средства, освещенность, мебель); профессиональные приемы (темп, стиль, методы и др.)}.

Инженер по знаниям, успешно овладевший наукой установления атмосферы до­верия и взаимопонимания с экспертом (контактный слой - S11), должен еще су­меть воспользоваться благоприятным воздействием этой атмосферы. Проблема процедурного слоя касается проведения самой процедуры извлечения знаний. Здесь мало проницательности и обаяния, полезных для решения проблемы кон­такта, тут необходимы профессиональные знания.

Остановимся на общих закономерностях проведения процедуры.

s12_1 — ситуация общения определяется следующими компонентами:

• s12_1_1 — место проведения сеансов;

• s12_1_2 — продолжительность проведения сеансов;

• s12_l_3 — время проведения сеансов.

Беседу с экспертом лучше всего проводить в небольшом помещении наедине (s12_1_1: место), поскольку посторонние люди нарушают доверительность бесе­ды и могут породить эффект «фасада». Рабочее место эксперта является не са­мым оптимальным вариантом, так как его могут отвлекать телефонные звонки, сотрудники и пр. Атмосфера замкнутого пространства и уединенности положи­тельно влияет на эффективность.

Американский психолог И. Атватер считает, что для делового общения наиболее благоприятная дистанция от 1,2 до 3 метров [Schouksmith, 1978]. Минимальным комфортным» расстоянием можно считать 0,7-0,8 метра.

Реконструкция собственных рассуждений — трудоемкий процесс, и поэтому длительность одного сеанса (s12_l_2: продолжительность) обычно не превыша­ет 1,5-2 часа. Эти два часа лучше выбрать в первой половине дня, например с 10 до 12 часов, если эксперт типа «жаворонок» (s12_l_3: время). Известно, что вза­имная утомляемость партнеров при беседе наступает обычно через 20-25 минут [Ноэль, 1978], поэтому в сеансе нужны паузы.

s12_2 — оборудование включает:

• s12_2_l — вспомогательные средства;

• s12_2_2 — освещенность;

• s12_2_3 — мебель. Вспомогательные средства (s12_2_l):

• средства для увеличения эффективности самого процесса извлечения знаний;

• средства для протоколирования результатов.

К средствам для увеличения эффективности процесса извлечения знаний прежде в его относится наглядный материал. Независимо от метода извлечения (см. главу 4), выбранного в конкретной ситуации, его реализация возможна разными спо­собами. Например, можно учитывать следующий фактор: широко известно, что людей, занимающихся интеллектуальной деятельностью, можно отнести к худо­жественному либо мыслительному типу. Термины тут условны и не имеют отношения к той деятельности, которую традиционно называют художественной или мыслительной. Важно, что, определив тип эксперта, инженер по знаниям может плодотворнее использовать любой из методов извлечения, зная, что люди худо­жественного типа легче воспринимают зрительную информацию в форме рисун­ков, графиков, диаграмм, так как эта информация воспринимается через первую сигнальную систему. Напротив, эксперты мыслительного типа лучше понимают язык формул и текстовую информацию. При этом учитывается факт, что боль­шую часть информации человек получает от зрения. Совет пользоваться актив­нее наглядным материалом из работы [Хейес-Рот, Уотермена, Ленат, 1987] можно считать универсальным. Такие методы, как свободный диалог и игры, пре­доставляют богатые возможности использовать слайды, чертежи, рисунки.

Для протоколирования результатов в настоящее время используются следую­щие способы:

• запись на бумагу непосредственно по ходу беседы (недостатки — это часто ме­шает беседе, кроме того, трудно успеть записать все, даже при наличии навы­ков стенографии);

• магнитофонная запись (диктофон), помогающая аналитику проанализиро­вать весь ход сеанса и свои ошибки (недостаток - может сковывать эксперта);

• запоминание с последующей записью после беседы (недостаток - годится только для аналитиков с блестящей памятью).

Наиболее распространенным способом на сегодня является первый. При этом наибольшая опасность тут - потеря знаний, поскольку любая запись ответов - это уже интерпретация, то есть привнесение субъективного понимания предмета. Значения параметров освещенности (s12_2_2) и мебели (s12_2_3) очевидны и связаны с влиянием внешних факторов на эксперта.

S12_3 - профессиональные приемы аналитика, включают, в частности:

• s12_3_1 — темп;

• s12_3_2 — стиль;

• s12_3_3 — методы.

Учет индивидуального темпа (s12_3_l) и стиля (s12_3_2) эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичной ошибкой является навязывание собственных темпа и стиля. На успешность также влияет длина фраз, которые произносит инженер по зна­ниям. Этот факт был установлен американскими учеными - лингвистом Ингве и психологом Миллером при проведении исследования о причинах низкой усво­яемости команд на Военно-морском флоте США [Gammack, Young, 1985].

Причина была в длине команд. Оказалось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7+2(-2) слова. Это число (7±2) получило название число Ингве-Миллера. Можно считать его мерой «разговорности» речи. Опытные лекторы используют в лекции в основном короткие фразы, умень­шая потерю информации с 20-30 % (у плохих лекторов) до 3-4 % [Горелов, 1987]. Большая часть информации поступает к инженеру по знаниям в форме предло­жений на естественном языке. Однако внешняя речь эксперта есть воспроизведе­ние его внутренней речи (мышления), которая гораздо богаче и многообразнее.

При этом для передачи этой внутренней речи эксперт использует и невербаль­ные средства, такие как интонация, мимика, жесты. Опытный инженер по знани­ям старается записывать по возможности в протоколы (в форме ремарок) эту до­полнительную интонацию.

В целом, невербальная компонента стиля общения важна и для проблем контакт­ного слоя при установлении контакта, когда по отдельным жестам и выражению лица эксперта инженер по знаниям может установить границу возможной «дружественности» общения.

Значение параметра методов (s12_3_3) подробно рассмотрено в следующей главе, исходя из позиции, что метод должен подходить к эксперту как «ключ к замку».

Когнитивный слой (S13)

Когнитивные (от англ. cognition - познание) науки исследуют познавательные процессы человека с позиций возможности их моделирования (психология, нейрофизиология, эргономика, инженерия знаний). Наименее исследованы на сегод­няшний день проблемы когнитивного слоя S13, связанные с изучением семантического пространства памяти эксперта и реконструкцией его понятийной структуры и модели рассуждений.

Основными факторами, влияющими на когнитивную адекватность, будут:

S13 = {s13_i} - {когнитивный стиль, семантическая репрезентативность поля зна­ний и концептуальной модели}.

Под когнитивным стилем (s13_l) человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека. Когнитивный стиль определяет не столько эффективность деятельности, сколько способ достижения результата [Алахвердов, 1986]. Это способ познания, который позволяет людям с разными способностями добиваться оди­наковых результатов в деятельности. Это система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности. Инженеру по знаниям полезно изучить и прогнозировать свой когнитивный стиль, а также стиль эксперта.

Особенно важны такие характеристики когнитив­ного стиля, как:

• s13_1_1 — (полезависимость - поленезависимость);

• s13_l_2 — (импульсивность - рефлективность (рефлексивность);

• s13_l_3 — (ригидность - гибкость);

• s13_l_4 — (когнитивная эквивалентность).

s13_1_1. Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и уметь отбрасывать все лишнее, то есть не зависеть от фона или окружаю­щего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность к пониманию сути. Очевидно, что помимо того, что самому аналитику необходи­мо иметь высокое значение параметра s13_l_l, поленезависимый эксперт - это тоже желательный фактор. Однако приходится учитывать, что больше нуждают­ся в общении полезависимые люди, а потому они и более контактны [Орехов, 1985].

Особенно полезны для общения гетерогенные (смешанные) пары, например «полезависимый - поленезависимый» [Иванов, 1986]. В литературе описаны раз­личные эксперименты, моделирующие общение, требующее понимания и совмест­ной деятельности. Наиболее успешным в понимании оказались поленезависимые испытуемые (92 % успеха), для сравнения полезависимые давали 56 % успеха [Кулюткин, Сухобская, 1971].

Для совместной профессиональной деятельности важна также гибкость когни­тивной организации, которая связана с поленезависимостью. Итак, большую способность к адекватному пониманию партнера демонстрируют субъекты с вы­сокой психологической дифференциацией, то есть поленезависимостью. Поленезависимость является одной из характерных профессиональных черт ког­нитивного стиля наиболее квалифицированных инженеров по знаниям. По неко­торым результатам [Алахвердов, 1986] мужчины более поленезависимы, чем жен­щины.

s13_l_2. Под импульсивностью понимается быстрое принятие решения (часто без его достаточного обоснования), а под рефлексивностью - склонность к рас­судительности. Рефлексивность по экспериментальным данным коррелирует со способностью к формирования понятий и продуктивностью стратегий решения логических задач [Кулюткин, Сухобская, 1971]. Таким образом, и инженеру по знаниям, и эксперту желательно быть рефлексивным, хотя собственный стиль изменяется лишь частично и с большим напряжением.

s13_l_3. Ригидность - гибкость характеризует способность человека к измене­нию установок и точек зрения в соответствии с изменяющейся ситуацией. Ригид­ные люди не склонны менять свои представления и структуру восприятия, напро­тив, гибкие легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может себе позволить ригидность (что характерно для долго работа­ющих над одной проблемой специалистов, особенно старшего возраста), то для инженера по знаниям эта характеристика когнитивного стиля явно противопо­казана. Увеличение ригидности с возрастом отмечается многими психологами [Кулюткин, Сухобская, 1971; Орехов, 1985].

s13_l_4. Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен про­вести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин. Семантическая репрезентативность (s13_2) подразумевает подход, исключающий традиционное навязывание эксперту некой модели представлений (например, продукционной или фреймовой), и заставляет инженера по знаниям последова­тельно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например многомерное шкалирование (см. главу 4). Проблема семантической репрезентативности ориентирована на достижение когнитивной адекватности поля знаний и концептуальной модели. В настоящий момент она может быть сформулирована как проблема «испорченного телефона» [Гаврилова, Червинская, 1992] (см. рис. 3.5) - возможные трансформации и по­тери в цепи передачи информации:

(0g: предметная область или реальный мир) →

[Ii: интерпретация i-го эксперта] →

(Mgi: модель мира эксперта) →

[Vi: вербализация модели мира эксперта] →

(Ti & Ci: вербальные и невербальные сообщения i-го эксперта j-му аналитику) →

[Ij: их интерпретация j-ым аналитиком] →

(Mgj: модель мира j-го аналитика) →

j: кодирование при формировании поля знаний с последующей структуризацией в концептуальную модель].

Круглые скобки определяют понятия, квадратные - процессы.