
3. Асновы інжынерыі ведаў
Інжынерыя ведаў – малады накірунак штучнага інтэлекту, ён з’явіўся тады, калі практычныя распрацоўшчыкі сутыкнуліся з праблемамі “дабывання” і фармалізацыі ведаў. Інжынерыя ведаў звязана з праектаваннем баз ведаў, г.зн. з атрыманнем і структурыраваннем ведаў спецыялістаў для наступнай апрацоўкі інтэлектуальных інфармацыйных сістэм (ІІС).
Для баз ведаў характэрны інфармацыйныя масівы невялікага аб’ёму (у адрозненне ад баз дадзеных), якія з’яўляюцца выключна дарагімі. У базе ведаў можна праводзіць выбар па запыту інфармацыі, якая яўна не захоўваецца, а выводзіцца з наяўных дадзеных. Базы ведаў выкарыстоўваюцца для захавання ведаў і пабудовы на іх аснове інтэлектуальных інфармацыйных сістэм (ІІС). Дзеля гэтага веды неабходна прадставіць у форме, зразумелай камп’ютару.
Такім чынам, ідэалогія стварэння базы ведаў у асноўным звязана з фармалізацыяй ведаў (або памяці чалавека). Мадэлі псмяці распрацоўваюцца кагнітыўнай псіхалогіяй. Кагнітыўная спіхалогія (псіхалогія пазнання) займаецца вывучэннем спосабаў успрымання і разумення ведаў чалавекам.
Працэс прадстаўлення ведаў уяўляе сабой фармалізацыю ведаў аб пэўнай сферы. У канчатковым выніку веды павінны быць прадстаўлены ў форме, якая будзе зручнай для стварэння інтэлектуальнай сістэмы. Неабходна стварэнне пэўных схем, якія дазваляюць апісаць веды на нейкай фармальнай мове.
Вылучаюць дэкларатыўныя і працэдурныя веды. Дэкларатыўныя веды захоўваюцца ў выглядзе фактаў і сцвярджэнняў аб аб’ектах і адносін паміж імі. Да мадэляў прадстаўлення такіх ведаў адносяцца прэдыкаты, семантычныя сеткі, фрэймы.
Працэдурныя веды захоўваюцца ў працэдурах і выводзяцца ў выглядзе алгарытмаў. Да мадэляў іх прадстаўлення адносяцца правілы прадукцыі.
Асаблівасці, характэрныя некаторым слаба структурыраваным задачам (разнароднасць інфармацыі, непаўната і няпэўнасць зыходных дадзеных ) патрабуюць падчас іх фармалізацыі выкарыстання метадаў “нечеткой” математікі.
“Дабыванне” ведаў – гэта працэдура ўзаемадзеяння спецыяліста з крыніцай ведаў, у выніку якой становіцца яўным працэс разважанняў спецыяліста падчас прыняцця рашэння і структура яго ўяўленняў аб прадмеінай сферы.
Умоўна гэты працэс можна падзяліць на тры этапы:
1. Фармулёўка праблемы – вызначэнне мэт і задач атрымання ведаў;
2. Збор інфармацыі з разнастайных крыніц. У якасці эксперта можа выступаць не толькі чалавек, але і іншая крыніца інфармацыі (даведнікі, артыкулы, відэазапісы…)
Распрацоўка фармальнай мадэлі ведаў аб прадметнай сферы.
Мал 1 – Метады атрымання ведаў
Стратэгіі атрымання ведаў
1. Атрыманне ведаў без выкарыстання вылічальнай тэхнікі праз непасрэдны кантакт інжынера па ведах і крыніцы ведаў.
2. Атрыманне ведаў ад эксперта з выкарыстаннем ЭВМ прі наяўнасці праграмнага інструментарыя.
3 Фарміраванне ведаў з выкарыстаннем праграм навучання пры наяўнасці прэзентатыўнай (г.зн. дастаткова прадстаўнічай) выбаркі прыкладаў прыняцця рашэнняў у прадметнай сферы і адпаведных пакетаў прыкладных праграм.
Набыццё ведаў падразумевае, што аўтаматызаваныя сістэмы набываюць ужо гатовыя фрагменты ведаў у адпаведнасці са са структурамі, якія закладзены распрацоўшчыкамі сістэм. Большасць гэтых інструментальных сродкаў спецыяльна арыентаваная на канкрэтныя базы ведаў з жорстка вызначанай прадметнай сферай і мадэллю прадстаўлення ведаў, г.зн. не з’яўляюцца ўніверсальнымі.
Напрыклад, сістэма TEIRESIAS, якая стала асновай усіх інструментарыяў для набыцця ведаў, прызначана для папаўнення базы ведаў сістэмы MYCIN і яе адгалінаванняў у сістэме медыцынскай дыягностыкі з выкарыстаннем прадукцыйнай мадэлі прадстаўлення ведаў.
Тэрмін фарміраванне ведаў традыцыйна замацаваўся за сферай інжынерыі ведаў, якая займаецца распрацоўкай мадэлей, метадаў і алгарытмаў навучання. Ён уключае індуктыўныя мадэлі фарміравання ведаў і аўтаматычнага стварэння гіпотэз, навучанне па аналогіі і інш. гэтыя мадэлі дазваляюць выявіць прычынна-выніковыя залежнасці у базах дадзеных.
Лекцыя 3. Прадукцыйныя правілы
1 . Паняцце прадукцыйных правілаў.
2 . Сістэмы прадукцый са зваротнымі высновамі.
3 . Сістэмы прадукцый з прамымі высновамі.
1 . Паняцце прадукцыйных правілаў
У аснове чалавечай дзейнасці ляжыць мысленне. Калі раніцай звоніць будзільнік, мозг чалавека дае каманду руцэ выключыць яго. Варта заўважыць, што гэта не аўтаматычная рэакцыя, а рашэнне канкрэтнай задачы. Пры гэтым канчатковы вынік, на які мы разлічваем, на які накіраваны нашы разумовыя працэсы, называецца мэтай. Як толькі мэта (у дадзеным выпадку выключэнне будзільніка ) дасягнута, перад чалавечым мозгам адразу паўстаюць новыя мэты, напрыклад, апрануцца, паснедаць, выйсці на прыпынак і г.д. Ажыццяўленне ўсіх гэтых мэтаў прыводзіць да ажыццяўлення галоўнай мэты -- не спазніцца ў інстытут.
Для дасягнення мэты выкарыстоўваецца некаторая сукупнасць фактаў і спосабаў іх прымянення -- правілаў. На гэтых паняццях заснаваны найбольш распаўсюджаны метад прадстаўлення ведаў -- правілы прадукцыі або прадукцыйныя правілы. Гэты метад быў прапанаваны Э. Постам ( 1943 г.). Прадукцыйныя правілы тлумачаць лагічную сувязь паміж паняццямі прадметнай вобласці. Сістэмы з базамі ведаў, заснаваныя на гэтай мадэлі, называюцца прадукцыйным сістэмамі. Гэтыя сістэмы бываюць двух дыяметральна процілеглых тыпаў -- з прамымі і зваротнымі высновамі.
Правіла прадукцыі ўяўляе сабой падстаноўку наступнага выгляду:
дзе
– канчатковая звязка
фактараў, B
– дзеянне,
якое выконваецца
, калі
–з’яўляецца
праўдзівым.
Інакш кажучы, прыкладам правілаў прадукцыі можа з'яўляцца выраз наступнага тыпу:
КАЛІ < ўмова > ТО < дзеянне >
Пры гэтым факты і правілы могуць быць рознай складанасці. Яны звязаныя паміж сабой з дапамогай лагічных функцый І , АБО , НЕ .
напрыклад :
Факт 1 Ціхія , цёмныя вуліцы небяспечныя
Факт 2 Пажылыя людзі звычайна не здзяйсняюць дзёрзкіх злачынстваў
Факт 3 Мая міліцыя мяне беражэ
Правіла1 КАЛІ на цёмнай , ціхай вуліцы вы сустрэнеце пажылога чалавека
ТО можна не вельмі непакоіцца
Гэта простае правіла можна ўскладніць дадаўшы факты, аб'яднаныя ў звязку з дапамогай лагічнай функцыі І :
Правіла 2 КАЛІ на ціхай цёмнай вуліцы вы бачыце міліцыянера
І вы не пераступаеце закон
ТО можна адчуваць сябе ў поўнай бяспецы.
Правілы прадукцыі можна аднесці да катэгарычнах ведаў, г.зн. яны заўсёды дакладныя. Аднак у некаторых прадметных абласцях (напрыклад, медыцынская дыягностыка, сістэмы кіравання і да т.п.) пераважаюць верагоднасныя веды. Гэтыя веды з'яўляюцца «мяккімі» ў тым сэнсе, што казаць аб іх правільнасці ў любых практычным сітуацыях магчыма толькі да некаторай ступені. У такіх выпадках правілы прадукцыі дапаўняюць імавернаснай ацэнкай :
КАЛІ < ўмова > ТО < дзеянне > З упэўненасцю < значэнне >
напрыклад :
Правіла 1 КАЛІ на ціхай цёмнай вуліцы вы бачыце міліцыянера
І вы не пераступае закон
ТО можна адчуваць сябе ў поўнай бяспецы
З упэўненасцю 0,3
Факты ў правілах могуць быць прадстаўлены ў двух відах: у выглядзе спіскаў або ў выглядзе ізаляванай тройкі :
атрыбут → аб'ект → значэнне ,
пры гэтым з кожным фактам звязаны каэфіцыент ўпэўненасці, зменлівы ў межах [ 0,1 ].
Прадстаўленне ведаў у выглядзе правіл прадукцыі валодае наступнымі перавагамі:
• незалежнасцю правілаў, якія выказваюць самастойныя фрагменты ведаў;
• лёгкасцю і натуральнасцю мадыфікацыі ведаў (правілы прадукцыі па структуры вельмі падобныя на развагі натуральнага мовы);
• аддзяленнем правілаў ад прадметных ведаў (фактаў). Гэта дазваляе ўжываць розныя стратэгіі кіравання.
Асноўны недахоп прадукцыйных правілаў у тым, што пры іх вялікай колькасці становіцца працаёмкай праверка несупярэчлівасці сістэмы прадукцыі. Напрыклад, пры дабаўленні новых правіл неабходна праверыць, наколькі яны адпавядаюць ужо існуючымі ў базе ведаў правілам.
Як ужо адзначалася вышэй, правілы прадукцыі адносяцца да працэдурных мадэляў прадстаўлення ведаў. Нават самае простае правіла прадукцыі (г.зн. правіла, якое не змяшчаюць далучаных працэдур) ёсць элемент «працэдурнасці», бо мяркуецца, што гэта правіла будзе выкарыстана для выканання некаторага дзеяння. Менавіта гэта адрознівае працэдурнае прадстаўленне ведаў ад дэкларатыўнага, паколькі дэкларатыўныя веды не нясуць ніякай інфармацыі аб тым, як яны будуць выкарыстаны.
2 . Сістэмы прадукцый з адваротнымі высновамі
У сістэме прадукцый з адваротнымі высновамі з дапамогай правілаў будуецца дрэва І / АБО, якое злучае ў адзінае цэлае факты і заключэнні; ацэнка гэтага дрэва на падставе фактаў, якія ёсць у базе дадзеных, і ёсць лагічная выснова. Лагічныя высновы бываюць прамымі, адваротнымі і двунакіраванымі. Пры прамым вывадзе адпраўной кропкай служаць прадастаўленыя дадзеныя, працэс ацэнкі прыпыняецца ў вузлах з адмаўленнем, прычым у якасці заключэння (калі не ўсе дрэва пройдзена) выкарыстоўваецца гіпотэза, якая адпавядае самому верхняму ўзроўню дрэва (кораню). Аднак для такога вываду характэрна вялікая колькасць дадзеных, а таксама ацэнак дрэва, якія не маюць прамых адносін да заключэння, што залішне. Перавага адваротных высноў у тым, што ацэньваюцца толькі тыя часткі дрэва, якія маюць дачыненне да заключэння, аднак калі адмаўленне ці сцвярджэнне немагчымыя, то створанае дрэва пазбаўлена сэнсу. У двунакіраваных высновах спачатку ацэньваецца невялікі аб'ём атрыманых дадзеных і выбіраецца гіпотэза, а затым запытваюцца дадзеныя неабходныя для прыняцця рашэння аб прыдатнасці дадзенай гіпотэзы. На аснове гэтых высноваў можна рэалізаваць больш гнуткую і магутную сістэму.
3 . Сістэмы прадукцый з прамымі высновамі
Сістэмы прадукцый з прамымі высновамі сярод сістэм, заснаваных на выкарыстанні ведаў, маюць найбольш даўнюю гісторыю, таму яны з'яўляюцца ў пэўным сэнсе асноватворнымі. Гэтыя сістэмы ўключаюць тры кампаненты: базу правілаў, якая складаецца з набораў правіл (правілы высновы), базу дадзеных, якая ўтрымлівае мноства фактаў, і інтэрпрэтатар для атрымання лагічнага вываду на падставе гэтых ведаў. База правілаў і база дадзеных ўтвараюць базу ведаў, а інтэрпрэтатар адпавядае механізму лагічнага вываду. Выснова выконваецца ў ідэі цыклу «разуменне - выкананне», прычым у кожным цыкле выкананая частка абранага правіла абнаўляе базу дадзеных. У выніку змесціва базы дадзеных пераўтворыцца ад першапачатковага да мэтавага, г.зн. мэтавая сістэма сінтэзуецца ў базе дадзеных. Інакш кажучы, для сістэмы прадукцый характэрны просты цыкл выбару і выканання (або ацэнкі) правілаў, аднак з-за неабходнасці перыядычнага супастаўлення з вобразам у базе правілаў (атаесамленнем) з павелічэннем колькасці апошніх (правілаў) істотна запавольваецца хуткасць высновы. Такім чынам, такія сістэмы не падыходзяць для вырашэння буйнамаштабных задач.
Моцныя бакі :
1 . Прастата стварэння і разумення асобных правілаў ;
2 . Прастата папаўнення і мадыфікацыі
3 . Прастата механізму лагічнага вываду .
Слабыя бакі:
1 . Няяснасць узаемных адносін правілаў
2 . Складанасць ацэнкі цэласнага вобразу ведаў
3 . Вельмі нізкая эфектыўнасць апрацоўкі
4 . Адрозненне ад чалавечай структуры ведаў
5 . Адсутнасць гнуткасці ў лагічнай выснове.
Такім чынам, калі аб'ектам з'яўляецца невялікая задача, выяўляюцца толькі моцныя бакі сістэмы прадукцый .
Пытанні для самакантролю :
1 . Дайце азначэнне , што такое правілы прадукцыі?
2 . Якім выразам характарызуюцца правілы прадукцыі?
3 . Дайце азначэнне , што такое сістэма прадукцый з прамымі высновамі ?
4 . Дайце азначэнне , што такое сістэма прадукцый задваротнымі высновамі ?
5 . Якое будуецца дрэва ў сістэме прадукцый з адваротнымі высновамі ?
6. Якія кампаненты ўваходзяць у склад сістэмы прадукцый з прамымі высновамі ?
7 . Пералічыце асноўныя недахопы сістэмы прадукцый ?