Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции.doc
Скачиваний:
179
Добавлен:
28.06.2014
Размер:
1.1 Mб
Скачать

Введение

С возникновением интеллектуальных систем различного назначения и перенесением центра тяжести на модели и методы представления и обработки знаний существенно изменяется аппарат формальных рассуждений, комбинирующий средства достоверного и правдоподобного выводов. На наш взгляд логика есть наука о рассуждениях и от разработки формальных моделей различных форм рассуждений зависит успех создания действительно интеллектуальных систем.

Не вдаваясь в детали определения интеллектуальной системы (ИнтС), отметим ее основные компоненты:

ИнтС = РИС + ПИС + ИнИн + АП, где

РИС – рассуждатель информационной системы, состоящей из генератора гипотез, доказателя теорем и вычислителя;

ПИС – поисковая информационная система, которая доставляет релевантную цели рассуждения информацию;

ИнИн – интеллектуальный интерфейс (диалог, графика, обучение пользователя работе с системой);

АП – подсистема автоматического пополнения базы данных (БД) и базы знаний (БЗ) из текстов, образующих информационную среду для интеллектуальных систем.

Под рассуждениемпонимается построение последовательности аргументов, вынуждающих принятие некоторого утверждения, которое и является целью рассуждения. Особенностями рассуждения, отличающими его от логического вывода, и в частности, от доказательства, в стандартном понимании являются:

  • открытость множества возможных аргументов;

  • использование метатеоретических, и в частности, металогических средств, с помощью которых осуществляется управление логическими выводами, применяемыми в процессе рассуждения;

  • использование не только правил достоверного вывода, но и правил правдоподобного вывода.

Очевидно, что логический вывод в стандартном понимании математической логики – частный случай рассуждений, когда множество аргументов фиксировано, нетривиальные металогические средства (например, проверка на непротиворечивость) не используются и применяются лишь правила достоверного вывода, по которым из истинных аргументов (посылок) можно получить лишь истинные заключения.

В широком смысле к достоверному выводу и относится дедуктивный вывод, который в настоящее время хорошо изучен и исследован. В классической логике дедуктивной вывод рассматривается как вывод от общего к частному. Дедукция – в высшей степени идеализированная и ограниченная форма рассуждений, и если мы хотим моделировать некоторые аспекты человеческих рассуждений (здравый смысл, неопределенность, противоречивость информации и т.п.), дедукция совершенно недостаточна и нужно привлекать недедуктивные или правдоподобные формы рассуждений, такие как абдукция и индукция.

Термин «правдоподобное рассуждение» принадлежит Д. Пойа, примерами правдоподобных рассуждений в смысле Д. Пойа являются индукция через простое перечисление, аналогия и различные схемы недостоверных (в двухзначной логике высказываний) выводов.

Д. Пойа сформулировал два возможных принципа вывода по аналогии:

  • «предположение становится более правдоподобным, когда оказывается истинным аналогичное предположение»;

  • «предположение становится несколько более правдоподобным, когда становится более правдоподобным аналогичное предположение».

Пусть и– упомянутые выше предположения, тогда принципам Пойа отвечают, соответственно, следующие схемы правдоподобных выводов:

 аналогично ,

 истинно,

 более правдоподобно;

 аналогично ,

 более правдоподобно,

 несколько более правдоподобно.

Здесь «несколько более правдоподобно» понимается в том смысле, что без информации о правдоподобности,было бы менее правдоподобным.

Формальные уточнения схем таких правдоподобных выводов связаны, во-первых, с формализацией средства описания структуры данных предметной области, и, во-вторых, с формализацией «степени правдоподобия». Существенность сходства структур в выводах по аналогии была отмечена еще И.Г. Лейбницем.

Индукция обеспечивает возможность перехода от единичных фактов к общим положениям, законам. Говоря об истории исследования индуктивных рассуждений, следует отметить Ф. Бэкона, который впервые попытался формализовать индуктивные выводы посредством таблиц причин. Ф. Бэкон явился родоначальником исследований «эмпирической структурной индукции», целью которой является обнаружение эмпирических зависимостей в виде индуктивных обобщений, полученных на основе сравнения объектов, имеющих структуру и входящих в явления, которые представляются примерами и контрпримерами. Учение Ф. Бэкона об индукции было развито Д.С. Миллем, который предложил свои известные методы сходства, различия, остатков и сопутствующих изменений.

Рассматривая индукцию как недедуктивное рассуждение, можно выделить аргументы, обеспечивающие некоторую (частичную) поддержку заключения, т.е. если посылки истинны, они дали бы некоторое основание, хотя и неполностью убедительное, принять данное заключение истинным, при этом остается некоторая возможность получить ложное заключение. Аргументы такого типа Салмон называл «индуктивными аргументами». Далее он классифицирует их следующим образом:

  • аргументы, основанные на выборках;

  • аргументы, полученные по аналогии;

  • статистические силлогизмы.

Аргументы, основанные на выборках, представляют индуктивные обобщения. При обобщении также имеет место логический процесс перехода от единичного к общему, от менее общего к более общему знанию. Это понятие довольно близко смыкается с понятием индуктивного вывода, хотя в современной индуктивной логике индуктивный вывод трактуется более широко и рассматривает не только умозаключения от частного к общему, но и вообще все те логические отношения, когда истинность проверяемого знаниянельзя достоверноустановить на основании тех знаний, истинность которых нам известна, а можно лишь определить, подтверждается ли, а если да, то с какойстепенью, первое знание последними. Индуктивные обобщения имеют следующую форму:

X% наблюдаемых явленийFестьG;

поэтому (приблизительно) X%всехFестьG.

Аргументы, полученные по аналогии, выглядят следующим образом:

объекты типа Xимеют свойстваF1, F2, …, Fk;

объекты типа Yимеют свойстваF1, F2, …, Fk, а также свойствоG;

поэтому объекты типа Xимеют также свойствоG.

Наконец, статистические силлогизмы имеют следующую форму:

X% всех явленийFестьG;

 есть F;

поэтому естьG.

Здесь процент всех явлений понимается как значительный («большой»), ибо в противном случае заключение будет: не естьG.

Можно разделить индуктивные аргументы на статистические и категорные, понимая последние как имеющие некоторую форму рассуждений. Так, например, категорное индуктивное обобщение имеет следующий вид:

все наблюдаемые явления FестьG;

поэтому, все FестьG.

Независимо от того, являются ли индуктивные аргументы статистическими или категорными, главная проблема заключается в способе их оценивания. Чтобы узнать степень убеждения некоторой гипотезы (гипотетического заключения) Н при некотором основании (доводе) Е, можно прибегнуть к вероятностной формализации индуктивной поддержки этой гипотезы и вычислить условную вероятность Р(Н | Е), что реализуется в теории подтверждения(confirmationtheory). Сторонник этой теории Карнап прямо указывал на возможность рассмотрения степени подтверждения гипотезы Н путем основания Е как на степень общезначимости индуктивного аргумента типа «Е, поэтому Н» и обрабатывать эту «индуктивную общезначимость» как аналог дедуктивной общезначимости. Он писал, что, называя теорию индуктивного вывода недедуктивной, термин «вывод» в индуктивной логике не понимается в том же самом смысле, как в дедуктивной логике. Обе логики, как дедуктивная, так и индуктивная, едины в одном: они исследуют логические отношения между утверждениями, но если первая изучает отношение выводимости одних утверждений из других, то вторая – степень подтверждения утверждений, которая рассматривается как некоторая числовая мера. Другими словами, теория подтверждений сама по себе не устанавливает отношение логического следствия, поскольку любое основание только подтверждает любую гипотезу в определенной степени. Индуктивная логика, основанная на теории подтверждений, является логикойоценкигипотезы, а не ее образования. Поскольку меры убеждения выражают субъективные оценки агента об истинности гипотез, то процедуры оценки истинности гипотез являются тем средством, который отвечает на вопрос типа: «Насколько правдоподобна эта гипотеза при данном основании?»

Возвращаясь к категорным индуктивным аргументам, можно продолжить разделение недедуктивных рассуждений на индуктивные и абдуктивные. Если в индуктивных выводах некоторые факты, устанавливаемые для отдельных явлений, переносятся на весь класс таких явлений, то в абдуктивных выводах имеет место вывод от частного к частному.

Абдуктивные выводы были предложены одним из создателей математической логики Ч. Пирсом. В своей попытке классифицировать аргументы он следовал силлогистике Аристотеля. Гениальный мыслитель древности выбрал для формализации именно дедуктивные рассуждения, в которых истинные посылки порождают только истинные заключения. Пирс разработал свою теорию силлогистики. Рассмотрим в качестве примера аристотелевский силлогизм Barbara.

  1. Все студенты из группы А-13-2000 юны.

  2. Эти студенты являются студентами этой группы.

  3. Следовательно, эти студенты юны.

Истинность заключения не вызывает сомнений, если истинны две посылки. Считая первую посылку главной (Пирс называл ее правилом (rule)), а вторую – меньшей (он назвал ее случаем (case)), Пирс из этого силлогизма построил еще два других. Заключение он называл результатом (result).

  1. Случай: Эти студенты являются студентами группы А-13-2000.Результат: Эти студенты юны.Правило: Все студенты из группы А-13-2000 юны.

  2. Правило: Все студенты из группы А-13-2000 юны.Результат: Эти студенты юны.Случай: Эти студенты являются студентами группы А-13-2000.

В первом силлогизме из случая и результата осуществляется вывод правила, а во втором из правила и результата – случай.

Нетрудно заметить, что первый силлогизм относится к категорному индуктивному обобщению, а второй Пирс назвал принятием гипотезы (термин «абдукция» он ввел позже).

Таким образом, он пришел к следующей классификации вывода: вывод делится на дедуктивный (или аналитический) и синтетический, который, в свою очередь, подразделяется на индукцию и принятие гипотезы. Таким образом, индуктивное обобщение соответствует в его классификации индукции.

В 1902 году Пирс писал, что, уделяя слишком много внимания силлогистическим формам рассуждений, он недостаточно останавливался на трех формах рассуждений – абдукции, дедукции и индукции, которые идентифицировались, по его понятиям, с тремя стадиями научного исследования – генерацией гипотез, предсказанием и оценкой соответственно. Имея ряд наблюдаемых явлений и сопоставляя их, исследователь приходит к какой-то начальной гипотезе, затем получает из нее какие-то заключения (следствия), которые должны быть истинными, если исходная гипотеза истинна, и затем оценивает с некоторой степенью достоверности предсказанные заключения с реальностью. Первую стадию образования гипотез при объяснении наблюдаемых явлений он назвал абдукцией, вторую стадию вывода предсказанных заключений из гипотез –дедукциейи последнюю путем оценки этих заключений –индукцией.

Абдукция по Пирсу определяется как процесс формирования объяснительной гипотезы из наблюдаемых явлений реальной действительности, и он считал этот процесс инсайтом (подобно «вспышке» в голове) и не подлежащем алгоритмизации. Как и любой акт озарения, он не свободен от ошибок, и в основе абдукции, по его мнению, лежит «мистическая сила догадки». Вот его абдуктивная форма вывода:

наблюдается некоторый факт С;

если утверждение А было бы истинным, факт С был бы чем-то само собой разумеющимся;

следовательно, имеется причина подозревать, что А истинно.

О наблюдаемом факте С можно сказать, что он истинен и не является логическим следствием, полученным из нашего знания реального мира. Вторая посылка интерпретируется как «А логически влечет С». Истинность этой посылки очевидна, если истинен С и под «логически влечет» понимать материальную импликацию. Пирс назвал утверждение А объяснением С или объяснительной гипотезойфакта С. К гипотезе он предъявляет требование ее экспериментальной верифицируемости, ибо в противном случае она не может быть индуктивно оценена. Правда, сама верификация нужных гипотез требует дополнительных затрат, и по этой причине абдукцию он называл как «вывод наилучших объяснений».

Индукция идентифицируется Пирсом как процесс тестирования гипотезы посредством отобранных предсказаний. Идея об обеспечении верифицированного предсказания дальнейшей поддержки гипотезы близка к понятию подтверждения, который был обсужден ранее. Главное отличие от теории подтверждения состоит в том, что с точки зрения Пирса в индукции с помощью предсказаний гипотеза тестируется только по отобраннымпорциям довода, и, следовательно, оценка гипотезы носит в некотором смысле ограниченный характер.

Таким образом, Пирс отделяет процесс образования гипотез от их тестирования, и, по его мнению, абдукция является процессом генерации объяснительных гипотез, а индукция соответствует методу тестирования гипотез и их оценки.

Рассмотрим более подробно логические аспекты абдукции и индукции в плане их применения в интеллектуальных системах, будь это системы диагностики и планирования действий, или системы обучения и понимания естественного языка. Так как абдукция и индукция являются недедуктивными формами рассуждений, считаем, что основная функция абдукции заключается в обеспечении объяснений наблюдаемых явлений или событий, а функция индукции – в обеспечении обобщений наблюдений.

Для представления знаний имеем язык предикатов первого порядка, предикаты которого делятся на наблюдаемые и ненаблюдаемые или фоновые, в зависимости от того, описывают ли они наблюдаемые объекты и явления или нет. Имеют место знания трех типов:знание предметной областиили фоновое (background) знание представляет собой общую теорию, касающуюся только ненаблюдаемых предикатов;знание переднего плана(foregroundknowledge) является общей теорией, связывающей наблюдаемые предикаты с фоновыми; и наконец,знание примеров(иногда называемое знанием сценария) состоит из формул, содержащих только ненаблюдаемые предикаты, возможно выведенные из некоторого подмножества таких предикатов. Знание примеров может быть частью фонового знания. Наблюдаемые предикаты являются выполнимыми наблюдениями в отличие от предсказаний, истинностное значение которых неизвестно. Знание примеров обычно содержит описания объектов или ситуаций предметной области рассуждений в терминах ненаблюдаемых предикатов. Описание ненаблюдаемого объекта или индивидуума становится известным только после формирования гипотезы, которая может быть абдуктивной или индуктивной. Однако, эта гипотеза способна обеспечить предсказание ненаблюдаемого объекта, получив доступ к его описанию.

Отсюда можно определить цель индукции как вывод знания переднего планаиз наблюдений и другой известной информации, состоящей обычно из фонового знания и знания примеров. Эти наблюдения мы и пытаемся обобщить в новое знание переднего плана.

Если в индукции идет процесс обобщения, то в абдукции из наблюдений и другой известной информации мы выводим знание примеров. Возможные абдуктивные гипотезы строятся из специфических ненаблюдаемых предикатов, называемыхабдуцентами, и таким образом, абдуктивная гипотеза является гипотезой, которая пополняет знание примеров о наблюдаемом объекте или явлении.

Отсюда абдуктивная гипотеза предназначена для объяснений наблюдений, а индуктивная – для их обобщений. Если абдуктивное объяснение состоит только из знания примеров, то очевидно для абдукции нужна также и общая теория знания переднего плана, связывающая наблюдение с фоновыми предикатами с целью объяснения этих наблюдаемых явлений. Абдуктивное объяснение, таким образом, имеет смысл только относительно данной теории переднего плана.

Что касается индукции, то в ней объяснение играет иную роль, чем в абдукции.

Например, когда мы говорим, что все студенты группы А-13-2000 юны, то этот тип объяснений носит универсальный характер, и он был получен не из конкретной общей теории, а путем обобщения конкретных примеров: «эти студенты являются студентами группы А-13-2000» и «эти студенты юны». Можно сказать, что индуктивные гипотезы не объясняют конкретные наблюдаемые объекты и явления, а скорее объясняют частоты, с которыми эти наблюдения встречаются (в данном примере неюных студентов из группы А-13-2000 не наблюдалось). Отсюда, в индуктивной гипотезе на первое место выходит обеспечение обобщений наблюдаемых объектов и явлений, и объяснительная гипотеза будет индуктивной только в случае, если она обобщает. А это и является категорным индуктивным обобщением, когда исходя из истинности конкретных примеров (выборки) делаем вывод об истинности всей популяции.

Следует также заметить, что в абдукции имеется обобщение, выраженное только в общей теории фонового знания, в то время как в индукции мы получаем новые обобщения, не содержащиеся в общей теории фонового знания.

Индуктивное обобщение наиболее часто исследуется в машинном обучении, когда имеют место наблюдения неизвестного понятия, взятые в форме описания примеров (положительных примеров) и контрпримеров (отрицательных примеров). Цель состоит в определении понятия, которое правильно различает примеры от контрпримеров. Дана общая теория фонового знания Т, содержащая описание примеров и контрпримеров в виде множеств Р и Nфундаментальных (означенных) литер. Требуется определить гипотезу Н в рамках языка логики предикатов первого порядка такую, что:

  • для всех примеров p  P:T  H ╞ p;

  • для всех контрпримеровn  N:T  H n.

Одна из серьезных проблем в машинном обучении заключается в обеспечении метода обучения «адекватным» множеством примеров и контрпримеров. Термин «адекватный» неформально здесь понимается как достаточный для успешного обучения понятия, что в свою очередь выдвигает тяжелое условие для понимания, какие примеры достаточны (а какие нет) при решении этой задачи. Отметим также, что в логическом программировании множества PиNмогут содержать более сложные выражения, нежели фундаментальные факты.

Индуктивные методы также применяются для проблемы обнаружения знаний (knowledgediscovery). Дан некоторый довод (основание) Е и требуется определить гипотезу Н в рамках языка логики предикатов первого порядка такую, что:

  • Н истинна в модели m0, сконструированной из Е;

  • для всех формул gв рамках данного языка, еслиgистинна вm0, то Н ╞ g.

Предполагая, что модель m0является минимальной эрбрановской моделью, гипотеза Н представляет аксиоматизацию всех утверждений, истинных в этой модели.

Существенной особенностью процесса индукции является роль отобранной индуктивной гипотезы Н, состоящей в расширении существующей теории Т (фонового знания) на новую теорию Т= ТН. Таким образом, выбранная гипотеза Н обеспечивает связь между наблюдаемыми и ненаблюдаемыми предикатами, которой не доставало в исходной теории Т. Если абдукция с помощью абдуцентов расширяет знание примеров, то подлинное обобщение теории Т происходит только путем индукции. Можно сказать, что если в абдукции теория Т фиксируется, и варьируется только знание примеров, то в индукции, наоборот, фиксировано знание примеров, а подвержена изменению (расширению) теория Т.

Как в индуктивных, так и в абдуктивных рассуждениях имеются специфические факты, примеры, которые затем должны быть объяснены. Но если индукция рассматривает примеры как примеры понятия, а объяснения какобщие объяснения понятия, то в абдукции примеры рассматриваются какспецифические наблюдения, а объяснения как некоторые другиеспецифические факты, истинность которых подтверждает эти наблюдения.

Рассмотрим на примере взаимодействие между абдуктивными и индуктивными рассуждениями. Пусть дана теория фонового знания Т: «все студенты МЭИ юны» и наблюдение О: «все студенты группы А-13-2000 юны». Тогда объяснение этого наблюдения будет выражено гипотезой Н: «все студенты группы А-13-2000 являются студентами МЭИ». Взаимодействие между индукцией и абдукцией зависит от выбора наблюдаемых предикатов и абдуцентов.

Предположим, что в качестве наблюдаемого предиката мы выбрали Юн(х), а абдуцентом является СтМЭИ(х). Тогда гипотеза Н среди всех возможных абдуцируемых расширений теории Т, соответствующих разным абдуцируемым утверждениям знания примеров, непротиворечивого с Т, выбирает данное конкретное. В этом выбранном расширении наблюдение О выводится, и поэтому согласно абдуктивной теории Т гипотеза Н объясняет это наблюдение. Заметим, что эта гипотеза не обобщает данное наблюдение, т.е. наблюдаемый предикат Юн(х) действует только в рамках наблюдения О.

Теперь при анализе этого примера мы исходим из того, что наблюдаемым предикатом является СтМЭИ(х), предполагая, что любой из наблюдаемых студентов является студентом МЭИ. Образуя ту же самую гипотезу Н, что и раньше, и имея в виду уже индуктивную проблему, эта гипотеза становится индуктивной и обладает обобщающим действием на наблюдениях по предикату СтМЭИ(х). Но откуда появились наблюдения по предикату СтМЭИ(х)? Они могут быть получены из теории Т как выбранные абдуктивные объяснения при наблюдениях по предикату Юн(х). Здесь мы уже имеем гибридный процесс, первая ступень которого использует абдукцию как наблюдение на абдуцируемых предикатах, а вторая ступень – индукцию для обобщения этого множества наблюдений, получая общее утверждение на абдуцируемых предикатах.

Таким образом, абдукция может быть использована для извлечения из данной теории Т и наблюдений О абдуцированной информации О, которая затем на уровне индукции пополняет эту теорию до новой Ттакой, что Т╞ О. Затем этот процесс может быть повторен.

В свете современных воззрений дедукция, абдукция и обобщение взаимосвязаны, дополняют друг друга и присутствуют в той или иной степени в интеллектуальных системах. В связи с большими объемами перерабатываемых данных и знаний, высокими требованиями к точности и времени обработки, необходимостью работы с неполной, противоречивой и неопределенной информацией проблема автоматизации процессов дедукции, абдукции и обобщения становится одной из наиболее важных проблем при создании интеллектуальных систем различного назначения.

Мы живем, точно в сне неразгаданном, На одной из учебных планет…

Много есть, чего вовсе не надо нам, А того, что нам хочется, нет…

И. Северянин