
Интеллектуальные технологии / Конспект лекций / AILect02
.docИерархическая структура знаний, базисные категории, базисные действия, базисные методы. Теории как совокупность методов. Принцип передачи технологий, магистральный принцип.
Идея создания мыслящих машин “человеческого типа”, которые, казалось бы, думают, двигаются, слышат, говорят, и вообще ведут себя как живые люди уходит корнями в глубокое прошлое. Еще древние египтяне и римляне испытывали благоговейный ужас перед культовыми статуями, которые жестикулировали и изрекали пророчества (разумеется, не без помощи жрецов). Средневековые летописи полны рассказов об автоматах, способных ходить и двигаться почти также как их хозяева - люди. В средние века и даже позднее ходили слухи о том, что у кого-то из мудрецов есть гомункулы (маленькие искусственные человечки) - настоящие живые, способные чувствовать существа. Выдающийся швейцарский врач и естествоиспытатель XVIв Теофраст Бомбаст фон Гогенгейм (более известный под именем Парацельс) оставил руководство по изготовлению гомункула, в котором описывалась странная процедура, начинавшаяся с закапывания в лошадиный навоз герметично закупоренной человеческой спермы. “Мы будем как боги, - провозглашал Парацельс. Мы повторим величайшее из чудес господних - сотворение человека!”
В XVIII в. благодаря развитию техники, особенно разработке часовых механизмов, интерес к подобным изобретениям возрос, хотя результаты были гораздо более “игрушечными”, чем это хотелось бы Парацельсу. В 1736 г. французский изобретатель Жак де Вокансон изготовил механического флейтиста в человеческий рост, который исполнял двенадцать мелодий, перебирая пальцами отверстия, и дуя в мундштук, как настоящий музыкант. В середине 1750-х годов Фридрих фон Кнаус, австрийский автор, служивший при дворе Франциска I, сконструировал серию машин, которые умели держать перо и могли писать довольно длинные тексты. Другой мастер, Пьер Жак-Дроз из Швейцарии, построил пару изумительных по сложности механических кукол размером с ребенка: мальчика, пишущего письма и девушку, играющую на клавесине.
Успехи механики XIX в. стимулировали еще более честолюбивые замыслы. Так, в 1830-х годах английский математик Чарльз Бэббидж задумал, правда, так и не завершив, сложный цифровой калькулятор, который он назвал Аналитической машиной; как утверждал Бэббидж, его машина в принципе могла бы рассчитывать шахматные ходы. Позднее, в 1914 г., директор одного из испанских технических институтов Леонардо Торреси-Кеведо действительно изготовил электромеханическое устройство, способное разыгрывать простейшие шахматные эндшпили почти также хорошо, как и человек.
Однако только после второй мировой войны появились устройства, казалось бы, подходящие для достижения заветной цели - моделирования разумного поведения; это были электронные цифровые вычислительные машины. “Электронный мозг”, как тогда восторженно называли компьютер, поразил в 1952 г. телезрителей США, точно предсказав результаты президентских выборов за несколько часов до получения окончательных данных. Этот “подвиг” компьютера лишь подтвердил вывод, к которому в то время пришли многие ученые: наступит тот день, когда автоматические вычислители, столь быстро, неутомимо и безошибочно выполняющие автоматические действия, смогут имитировать невычислительные процессы, свойственные человеческому мышлению, в том числе восприятие и обучение, распознавание образов, понимание повседневной речи и письма, принятие решений в неопределенных ситуациях, когда известны не все факты. Таким образом “заочно” формулировался своего рода “социальный заказ” для психологии, стимулируя различные отрасли науки.
Попытки построить машины, способные к разумному поведению, в значительной мере вдохновлены идеями профессора МТИ Норберта Винера, одной из выдающихся личностей в интеллектуальной истории Америки. Помимо математики он обладал широкими познаниями в других областях, включая нейропсихологию, медицину, физику и электронику.
Винеру и его сотруднику Джулиану Бигелоу принадлежит разработка принципа “обратной связи”, который был успешно применен при разработке нового оружия с радиолокационным наведением. Принцип обратной связи заключается в использовании информации, поступающей из окружающего мира, для изменения поведения машины. В основу разработанных Винером и Бигелоу систем наведения были положены тонкие математические методы; при малейшем изменении отраженных от самолета радиолокационных сигналов они соответственно изменяли наводку орудий, то есть - заметив попытку отклонения самолета от курса, они тотчас расчитывали его дальнейший путь и направляли орудия так, чтобы траектории снарядов и самолетов пересеклись.
В дальнейшем Винер разработал на принципе обратной связи теории как машинного, так и человеческого разума. Он доказывал, что именно благодаря обратной связи все живое приспосабливается к окружающей среде и добивается своих целей. “Все машины, претендующие на “разумность”,- писал он, - должны обладать способность преследовать определенные цели и приспосабливаться, т.е. обучаться”. Созданной им науке Винер дает название кибернетика, что в переводе с греческого означает рулевой.
К этому времени и другие ученые стали понимать, что создателям вычислительных машин есть чему поучиться у биологии. Среди них был нейрофизиолог и поэт-любитель Уоррен Маккалох, обладавший, как и Винер философским складом ума и широким кругом интересов. В 1942 г. Маккалох, участвуя в научной конференции в Нью-йорке, услышал доклад одного из сотрудников Винера о механизмах обратной связи в биологии. Высказанные в докладе идеи перекликались с собственными идеями Маккалоха относительно работы головного мозга. В течении следующего года Маккалох в соавторстве со своим 18-летним протеже, блестящим математиком Уолтером Питтсом, разработал теорию деятельности головного мозга. Эта теория и являлась той основой, на которой сформировалось широко распространенное мнение, что функции компьютера и мозга в значительной мере сходны.
Исходя отчасти из предшествующих исследований нейронов (основных, активных клеток, составляющих нервную систему животных), проведенных Маккаллохом, они с Питтсом выдвинули гипотезу, что нейроны можно упрощенно рассматривать как устройства, оперирующие двоичными числами. Двоичные числа, состоящие из цифр единица и нуль, - рабочий инструмент одной из систем математической логики. Английский математик XIXв. Джордж Буль, предложивший эту остроумную систему, показал, что логические утверждения можно закодировать в виде единиц и нулей, где единица соответствует истинному выссказыванию, а нуль - ложному, после чего этим можно оперировать как обычными числами. В 30-е годы XX в. пионеры информатики, в особенности американский ученый Клод Шеннон, поняли, что двоичные единица и нуль вполне соответствуют двум состояниям электрической цепи (включено-выключено), поэтому двоичная система идеально подходит для электронно-вычислительных устройств. Маккалох и Питтс предложили конструкцию сети из электронных “нейронов” и показали, что подобная сеть может выполнять практически любые вообразимые числовые или логические операции. Далее они предположили, что такая сеть в состоянии также обучаться, распознавать образы, обобщать, т.е. она обладает всеми чертами интеллекта.
Теории Маккаллоха-Питтса в сочетании с книгами Винера (2) вызвали огромный интерес к разумным машинам. В 40-60-е годы все больше кибернетиков из университетов и частных фирм запирались в лабораториях и мастерских, напряженно работая над теорией функционирования мозга и методично припаивая электронные компоненты моделей нейронов.
К концу 50-х годов все эти увлечения выделились в новую более или менее самостоятельную ветвь информатики, получившую название “искусственный интеллект”. Исследования в области ИИ, первоначально сосредоточенные в нескольких университетских центрах США - Массачусетском технологическом институте, Технологическом институте Карнеги в Питтсбурге, Станфордском университете, - ныне ведутся во многих других университетах и корпорациях США и других стран.
Из этого кибернетического, или нейромодельного, подхода к машинному разуму скоро сформировался так называемый “восходящий метод” - движение от простых аналогов нервной системы примитивных существ, обладающих малым числом нейронов, к сложнейшей нервной системе человека и даже выше. Конечная цель виделась в создании “адаптивной сети”, “самоорганизующейся системы” или “обучающейся машины” - все эти названия разные исследователи использовали для обозначения устройств, способных следить за окружающей обстановкой и с помощью обратной связи изменять свое поведение в полном соответствии с господствовавшей в те времена бихевиористской школой психологии, т.е. вести себя так же как живые организмы. Однако отнюдь не во всех случаях возможна аналогия с живыми организмами.
Одним из тех, кого ничуть не испугали трудности был Фрэнк Розенблат, труды которого, казалось отвечали самым заметным устремлениям кибернетиков. В середине 1958 г. им была предложена модель электронного устройства, названного им перцептроном, которое должно было бы имитировать процессы человеческого мышления. Перцептрон должен был передавать сигналы от “глаза”, составленного из фотоэлементов, в блоки электромеханических ячеек памяти, которые оценивали относительную величину электрических сигналов. Эти ячейки соединялись между собой случайным образом, в соответствии с господствующей тогда теорией, согласно которой мозг воспринимает новую информацию и реагирует на нее через систему случайных связей между нейронами. Два года спустя была продемонстрирована первая действующая машина “Марк-1”, которая могла научится распознавать некоторые из букв, написанных на карточках, которые подносили к его “глазам”, напоминающие кинокамеры. Перцептрон Розенблата оказался наивысшим достижением “восходящего”, или нейромодельного метода создания искусственого интеллекта. Чтобы научить перцептрон способности строить догадки на основе исходных предпосылок, в нем предусматривалась некая элементарная разновидность автономной работы или “самопрограммирования”. При распознании той или иной буквы одни ее элементы или группы элементов оказываются гораздо более существеными, чем другие. Перцептрон мог научаться выделять такие характерные особенности буквы полуавтоматически, своего рода методом проб и ошибок, напоминающим процесс обучения. Однако возможности перцептрона были ограниченными: машина не могла надежно распознавать частично закрытые буквы, а также буквы иного размера или рисунка, нежели те, которые использовались на этапе ее обучения.
Ведущие представители так называемого “нисходящего метода” специализировались, в отличие от представителей “восходящего метода”, в составлении для цифровых компьютеров общего назначения программ решения задач, требующих от людей значительного интеллекта, например для игры в шахматы или поиска математических доказательств. К числу защитников “нисходящего метода” относились Марвин Минский и Сеймур Пейперт, профессора Массачусетского технологического института. Минский начал свою карьеру исследователя ИИ сторонником “восходящего метода” и в 1951 г. построил обучающуюся сеть на вакуумных электронных лампах. Однако вскоре к моменту создания перцептрона он перешел в противоположный лагерь. В соавторстве с южно-африканским математиком Пейпертом, с которым его познакомил Маккаллох, он написал книгу “Перцептроны”, где математически доказывалось, что перцептроны, подобные розенблатовсим, принципиально не в состоянии выполнять многие из тех функций, которые предсказывал им Розенблат. Минский утверждал, что, не говоря о роли работающих под диктовку машинисток, подвижных роботов или машин, способных читать, слушать и понимать прочитанное или услышанное, перцептроны никогда не обретут даже умения распознавать предмет частично заслоненный другим. Глядя на торчащий из-за кресла кошачий хвост, подобная машина никогда не сможет понять, что она видит.
Нельзя сказать, что появившаяся в 1969 г. эта критическая работа покончила с кибернетикой. Она лишь переместила интерес ученых и субсидии правительственных организаций США, традиционно финансирующих исследования по ИИ, на другое направление исследований - “нисходящий метод”.
В 1954 г. А. Ньюэлл задумал создать программу для игры в шахматы на основе метода, разработанного отцом теории информации К. Шенноном. А. Тьюринг, один из первых специалистов в области информатики, уточнил этот метод и промоделировал его вручную. Для того чтобы ответить на вопрос, какую машину считать “думающей”, Тьюринг предложил использовать следующий тест: испытатель через посредника общается с невидимым для него собеседником - человеком или машиной. "Интеллектуальной" может считаться та машина, которую испытатель в процессе такого общения не сможет отличить от человека.
В корпорации Рэнд Дж. Шоу и Г. Саймон объединились в работе по проекту Ньюэлла. Их поддержал коллектив психологов из Амстердама (руководитель А. де Гроот), который изучал стиль игры крупных шахматистов. Язык программирования, специально созданный этой группой, предназначаются для того, чтобы в машине было легко манипулировать информацией в символьной форме, работать с системой указателей и обрабатывать списки. Это был язык программирования ИПЛ1 (1956), явившийся предшественником языка Лисп (J. Mac Carthy, 1960). Первой программой искусственного интеллекта стала программа "Логик-Теоретик", предназначенная для доказательства теорем в исчислении высказываний. Ее работа была впервые продемонстрирована 9 августа 1956 г.
Программа для игры в шахматы NSS (Newell, Shaw, Simon) была создана в 1957 г. Ее структура и структура программы “Логик-Теоретик”, представление о "желаемых ситуациях" и "эвристиках" (правилах, которые позволяют сделать выбор при отсутствии точных теоретических оснований) привели позже к концепции универсального Решателя Задач. Эта программа, анализируя различия между ситуациями и конструируя цели, хорошо решает головоломки типа "Ханойская башня" или вычисляет неопределенные интегралы.
Интерес к кибернетике в последнее время возродился, так как сторонники “нисходящего метода” столкнулись со столь же неодолимыми трудностями. Сам Минский публично выразил сожаление, что его выступление нанесло урон концепции перцептронов, заявив, что , согласно его теперешним представлениям, для реального прорыва вперед в создании разумных машин потребуется устройство , во многом похожее на перцептрон. Но в основном ИИ стал синонимом нисходящего подхода, который выражался в составлении все более сложных программ для компьютеров, моделирующих сложную деятельность человеческого мозга.
Создаются новые программы. Дж. Гелернтер (Gelemter, 1960) показывает, что его программа доказательства теорем из школьной геометрии может работать лучше, чем ее создатель! Чтобы доказать, что треугольник АВС, у которого два угла у основания (углы при вершинах В и С) равны, является равнобедренным, программа вместо классического доказательства из учебников, заключающегося в построении высоты, опущенной из вершины А на основание, просто применяет теорему о равенстве треугольников АВС и АСВ. Результат очевиден...
В 1961 г. профессор Д. Мичи, один из ведущих английских специалистов по ИИ. описал механизм, состоящий из 300 спичечных коробков, который мог “научиться” играть в “крестики и колики”. Мичи назвал это устройство MENACE (Matchbox Educable Naugts and Crocces Engine). В названии (“menace” в переводе на русский означает “угроза”) заключается, очевидно, доля иронии, вызванной предубеждениями перед "думающими машинами".
Программа ЕРАМ (Elementary Perceiving and Memorizing Program -элементарная программа для восприятия и запоминания) задумана Е. Фейгенбаумом для моделирования психологических ситуаций.
Программы, работающие с запросами на естественном языке, были созданы давно, найдя применение при поиске информации в базах данных.Например, программа БЕЙСБОЛ (Green et а1. 1961) отвечала на вопросы о результатах прошедших бейсбольных матчей, а программе СТЬЮДЕНТ (Bobrow, 1964) было доступно решение алгебраических задач, сформулированных на английском языке. Весьма большие надежды возлагались исследователями на работы в области машинного перевода.
Почти в каждой работе по ИИ можно встретить упоминание о программе ЭЛИЗА, написанной в конце 60-х годов профессором Массачусетского технологического института Дж. Вайзенбаумом. Создавая программу ЭЛИЗА, Вайзенбаум не ставил своей целью разработку системы ИИ. На примере данной программы он хотел продемонстрировать сложность общения с ЭВМ на естественном языке, так как диалог между людьми с трудом поддается точному определению и никогда заранее нельзя предугадать, какие смысловые оттенки придают собеседники тем или иным фразам. К удивлению автора программы ЭЛИЗА, один из ее вариантов, был воспринят серьезно. Он назывался ДОКТОР (DOCTOR) и был задуман Вайзенбаумом как пародия на одну из широко известных школ психотерапии. Во время “психотерапевтического сеанса” ДОКТОР задает вопросы (типа “Каким образом?” или "Почему вы об этом говорите именно сейчас?") или в другом случае повторяет слегка перефразированный ответ собеседника, приглашая его тем самым развивать свою мысль дальше. Вайзенбаумом никак не ожидал, что эта шуточная программа будет воспринята как шаг к доказательству возможности общения с ЭВМ па естественном языке и что даже достаточно рассудительные люди всерьез начнут относиться к возможности разрешения их сугубо личных проблем, посвящая машину в собственные секреты и ожидая от нее помощи как от умудренного опытом - психотерапевта.
В этой сфере продолжают работать большие группы исследователей. Они ориентируются прежде всего на использование синтаксического анализа и информацию, получаемую из словарей (метод ключевых слов). И хотя этого недостаточно, как было доказано в сообщениях Дрейфуса (Dreyfus, 1972) и Лайтхилла (Lighthill, 1973), тем не менее исследователи потратили годы до того, как осознали, что автоматический перевод не является изолированной проблемой и требует для успешного осуществления наличия такого необходимого этапа, как понимание.
Новый подход в формальной логике, основанный на приведении рассуждений к противоречию, появился в 1965 г. (Дж, Робинсон). Этот подход позволяет формализовать многие задачи и дать их машинную интерпретацию. Его успешно использовали для доказательства теорем (Слейгл, Грин, Ковальский) и верификации программ (Кинг, Уолдингер). Этот же подход послужил отправной точкой при создании оригинального языка программирования - языка Пролог, который обладает мощностью логики первого порядка и был создан А. Колмрауером в 1971 г.
Исследования в области искусственного интеллекта сопровождаются разработкой языков программирования новых поколений и созданием все более изощренных систем программирования. Это дает возможность при разработке программ для ЭВМ использовать наши обычные методы рассуждения и обычный словарный запас. Более того, языки программирования Лисп, Пролог, PLANNER, QA4 (называем здесь только наиболее важные из них) позволяют с помощью концепций цели и утверждения моделировать и формализовать логический вывод в решении задач, языки MACSYMA и REDUCE позволяют производить формальные манипуляции с математическими выражениями, язык TMS позволяет осуществлять управление при ненадежных сведениях и проверять соответствие последних друг другу.
Описанные выше результаты начинают использоваться в робототехнике при управлении работой неподвижных или мобильных роботов, действующих в реальном трехмерном пространстве. При этом возникает проблема создания искусственных органов восприятия. В системах технического зрения воспринимающим устройством служит телекамера, а при распознавании зрительных образов все большую роль играют методы анализа зрительных сцен, связанные с определением очертаний предметов (Гузман, Уолц, Уинстон), а также выявлением предметов, т. е. частично скрытых другими предметами, находящимися на первом плане. Качество решения подобных задач с тех пор все время повышается.
До 1968 г. исследователи работали в основном с отдельными "микропространствами": они создавали системы, пригодные для таких специфических и ограниченных сфер приложения, как игры, евклидова геометрия, интегральное исчисление, "мир кубиков", обработка коротких фраз с небольшим словарным запасом. Почти во всех этих системах использовался один и тот же подход - упрощение комбинаторики, базирующееся на уменьшении необходимого перебора альтернатив на основе здравого смысла, применения числовых функций оценивания и различных эвристик. Обычно исследователь ограничивается только этими средствами, однако к настоящему времени уже реализованы десятки систем в различных областях применения, которые по уровню начинают соперничать с человеком. Примерами таких систем могут служить так называемые "игровые микрокомпьютеры", ориентированные на такие игры, как шахматы, игра го и некоторые азартные карточные игры. Однако экспертам предстоит судить, насколько велики достигнутые здесь успехи.
В начале 70-х годов произошел качественный скачок в исследованиях по искусственному интеллекту. Это объясняется двумя причинами.
Во-первых, все исследователи постепенно осознали, что всем ранее созданным программам не хватает самого важного- глубоких знаний в соответствующей области. Различие между экспертом и обыкновенным человеком состоит в том, что у эксперта имеется опыт в данной области, т. е. годами накопленные знания. Поэтому для существенного улучшения результатов работы какой-либо программы искусственного интеллекта требуется не просто усовершенствовать эвристики или какие-то числовые коэффициенты, с которыми работает программа, а напротив, необходимо использовать в ней методы логических рассуждений и наколенные в опыте знания, представленные в символьной форме.
Во-вторых, возникает конкретная проблема; как передать эти знания программе, если ее непосредственный создатель ими не обладает. Ответ ясен - сама программа должна их выделять из данных, получаемых от эксперта. Исследователи столкнулись с необходимостью снабдить системы искусственного интеллекта возможностями, которых нет в обычных языках программирования, а именно; программы искусственного интеллекта должны уметь сами собирать информацию (например, информацию такого типа; "Париж, 10 февраля, погода хорошая"), хранить эту информацию и использовать только при наличии достаточных оснований. В данном случае имеется разграничение между заключением о каком-то факте и использованием этого факта. В противоположность этому обычный язык программирования позволяет выражать только выполнимые задания или указания.
Отмеченная особенность является существенно важной, так как эксперт обеспечивает систему отдельными изолированными фактами, не зная заранее, в какой момент она решит принять их во внимание.
Исследования по решению задач и пониманию естественного языка объединяет одна основная проблема - представление знаний.
В 1970 г. было создано множество программ, основанных на этих идеях. Первая из них - программа DENDRAL. Она предназначена для порождения структурных формул химических соединений на основе информации, поступающей от масс-спектрометра. Программа была разработана в Станфорде при участии нобелевского лауреата Д. Ледерберга. Эта программа набиралась опыта в процессе собственного функционирования. Экспертом в нее было заложено много тысяч элементарных фактов, представленных в виде отдельных правил. Рассматриваемая система явилась одной из первых экспертных систем, и результаты ее работы поразительны. В настоящее время система поставляется потребителям вместе со спектрометром.
Разумеется, представляется идеальным, когда программа сама выводит используемые правила логических заключений, основываясь на полученном опыте, т. е. обучается. Именно это было реализовано группой DENDRAL в Станфордском исследовательском институте. В программе METADCNDRAL используется несколько общих правил, позволяющих отсекать неперспективные варианты при рассмотрении возможных фрагментов структур соединений, кроме того, в процессе работы программа сама выводит и последовательно уточняет частные правила построения структурных формул. Вначале это делается для отдельных связей химического соединения, а затем строится структура всего соединения. Это особенно удобно для малоизвестных групп химических соединений и позволяет использовать данную систему при редактировании соответствующих публикаций в международных периодических изданиях в области химии.
Терри Виноград разработал систему SHRDLU (1971), которая моделирует робота, манипулирующего кубиками. С роботом можно говорить по-английски. Система интересуется не только синтаксисом фраз, но и правильно понимает их смысл, благодаря семантическим и прагматическим знаниям о своем “мире кубиков”. Она умеет устранять двусмысленности, понимает метафоры, проверяет свои поступки и дает отчет о своих действиях. В конечном счете она показывает в реальных условиях, что все это стало возможным благодаря хорошей программе, которая управляет действиями такого робота.
В 80-х годах ИИ пережил второе рождение. Были широко осознаны его большие потенциальные возможности как в исследованиях, так и в развитии производства. В рамках новой технологии появились первые коммерческие программные продукты. В это время стала развиваться область машинного обучения. До этих пор перенесение знаний специалиста-эксперта в машинную программу было утомительной и долгой процедурой. Создание систем, автоматически улучшающих и расширяющих свой запас эвристических (не формальных, основанных на интуитивных соображениях) правил - важнейший этап в последние годы. В начале десятилетия в различных странах были начаты крупнейшие в истории обработки данных национальные и международные исследовательские проекты, нацеленные на “интеллектуальные ВМ пятого поколения”.
Число исследователей, посвятивших себя целиком искусственному интеллекту, составляет во всем мире несколько сотен, но достигнутые ими результаты касаются каждого из нас. Об этих результатах много говорят средства массовой информации, и нередко можно услышать о "роботах" будущего. На самом деле необходимо хорошо представлять себе, что эти исследования являются долгими и трудными, так как в отличие от искателя чудодейственных рецептов исследователи в области искусственного интеллекта пытаются постепенно воссоздать и ввести в ЭВМ опыт и знания специалистов всех областей знания.
В общем случае эта, информация отсутствует и нужна длительная работа с экспертом, чтобы выявить все, что было неосознанно отобрано и запомнено им за время своего совершенствования в какой-то конкретной области деятельности. Для решения этой проблемы разработаны специальные языки и системы представления информации. Но для ее решения необходимо также собрать больше информации, чем ее содержится в каком-либо словаре или энциклопедии. Эта задача не является невыполнимой, так как уже разработаны соответствующие методы и устройства. Кроме того, она увлекательна, так как позволяет узнать много нового о самом человеке и его разуме - ибо в действительности и.менно человек, является основным объектом изучения, и можно быть уверенным, что когда эта задача будет решена, программы искусственного интеллекта будут иметь самостоятельную ценность независимо от современных компьютеров.