Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Волгоградский государственный технический университет»
Факультет электроники и вычислительной техники
Кафедра «Системы автоматизированного проектирования и поискового конструирования»
Семестровая работа по дисциплине
«Лингвистическое и программное обеспечение систем»
Выполнил: Карташов Д.С.
Группы: АУЗ-364 C
Шифр 20122257
Проверил: Розалиев В.Л.
Волгоград 2014
Содержание:
Часть 1 Семантические сети …………………………………………………………...3
Часть 2 Поисковые системы …………………………………………………………...6
Часть 3 Система анализа речи …………………………………………………………9
Часть 4 Система анализа текста ……………………………………………………...12
Список Литературы …………………………………………………………………...15
Семантические сети
Прародителями современных семантических сетей можно считать экзистенциальные графы, предложенные Чарльзом Пирсом в 1909 г. С их помощью описывались понятия и логические связи между ними некоторой предметной области. Важным этапом в становлении семантических сетей стали работы немецкого психолога Отто Сэлза 1913 и 1922 гг. Для описания понятий и связей между ними, а также изучения методов наследования свойств он использовал графы и семантические отношения. Первые компьютерные реализации семантических сетей появились в конце 1950-х – начале 1960-х гг. в системах машинного перевода (Ричард Риченс, Маргарет Мастерман). Одной из основополагающих теоретических работ по семантическим сетям считается труд американского психолога Росса Куиллиана о «семантической памяти» («Semantic memory. Semantic information processing», «Семантическая память. Семантическая обработка информации», 1968г.)
Семантика– раздел языкознания, изучающий значение единиц языка, прежде всего его слов и словосочетаний. В более общем смысле, семантика определяет смысл знаков (образов, обозначений) и их сочетаний.
Семантическая сеть(смысловая сеть) — модель предметной области, представленная в виде графа, вершинами которого являются понятия, а дуги (ребра) – отношения между ними.
Классификация семантических сетей
Для всех семантических сетей справедливо разделение по арности и количеству типов отношений.
По количеству типов отношений, сети могут быть однородными и неоднородными.
Однородные сети обладают только одним типом отношений (стрелок), например, таковой является классификация биологических видов (с единственным отношением AKO).
В неоднородных сетях количество типов отношений больше двух. Классические иллюстрации данной модели представления знаний представляют именно такие сети. Неоднородные сети представляют больший интерес для практических целей, но и большую сложность для исследования. Неоднородные сети можно представлять как переплетение древовидных многослойных структур. Примером такой сети может быть Семантическая сеть Википедии.
По арности:
типичными являются сети с бинарными отношениями (связывающими ровно два понятия). Бинарные отношения очень просты и удобно изображаются на графе в виде стрелки между двух концептов. Кроме того, они играют исключительную роль в математике.
На практике, однако, могут понадобиться отношения, связывающие более двух объектов — N-арные. При этом возникает сложность — как изобразить подобную связь на графе, чтобы не запутаться. Концептуальные графы снимают это затруднение, представляя каждое отношение в виде отдельного узла.
По размеру:
Для решения конкретных задач, например, тех которые решают системы искусственного интеллекта.
Семантическая сеть отраслевого масштаба должна служить базой для создания конкретных систем, не претендуя на всеобщее значение.
Глобальная семантическая сеть.Возможно когда-нибудь такой сетью станет Всемирная паутина.
В семантических сетях часто используются также следующие отношения:
- таксономические («класс – подкласс – экземпляр», «множество – подмножество – элемент» и т.п.).
- структурные («часть – целое»).
- родовые («предок» - «потомок»);
- производственные («начальник» - «подчиненный»);
- функциональные (определяемые обычно глаголами «производит», «влияет» и т.п.);
- количественные (больше, меньше, равно и т.п.);
- пространственные (далеко от, близко от, за, под, над и т.п.);
- временные (раньше, позже, в течение и т.п.);
- атрибутивные (иметь свойство, иметь значение);
- логические (И, ИЛИ, НЕ);
- казуальные (причинно-следственные).
Достоинствасемантических сетей:
универсальность, достигаемая за счет выбора соответствующего набора отношений. В принципе с помощью семантической сети можно описать сколь угодно сложную ситуацию, факт или предметную область;
наглядность системы знаний, представленной графически;
близость структуры сети, представляющей систему знаний, семантической структуре фраз на естественном языке;
соответствие современным представлениям об организации долговременной памяти человека.
Недостатки семантических сетей:
сетевая модель не дает (точнее, не содержит) ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затруднительны;
сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода;
проблема поиска решения в семантической сети сводится к задаче поиска фрагмента сети, соответствующего подсети, отражающей поставленный запрос. Это, в свою очередь, обуславливает сложность поиска решения в семантических сетях;
представление, использование и модификация знаний при описании систем реального уровня сложности оказывается трудоемкой процедурой, особенно при наличии множественных отношений между ее понятиями.
Примеры:
э
Транспорт
ч
Машина
Хозяин
ц
Черный
д
Поездка
к
м
Работа
2107
ч – чья
д – для
к – куда
э - это
ц – цвет
м - модель
Рыжая
о
в
п
Собака
Лабрадор
Хозяин
д
ч
Защита
Имущество
п - принадлежность
о - окрас
в - вид
д - для
ч - чего