Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Интеллект.систем / Лекция 5_2011_М.ppt
Скачиваний:
73
Добавлен:
12.03.2015
Размер:
162.82 Кб
Скачать

Министерство образования Российской Федерации Казанский государственный технический университет им. А.Н.Туполева

Кафедра АСОИУ

Интеллектуальные информационные системы

ЛЕКЦИЯ № 5

Текстологические методы приобретения знаний

2011

Методы извлечения знаний

Коммуникативные

Текстологические

DM&KM

методы

методы

 

Текст – вербализированное представление модели мира автора на ЕЯ

Влюбом тексте можно выделить:

a). Наличие некоторой системы понятий,

соответственно предметной области.

b). Некий первичный материал в виде результатов собственных наблюдений.

c). Собственные взгляды автора

по излагаемому вопросу.

d). Кроме личных мыслей используются заимствования из других источников.

e). Общие места.

( a, b, c, d, e )

Этапы восприятия текста

1. Чтение. Восприятие текста, как последовательности синтаксических конструкций.

2. Понимание смысла. Интерпретация

содержания синтаксических конструкций.

Результат понимания - формирование модели мира в сознании читателя

Приобретение знаний

Аналитик Программист

Источники

знаний

 

 

 

БЗ

 

 

 

 

 

 

 

 

 

 

 

 

Средства

 

 

 

 

автоматизации

 

 

Источники знаний - тексты

Проблемы автоматического распознавания текста

Шрифтовое и размерное разнообразие

Дефекты изображения

Близость изображений символов (контекст)

Посторонние включения в изображение

Сочетание нескольких языков

Автоматическое чтение -

частный случай задачи автоматического восприятия зрительных образов

Задача классификации

Имеется N классов объектов:

Ώ1, Ώ2, . . . , ΏN

О - предъявляемый для распознавания объект.

Задача. Определить i : О Ώi

OCR-системы

OCR - Optical Character Recognition

Текст

OCR-системы

OCR - Optical Character Recognition

Текст Сканер Графическое изображение

Шейп

Соседние файлы в папке Интеллект.систем