
- •Министерство образования Российской Федерации Казанский государственный технический университет им. А.Н.Туполева
- •NLP-СИСТЕМЫ
- •«Текст- Смысл»
- •Системы автоматического аннотирования и реферирования
- •Поверхностные методы
- •Поверхностные методы
- •Поверхностные методы
- •Поверхностные методы
- •Схема работы системы реферирования текста
- •Схема работы системы реферирования текста
- •Схема работы системы реферирования текста
- •Глубинные методы
- •Глубинные методы
- •Глубинные методы
- •Глубинные методы
- •Глубинные методы
- •Системы машинного перевода
- •Классификация систем машинного перевода
- •Поколения систем машинного перевода Поколение 1
- •Поколения систем машинного перевода Поколение 2
- •Поколения систем машинного перевода Поколение 3
- •Информационно-поисковые системы
- •ПРОЦЕДУРЫ ИНФОРМАЦИОННОГО ПОИСКА
- •Оценка результатов информационного поиска
- •Фактографические ИПС (ФИПС)
Министерство образования Российской Федерации Казанский государственный технический университет им. А.Н.Туполева
Кафедра АСОИУ
Интеллектуальные информационные системы
Лекция 6
Системы обработки естественного языка
2011
NLP-СИСТЕМЫ
•Интеллектуальные БД
•Естественно-языковые интерфейсы
•Информационно-поисковые системы
•Гипертекстовые системы
•Системы контекстной помощи
•Системы аннотирования и реферирования
•Системы машинного перевода

«Текст- Смысл»
Читаем, слушаем АНАЛИЗ: Модель «ТЕКСТ -- СМЫСЛ»
«тексты» |
ЕЯ |
«смыслы» |
Говорим, пишем СИНТЕЗ: Модель «СМЫСЛ -- ТЕКСТ»
Системы автоматического аннотирования и реферирования
Реферат – краткое изложение содержания одного или нескольких литературных источников на определенную тему.
Требования к реферату:
- представление всех основных тем и мыслей источников; - краткое изложение темы (от 5 до 30% от объема
источников); - возможность наличия нескольких источников.
Методы аннотирования и реферирования:
-поверхностные;
-глубинные.

Поверхностные методы

Поверхностные методы

Поверхностные методы
Поверхностные методы
Метод линейных коэффициентов
( k1, k2, k3, k4) – коэффициенты, характеризующие блок U
k1 |
- отражает расположение блока в тексте. |
|
k2 |
- |
отражает частоту появления блока в источнике. |
k3 |
- |
оценивает наличие в блоке ключевых фраз. |
k4 |
- отражает статистическую значимость блока, учитывает |
|
вхождение в заголовки, колонтитулы. |
Оценка блока : |
В(U)= a1k1 + a2 k2 + a3k3 + a4 k4 |
a1, a2 , a3, |
a4 - коэффициенты настройки системы |

Схема работы системы реферирования текста
(режим обучения)

Схема работы системы реферирования текста
(режим обучения)