- •Вопрос 1.
- •Вопрос 2.
- •Вопрос 3.
- •Вопрос 4.
- •Вопрос 5.
- •Вопрос 6.
- •Вопрос 7.
- •Вопрос 8.
- •Вопрос 9.
- •Вопрос 10.
- •Вопрос 11.
- •Вопрос 12.
- •Вопрос 13.
- •Вопрос 14.
- •Вопрос 15.
- •Вопрос 16.
- •Вопрос 17.
- •Вопрос 18.
- •Вопрос 19.
- •Вопрос 20.
- •Вопрос 21.
- •Вопрос 22.
- •Вопрос 23.
- •Вопрос 24.
- •Вопрос 25.
- •Вопрос 26.
- •Вопрос 27.
- •Вопрос 28.
- •Вопрос 29.
- •Вопрос 30.
Вопрос 23.
ПК, понимающий письменный текст, должен иметь в своей базе данных:
Знания о языке текста;
Правила использования этих знаний;
Знания о реальном мире (конкретной предметной области);
Правила использования знаний о фрагменте реального мира;
Знания о пользователе, желающем от ПК понимания текста.
Типы автоматического понимания:
Понимание-узнавание (в ПК есть лишь знания о языке) – суть в том, что ПК узнаёт морфологическую структуру каждого слова, проводит синтаксический анализ каждого предложения, узнаёт в исходном тексте ключевые слова, словосочетания и предложения);
Понимание уподобление (ПК имеет знания о языке и правила их использования, считается, что система поняла текст, если она может ответить на вопросы по нему) – суть в нахождении готового ответа своей базе данных, ранее данных человеком, так как она уподобляется человеку;
Понимание-прогнозирование (ПК ориентированы на понимание текстов узкой специальности, должны иметь знания о языке, правилах их использования и предметной области.) - считается, что система поняла текст, если может определить, какой объект или событие предметной области соответствует фрагментам текста. Однако одним и тем же фрагментам текста могут соответствовать разные объекты, поэтому их соотношение можно определить лишь с определённой долей вероятности. Отсюда и прогнозирование).
Понимание-объединение (в базе данных системы 4 вида вышеназванных знаний) – объединяя эти виды знаний, ПК должен уметь делать выводы, умозаключения по тексту, и объяснять, почему она сделала такой вывод (работа экспертных систем);
Понимание-объяснение (в ПК есть все 5 видов вышеназванных знаний) – ПК должен уметь объяснить пользователю, как она поняла текст. Так как система должна дать ответ любому пользователю с учётом уровня его образования, используется диалог «ПК->пользователь».
Сегодня проблема автоматического понимания текста реализована в:
Автоматических системах реферирования и аннотирования и перевода текста;
Информационных и информационно-поисковых системах;
Экспертных системах.
Вопрос 24.
Системы автоматического порождения письменного текста:
Занимаются с 70-х, однако нет единой теории текстообразования, не может быть создана единая теория порождения текста из-за неоднозначного определения понятия «текст»:
Создатели диалоговых систем под текстом понимают любую реплику из нескольких слов;
Создатели систем генерации метеосводок или статистических отчётов понимают под текстом некоторую таблицу;
Создатели инструкций понимают под текстом цепочку несвязанных между собой предложений, относящихся к одному объекту.
Этапы порождения текста:
Стратегический (решение, что писать) – результат: семантическое представление будущего текста;
Тактический (решение, как писать) – результат: собственно текст в языковой форме.
Виды компьютерных систем порождения текста:
Системы, работающие на основе шаблонных технологий (строят будущий текст, манипулируя готовыми предложениями и словосочетаниями как строительными блоками; просты и надёжны, находят широкое промышленное применение; содержание порождённого текста представляется в виде фрагментов текстов, созданных ранее людьми, поэтому выглядит естественно, однако работает только с жёсткими типами текстов);
Системы, работающие на основе лингвистически мотивированных технологий (для создания текста системе нужны сложные знания структуры содержания создаваемого текста и сложные лингвистические знания, которые позволяют выразить содержание языковыми средствами; промышленных систем такого рода нет).