Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзаменационные вопросы по ОИТ.docx
Скачиваний:
4
Добавлен:
24.09.2019
Размер:
62.33 Кб
Скачать

24. Автоматическое порождение письменного текста: определение, этапы, виды компьютерных систем.

Порождение связного текста с помощью компьютера. Установлено, что процесс текстообразования состоит из двух этапов: стратегическую (должно быть принято решение о том «что написать») и тактического (должно быть принято решение о том «как написать»). Результатом выполнения первого этапа должно стать смысловое представление будущего текста. Результатом выполнения второго этапа должен стать собственно сам текст в языковой форме. Исследователи разных стран пришли к выводу, что в системе автоматического порождения текста должны быть представлены три взаимосвязанных компонента:

1. Оболочка;

2. Планировщик;

3. Лингвистический реализатор.

Оболочка, прежде всего, определяет назначение порождающей системы. Это может быть обучающая компьютерная система, генерирующая комментарии компьютера в виде текста; экспертная система, отвечающая на запрос пользователя связным текстом; система моделирующая процесс создания текста - описания какого-либо объекта, текста - определения какого-либо понятия, текста стихотворения, рассказа и т. д.

В оболочке содержится вся база знаний. Она состоит из двух частей: предметной, в которую входят понятия, связи и отношения между понятиями конкретной предметной области, к которой будет относиться порождаемый текст, и лингвистической, которая включает формализованные сведения о конкретном языке на котором генерируется текст (списки морфем, словарь с необходимой лексикой, синтаксические структуры предложений и т. п.).

Планировщик выполняет следующие функции: 1- определяет ту информацию, которая должна быть представлена в тексте, и ту, которую можно опустить; 2- определяет, как эта информация должна быть представлена 3- определяет порядок следования абзацев в тексте; 4-устанавливает порядок следования синтаксических составляющих в пределах абзаца и всего текста; 5- осуществляет языковое оформление взаимосвязи предложений в абзаце и абзацев в тексте;6 -осуществляет построение синтаксической структуры предложений будущего текста; 7- осуществляет выбор соответствующей лексики.

Все эти задачи планировщик решает с опорой на оболочку и, в частности, на базу знаний (ее очень тщательно разрабатывают специалисты). Лингвистический реализатор обеспечивает грамматическую правильность порождаемого текста и принимает все окончательные синтаксические и морфологические решения (подтверждение или отрицание выбора синтаксического типа предложения и

его структуры, подтверждение или отрицание выбора конкретных основ и афиксов/окончаний или словоформ и т. д.).

25. Общая структура системы порождения письменного текста.

26. Автоматическое распознавание устной речи.

Если компьютер сможет распознавать и понимать речевое сообщение, звучащее на каком-то естественном языке, если он сможет говорить на том или ином языке так, как это делает человек, его возможности значительно расширятся. Он сможет: 1 - поддерживать голосовой ввод информации в различные приложения; 2 - обучать иностранным языкам; 3 - определять по голосу личность человека 4 -определять объективно эмоциональное состояние человека (летчика, диспетчера и т. д.); 5 - переводить устную речь; 6 - поддерживать обращение голосом к различным информационно-справочным системам , базам данных по телефону или через интернет; 7 - поддерживать голосовое управление различными компьютерными системами; 8 - вести в электронном виде протоколы различных заседаний, результаты медицинских обследований и т. д.

Распознавание речи компьютером - распознавание, которое подобно восприятию речи человеком в любых условиях и при общении с любым коммуникантом. Общение при помощи устной речи является самым надежным и универсальным средством коммуникации. Автоматическое распознавание речи является самым надежным и универсальным средством коммуникации. Его следует считать одной из наиболее сложных проблем технической кибернетики и искусственного интеллекта, и она в полном объеме вряд ли может быть решена в ближайшие 50 лет.

Решению этой проблемы мешают следующие факторы: 1) не существует ни теоретических представлений, ни экспериментальных данных, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов; слитно произнесенная речь обладает следующими свойствами: границы в слитной речи четко не определены; в слитной речи соседние звуки влияют друг на друга и изменяют звуковые характеристики; знаменательные слова (существительные, прилагательные, глаголы и т. д.) в основном произносятся отчетливо, в то время как функциональные слова (предлоги, союзы, частицы и т. д.) могут выговариваться не четко и даже исчезать; в голосе говорящего человека всегда присутствует экстралингвистическая информация, свидетельствующая о его особом эмоциональном, психофизиологическом состоянии, указывающая на его возраст, пол, национальность, состояние здоровья (простуженный голос) и т. д. Иногда экстралингвистическая информация может даже отрицать смысл произнесенных слов. В процессе речевого общения кроме используемых слов большое значение имеют паралингвистические средства коммуникации: фонация (характеристики голоса человека), кинесика (мимика, жесты, позы коммуникантов), проксемика (расстояние между ними), коммуникативно значимое молчание (молчание не как физиологическое состояние человека).

Исходя из вышеизложенного, сегодня автоматическое распознавание речи может осуществляться только при наложении определенных ограничений на процесс распознавания: например распознавание изолированно произносимых слов, распознавание речи с предварительной настройкой на голос конкретного пользователя, распознавание речи с опорой на небольшой заранее определенный словарь и т. д.

Промышленно реализованные системы распознавания устной речи условно можно разделить на четыре следующие группы. 1-Средства речевого управления (компьютером, его периферийными устройствами, работой различных приложений; работой бытовых приборов и т. д.); 2- Средства диктовки, позволяющие голосом вводить текстовую информацию в любые приложения (при этом введенная информация отображается на экране дисплея ); 3- Информационно-справочные системы, работающие в диалоговом режиме в качестве автоответчика (отвечают на вопросы пользователей о движении железнодорожного, морского, автотранспорта и т. д.); 4- Средства идентификации человека по образцу речи (голосовые пароли и т. д.)