Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
шпоры ит.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
151.55 Кб
Скачать

22. Автоматическое порождение письм. Текста: определение ,этапы, общая структура системы порождения

Процесс текста образования сост. из 2-ух этапов:

-стратегический(должно быть принято решение о том, что написать).-тактический(должно быть принято решение о том, как писать).. Результатом выполнения первого этапа должно стать семантическое представление будущего текста.Существует большое число способов задавания смысловой структуры предл. и текста., но все имеют недостаток-они не исходят из заранее заданной темы будущего текста. Результатом второго должен стать сам текст в языковой форме. Сущ. много нерешенных проблем: что явл. основной семантиктико-синтаксической еденицей текста(абзац или более краткий фрагмент); что должно выступать в качестве языковой ед.(слово или словосочит.);как лексические ед. связываются в единое содержание; каковы критерии выбора лекс. ед. из базы знаний…

Однако исследователи пришли к выводу, что в системе автоматического порождения текста должны быть 3 взаимосвязанных компонента:.-оболочка.-планировщик

-лингвистический реализатор.ОБОЛОЧКА определяет назначение порождающей системы. Это может быть обучающая комп. система, экспертная система, отвечающая на запрос пользователя в виде текста; система, моделирующая процесс создания текста- описание к-л объекта, текста-доказательствак-л закона,правила, стихотврения и т.д.

В оболочке также содерж. база знаний.Обычно она сост. Из 2-ух частей:

-нелингвистической(предметной),входят понятия, связи и отношения между понятиями конкретной области, к которой будет относится пораждаемый текст

-лингвистической, включает формализованные сведения о конкретном языке,на кот. генерируется текст( списки морфем, словарь, синтаксические структуры и т.д.

ПЛАНИРОВЩИК функции: -определяет нужную информацию,и ту, которую можно опустить; -определ. как эта информ. должна быть представлена( текст, список, табл…).-определ. порядок следования абзацев.-устанавл. порядок следования синтаксических составл. в пределах абзаца и текста.-осуществл. языковое оформление взаимосвязи предлож. в абзаце и абзацев в тексте.-осуществл. построение синтаксич. структуры предлож. будущего текста.-осуществл. выбор лексики.

Все эти задачи планировщик решает с опорой на оболочку,особенно на базу знаний.ЛИНГВИСТ.РЕАЛИЗАТОР обеспечвает грамматич. Правильность текста и принимает все окончательные синт.и морфол. решения.

23)Виды комп систем автоматич. Порождения письменного текста

Все существующие сегодня системы автомат. порождения текстов условно можно разделить на 2 больших группы.1 группа- системы, работающие на основе шаблонных технологий. Они строят будущий текст, манипулируя готовыми предлож. и словосоч как строит. блоками. Эти сист. просты и надежны и находят шиокое промышленное применение. Содержание порождаемого текста представлено в них в виде фрагментов текстов, созданных ранее людьми. Поэтому синтезированные тексты выглядят естественно. Однако, системы этой группы работают с жесткими типами текстов, напр.характеристиками, отчетами, договорами.2 группа-комп. системы, работающие на основе лингвистически мотивированных технологий. Для создания текста системе нужны знания структуры содержания генерируемого текста,а также сложные лингв. знания, кот. позволяют выразить содержание яз. средствами. Для создания таких систем нужно изучить жанровые и коммуникативные характеристики текстов, приемы организации содерж. текста, яз. средства выражения связности текста, формализацию грамматики и лексических описаний. В наст. время лингвистически мотивированные технологии наход. на стадии исследования. 25) синтез устно й речи с помощью комп.Первые системы синтеза речи появились в к.70-х прошлого века (синтезатор объявлял остановки в токийском метро). Сложность таких систем – сделать речь естественной. Сегодня существуют 3 осн метода автоматического синтеза речи

- кодирование речевых сигналов с их последующим прямым восстановлением. Комп служит устройством для записи речи подобно диктофону. Слова и фразы записываются в память компа и в нужный момент воспроизводятся. Для этой методики нужна память значительного объёма синтеза речи, приблежающаяся к человеческой

- фонетический синтез речи – акустическое моделирование голосового тракта ч-ка. Синтезатор говорит голосом робота. Речь создаётся в самом компе из отдельно синтезирующих звуков. Комп может создать любое слово из фонем и аллофонов (вариантных фонем). Число фонем в разных типах синтеза различно от 30-40 до неск.сотен фонем и аллофонов.

- математическое моделирование голосов тракта ч-ка. Словарь в таких синтезаторах создаётся с участием голоса ч-ка, но в данном случае в память не записываются непосредственно слова и фразы, а производится выделение числовых хар-к звуков речи и интонации. Числовые хар-ки преобразовываются в звуковые сигналы, из которых состоит речь.

24.Автоматическое распознавание устной речи.Если комп.сможет распознавать реч.сообщ.,то он сможет:1)поддержать голосовой ввод инф-и.2)обучать иностр.языкам.3)обучать родному яз.людей с дефектами и патологией речи.4)определять по голосу лич-ь чел.5)определять объективно-эмоц-е сост-е чел-а;6)переводить устн.речь,звучащую на одном языке в устн-у и письм-ю речь на др.языке.7)поддерживать обращение голоса к различ. инф.-справоч. системам;8)осущ-ть запись фонет. транскрипции устн. речи;9)вестив эл-м виде протоколы различн.заседаний;10)поддерж-ть голос.управление различн-х систем.Распознование речи комп.-распоз-е,кот-е подобно восприятию речи чел. в люб.условиях и с люб-м коммуникантом.Решению проблемы кибернетики и искусственного интеллекта мешают след.факторы:1)не сущ-т четких теор-х и эксперем-х данных по переработке реч-х сигналов;2)слитно произнес-я речь обладает след-и св-и:границы слов в слитной речи размыты;в слитной речи соседние звуки влияют друг на друга;знамен-е слова в основном произн-я четко;3)в голосе чел.всегда присутств-т экстралингвистич-я инф-я.4)в речи всегда присутствует паролингв-я инф-я.Промышленнореализованная сист-а распоз-я условно делится:1)средства реч.управления;2)средства диктовки;3)инф-о-справочн.сист.4)средства идентефикации в чел. по образцу речи.Различают след-е виды сист.распоз-я:1)сис-ы распоз-я команд;2)слитной речи:системы распоз-я дискреьной речи(медл-я,четкоартикулируемая),сит.естеств-о реч-о потока.Любая си-а расп-я строится на 4-х осн-х блоках:1)блок записи и обработки данных(снятие фонового шума);2)блок извлеч-я особенностей(кажд.10мили.секделение реч.потока на акуст.порции);3)блок акустич.совмещ-я(распознавание миним-х акустич-х единиц,составл-х слово;4)блок динамического программирования(сравнение с эталонами в памяти комп.,генерация слов).Факторы,влияющие на кач.распознования:1)объем словаря эталонов произношения2)темп речи;3)зависимость от диктора;4)вычислительные ресурсы комп.;5)чел.фактор-комп.си-ы должны либо сравниваться либо привзойти.6)экстра \-линг.инф-я(мед.,псих,инивид,эмоц.,пространственная).Основные направления улучш-я кач-а распозн.:1)увелич.кол-а эталонов произн. слов;2)анализ контекста;3)опред-е темы текста .

25. синтез устно й речи с помощью комп.Первые системы синтеза речи появились в к.70-х прошлого века (синтезатор объявлял остановки в токийском метро). Сложность таких систем – сделать речь естественной. Сегодня существуют 3 осн метода автоматического синтеза речи

- кодирование речевых сигналов с их последующим прямым восстановлением. Комп служит устройством для записи речи подобно диктофону. Слова и фразы записываются в память компа и в нужный момент воспроизводятся. Для этой методики нужна память значительного объёма синтеза речи, приблежающаяся к человеческой

- фонетический синтез речи – акустическое моделирование голосового тракта ч-ка. Синтезатор говорит голосом робота. Речь создаётся в самом компе из отдельно синтезирующих звуков. Комп может создать любое слово из фонем и аллофонов (вариантных фонем). Число фонем в разных типах синтеза различно от 30-40 до неск.сотен фонем и аллофонов.

- математическое моделирование голосов тракта ч-ка. Словарь в таких синтезаторах создаётся с участием голоса ч-ка, но в данном случае в память не записываются непосредственно слова и фразы, а производится выделение числовых хар-к звуков речи и интонации. Числовые хар-ки преобразовываются в звуковые сигналы, из которых состоит речь.

26. Срав принципов обработки инф.чел. и комп.Сравнительные характеристики обработки инф-ции компьютером и человеком.

1. ввод информации. Комп вводит со скоростью 32 мв/сек. Человек читает 120 слов/мин. Лаборант печатает 10-15 ударов/сек. 2. память. Комп – оперативная память 2-8 Гб. Человек – 5-7 миллиарда нейронов, запоминает по ассоциациям. 3. скорость обработки информации. Комп – 3 миллиарда операций в сек. Человек – 20-30 операций в сек.

4. вывод информации. Комп – 16-32 стр/мин. Человек – 120 слов/мин, холерик 360 слов/мин.

27. Способы использования комп. в обучен..Понятие о дистанцион. обуч.Все компьютерные обучающие системы можно разделить на

- обучающие проги, поддерживающие обучение на отдельных этапах (лексика, грамматика…)

- мультимедийные обучающие проги, дающие комплексное обучение (мультимедийные энциклопедии)

- использование прикладных прог, созданных с другими целями (машинный перевод)

- использование средств телекоммуникации (дистанционное обучение)

Модели дистанционного обучения

- интерактивное телевизионное обучение (впервые разработано в Национальном технологическом универе США) - дистанционное обучение с использованием носителей с учебной информацией (CD-диски) - дистанционное обучение с использованием телекоммуникационных сетей.А) на основе всемирной паутиныБ)в режиме видеоконференции

28. Этапы процесса создания обучающ.сист. Обучение ч-ка с помощью компа исполняется в рамках АОС (автоматиз.обуч.системы) – комплексная система с альтернативной системой диалога, относящ.к некоторой предметной области (лексика, грамматика….)Непосредственно компьютерная прога с учебным материалом – автоматизированный учебный курс.Создание АОС включает 5 этапов .1.Идентификация задачи.2.Концептуализация задачи.3.Формализация.4.Реализация..5.Тестирование системы.

1)на 1-ом этапе решаются вопросы ( - какой тип обуч.системы будет создаваться, - какие параметры будут использованы для оценки, - какая процедура оценки знания будет использована)

Различают 3 этапа систем обучения (- обучающие системы, - контролирующие (тестовые) системы, - комбинированные (обучающе-контролирующие) системы).Для оценки знаний могут использоваться параметры ( - общее число знаний, - число верновыполненных заданий, - время выполнения задачи, - число подсказок, - число попыток, - типовые ошибки обучаемого)

Оценка знание – по 10балльной системе.2)Этап концептуализации состоит в определении основных понятий, в отборе правил, слов, таблиц. Принципы подачи материала: от известного к неизвестному, от простого к сложному.3)В процессе выполнения 3-го этапа строится обучающий сценарий (модель процесса обучения, опирающаяся на определённый метод обучения и представленная в виде последовательности кадров).Кадр – порция учебного материала, предъявленная на экране компа. Все кадры можно разделить на основные и вспомогательные (инф-ция о названии, её авторов, правила).4)Этап сводится к напоминанию проги. Могут быть использованы: языки программирования, специальные авторские языки (ЯОК – язык обуч.кадров) 5)Этап тестирования сводится к : - выявлению трудностей заданий. - уточнения оценок выставляемых системой. - выявление психо-физиологических особенностей работы с программой.