Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
реферат_корсукова_итог.docx
Скачиваний:
4
Добавлен:
24.09.2019
Размер:
117.31 Кб
Скачать

Министерство образования Российской Федерации

ОМСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ (ОмГТУ)

Кафедра «Средства связи и информационная безопасность»

Реферат по курсу «Устройства преобразования

и обработки информации в системах подвижной радиосвязи»

Информационная эффективность цифровой передачи и информационный объем цифрового представления речевого сигнала. Понятие о факторах, определяющих минимальную цифровую скорость передачи речевых сигналов. Информация избыточная и излишняя. Понятие о статистической и психофизиологической избыточности речевого сигнала. Критерий верности, свойственный получателю.

Выполнил: студент

группы РП-418

Корсукова А.А.

Проверил:

Овчинников С.В.

Омск 2012

Оглавление

Введение 3

Информационная эффективность цифровой передачи и информационный объем цифрового представления речевого сигнала 4

Особенности речевого сигнала во временной и частотной области 5

Понятие о факторах, определяющих минимальную цифровую скорость передачи речевых сигналов. 10

Информация избыточная и излишняя. Понятие о статистической и психофизиологической избыточности речевого сигнала. 11

Основы кодирования речевого сигнала. 14

Способы уменьшения психофизиологической избыточности 26

Критерий верности передачи, свойственный получателю. 31

Список использованной литературы 32

Введение

Достоинства цифровых методов представления, обработки, передачи и хранения информации, бурное разви­тие цифровой элементной базы - все это способствует тому, что цифровые методы обработки и передачи инфор­мации стали основным направлением систем связи, телевидения, других инфо-коммуникационных систем.

Использование цифровых методов представления, обработки и передачи приводит к многократному увеличе­нию занимаемой полосы частот и, как следствие этого, к многократному уве­личению скорости передачи информа­ционных сообщений. Под информаци­онными сообщениями обычно понима­ют речь, различные виды изображе­ний, мультимедиа и т.д. Ре­шение проблемы лежит в области разработки эффективных методов цифро­вого преобразования - сжатия (коди­рования) различных сообщений, явля­ющихся, как правило, нестационарны­ми случайными процессами. Посколь­ку речь является наиболее распростра­ненным аналоговым информационным сообщением, вопросы сжатия (цифро­вого кодирования) речи являются наи­более актуальными и традиционными.

Информационная эффективность цифровой передачи и информационный объем цифрового представления речевого сигнала

Информационная эффективность характеризует реальную скорость передачи информации   по отношению к пропускной способности   канала связи:

.

Информационная эффективность   всегда меньше единицы; чем ближе   к единице, тем совершеннее система.

Информационный объем цифрового представления, который надо знать при передаче или хранении сигнала:

где Fs—частота дискретизации (т. е. отсч./с); В—число бит на отсчет сигнала. Основной путь уменьшения скорости передачи состоит в сокращении числа двоичных единиц на отсчет сигнала.

Особенности речевого сигнала во временной и частотной области

Характер первичного РС зависит от интенсивности потока воздуха и состава возбуждаемых колебаний. В большинстве случаев спектр РС занимает область частот 0,15 ... 7 кГц. Колебания голосовых связок в первом приближении можно считать периодическими колебаниями сложной формы, образующими кроме низшей частоты – частоты основного тона – гармоники. Их число в некоторых случаях превышает 40. На линейчатый спектр колебаний голосовых связок накладывается передаточная функция речеобразующего тракта.

Форма передаточной функции определяется конфигурацией и объемами полостей гортани, рта, носа, положением нижней челюсти, языка, зубов, губ. На нижних частотах линейные размеры полостей много меньше длины волны возбуждаемых колебаний. Поэтому полости представляют собой колебательные системы с сосредоточенными параметрами. В области килогерц линейные размеры полостей и длины волн возбуждаемых колебаний становятся соизмеримыми. Тогда полости следует рассматривать как колебательные системы с распределенными параметрами. В общем случае значения резонансных частот зависит от положения названных выше частей речеобразующего тракта. Гармоники, возбужденные колебаниями голосовых связок и попадающие в области резонансных частот, усиливаются, другие гармоники ослабляются.

Области максимумов спектра называют речевыми формантами. Некоторые исследователи называют формантами только те спектральные максимумы, которые определяют конкретные звуки речи, т. к. для некоторых голосов огибающая спектра в пределах второй формантной области не имеет формы «одногорбой» кривой. Форманты – это участки частотного диапазона около спектральных максимумов, определяющие восприятие и распознавание конкретных звуков речи.

Центральная частота формантной области и резонансная частота полости речеобразующего тракта не являются синонимами.

Гласные звуки возбуждаются почти периодическими колебаниями голосовых связок. В образовании согласных звуков главная роль принадлежит потоку воздуха с шумовым спектром. Голосовые связки в этом процессе почти не участвуют, и характер звука определяется положением и движениями нижней челюсти, языка, зубов и губ.

Звучание различных гласных определяется различным распределением формантных областей. Определяющую роль играет соотношение центральных частот первой и второй формантных областей.

Важная характеристика звуков речи – частота основного тона. Она определяется частотой следования импульсов воздуха, создаваемых голосовыми связками. Частоты основного тона у большинства людей лежат в пределах от 70 до 450 Гц. Если голосовые связки тонки или сильно напряжены, частота основного тона высока, если связки толсты или менее напряжены, частота основного тона ниже.

У мужчин среднее значение частоты основного тона составляет 120 Гц, а у женщин – 220 Гц.

Медленное изменение частоты основного тона при произнесении речи создает эмоциональную окраску и называется интонацией. У каждого человека свои диапазон изменения основного тона (как правило, немного более октавы) и своя интонация, имеющая большое значение для узнаваемости говорящего.

Область частот основного тона индивидуальна. Изменения этой частоты лишь немного превышают диапазон одной октавы. При произношении звуков речи частота основного тона изменяется в зависимости от ударения и акцентирования звуков и слов. Изменения частоты основного тона называют интонацией. По изменению частоты основного тона можно до некоторой степени судить об эмоциональном состоянии человека.

Основной тон, интонация, манера произношения и тембр являются «устным почерком» говорящего и служат для опознания личности человека (аутентификация). Степень достоверности опознания по голосу выше, чем по отпечаткам пальцев.

Фонема – типизированная, образцовая форма звуков речи. Понятие «форманта» относится к спектральному составу звуков речи. При переходе к семантическому (смысловому) рассмотрению звуков речи употребляют термин «фонема». Фонема – это то, что человек намеревается произнести, а звук речи – это то, что он фактически произносит. Фонему сравнивают с образцово, каллиграфически написанными буквами (графемами) в отличие от множества форм рукописного изображения букв.

Речь состоит из звуков, слогов, слов, фраз и т. д. За первичное смысловое понятие в языке принимают слово. Но наименьшим элементом речи считается звук.

Произношение звуков зависит от их положения в слове, ударения, интонации. Сложные звуки (слоги, слова) в фонетическом отношении не являются простыми цепочками, последовательностями фонем, т. к. фонема в одном сочетании имеет одну форму, в другом – иную. Исследователи насчитывают несколько тысяч звуков речи, отличающихся друг от друга. Поэтому процесс распознавания фонем имеет статистический характер. Несмотря на это разнообразие, все же была проведена классификация и типизация звуков речи, приведшая к возникновению понятия «фонема». Звуки в изолированном виде употребляются редко, хотя и в этом случае звуки принимают за слово (возгласы, междометия, союзы вида "а!", "о!", "и", "у"). В словах, являющихся наименьшими смысловыми единицами, звуки соединены между собою в слоги. Но слоги, как и звуки, обычно самостоятельно не существуют. Границы между слогами так же трудно определить, как и между звуками речи. Границы между словами различаются более ясно, хотя ряд слов при беглом произношении сливаются в одно целое. Эти обстоятельства затрудняют построение устройств автоматического анализа и синтеза речи.

В русском языке насчитывают 41 основную и 3 неясно звучащие фонемы: 6 гласных (а, о, у, э, и, ы), одну полугласную (й) и 34 согласных. Гласные звуки я, ю, ё, е соответствуют составным фонемам йа, йу, йо, йэ. Согласных фонем больше, чем согласных букв, т. к. ряд согласных букв соответствуют двум фонемам: мягкой и твердой. Только твердых фонем – три (ш, ж, ц), только мягких – две (ч, щ). Остальные 15 существуют в двух формах: мягкой и твердой.

Между буквами и фонемами одного и того же языка нет однозначной связи (буквы – это то, что мы читаем, фонемы – то, что мы хотим произнести), поэтому число фонем и число букв неодинаково во всех языках.

По характеру звучания звуки речи подразделяют на звонкие и глухие. Первые образуются с участием голосовых связок. Находясь под напряжением, они под действием воздушного потока, идущего из легких, периодически раздвигаются. В результате создается прерывистый, импульсный поток воздуха. Импульсы следуют примерно с постоянной частотой. При произнесении глухих звуков голосовые связки расслаблены, не вибрируют, и поток воздуха свободно проходит в полость рта и здесь, встречая на своем пути преграды – язык, зубы, губы – образует завихрения, создающие шум со сплошным спектром.

По способу образования согласные подразделяют на сонорные, щелевые, взрывные и аффрикаты. Сонорные (л, л’, р, р’, м, м’, н, н’) по звучанию похожи на гласные, но отдельно не произносятся и поэтому относятся к согласным. Щелевые (в, в’, з, з’, ж, ф, ф’, с, с’, ш, х, х’) образуются в результате проталкивания потока воздуха в виде импульсов или шума через узкие щели, образованные языком и нёбом, губами, зубами, гортанью. Взрывные (п, п’, т, т’, к, к’, б, б’, д, д’, г, г’) возникают в результате резкого открытия закрытого до этого рта. Аффрикаты являются комбинацией глухих, взрывных и щелевых.

При произнесении звуков речи части речеобразующего тракта находятся для каждой фонемы в строго определенном положении или движении. Эти движения называют артикуляцией.

Звонкие звуки речи, особенно гласные, имеют большой уровень интенсивности звука, глухие – низкий. Уровень интенсивности особенно быстро меняется при произнесении взрывных звуков. Динамический диапазон звуков речи составляет – 35...45 дБ. Длительность гласных звуков речи составляет 0,15... 0,3 с, согласных – в среднем 0,08 с. Звук "п" длится примерно 30 мс. Большая протяженность гласных звуков вызвана необходимостью перестройки органов артикуляции

Звуки речи имеют различную информативную ценность. Гласные звуки менее информативны, чем согласные, и это используется при сокращении слов. Разборчивость речи снижается, главным образом, из-за маскировки шумами глухих звуков, имеющих меньшую интенсивность.

Перечисленные свойства звуков речи учитывают при проектировании и разработке устройств передачи, анализа и синтеза речи. Так, для передачи смысла речи достаточно передавать сведения об огибающей спектра речи, переходах тон – шум, а также об изменениях основного тона. Для передачи эмоций необходим больший объем информации.