Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный университет Львовская политехника

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

OPTCODn.doc

Скачиваний:

Добавлен:

12.02.2016

Размер:

162.3 Кб

Скачать

☆

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

2.4. Оптимальне (ефективне) кодування.

Ентропія джерела повідомлень визначається формулою

де: - ймовірність появи x_i з N символів алфавіту джерела. N – об’єм алфавіту джерела.

Теорема Шенона для каналу без завад: в каналі зв’язку без завад можна так перетворити послідовність символів джерела, що середня довжина символів коду буде як завгодно близька до ентропії джерела повідомлень.

Ентропія H(x) виступає кількісною мірою різноманітності повідомлень джерела і є його основною характеристикою. Ентропія джерела максимальна, якщо ймовірності повідомлень є рівними. Якщо одне повідомлення достовірне, а інші неможливі, то H(x)=0. Одиниця виміру ентропії – 1 біт. Це та невизначеність, коли джерело має однакову ймовірність двох можливих повідомлень (0 або 1).

Ентропія H(x) визначає середню кількість двійкових знаків, необхідних для кодування початкових символів джерела. Наприклад, для російських букв n=32=2⁵. Якщо вони подаються рівномірно і незалежні між собою, то H(x)<5. Для російського літературного тексту H(x)=1.5 біт, для віршів H(x)=1 біт, а для телеграм H(x)=0.8 біт. Це означає, що при певному способі кодування на передачу букви може бути затрачено відповідно 1.5, 1, 0.8 двійкових символів.

Якщо символи нерівноімовірні і залежні, то ентропія буде менша від свого максимального значення Нmax(x)=log₂N. При цьому можливе деяке більш економне (ефективне) кодування, при якому на кожен символ буде в середньому затрачено n*=H(x) символів коду. Коефіцієнт надлишковості визначається такою формулою

К_надл=1-H(x)/Hmax(x)

Для характеристики досягнутого стиснення використовують коефіцієнт стиснення

К_стисн=L_почат/L_стисн

Можна показати, що К_надл>К_стисн.

Різні методи оптимального кодування базуються на зменшенні надлишковості викликаної неоднаковою апріорною ймовірностю символів або залежністю між порядком надходження символів.

В першому випадку для кодування використовується нерівномірний код - більш ймовірні символи мають коротший код, а менш ймовірні – довший.

В другому випадку переходять від кодування окремих символів до кодування їх груп. При цьому здійснюється укрупнення алфавіту джерела, через те N зростає. Загальна надлишковість укрупненого алфавіту при цьому не міняється. Однак, зменшення надлишковості обумовлене зменшенням різниці ймовірностей різних груп символів. Таким чином, процес кодування зводиться до двох операцій: укрупнення алфавіту і кодування оптимальним нерівномірним кодом.

Стиснення буває із втратами і без втрат. Втрати допустимі при стисненні аудіо-та відеоінформації (наприклад, MPEG - 20 до 1; MPEG3 - 100 до 1; TIFF - 10до 1 при 10% втрат, 100 до 1 при 20% втрат і т.д.).

2.5. Метод Шеннона-Фано

В цьому методі для кожного символа формується бітовий код, довжина якого залежить від частоти появи символа. Чим менша частота, тим довший код. Визначення частоти (ймовірності) символа буває статичне (на основі таблиці даних) або динамічне (коли відомості про ймовірність появи символів визначаються на основі обробки потоку даних).

Кодування здійснюється таким чином (рис. 1):

Всі символи записуються в таблицю по зменшенню їх частоти. Потім вони поділяються на дві групи так, щоб суми частот для отриманих груп були максимально близькі. Для першої групи перший біт коду встановлюється рівним 1, а для другої – 0. Потім групи знову поділяємо на дві і визначаємо наступні розряди коду. Процес продовжується поки в групі не залишиться тільки один символ.

Номер Символ Частота Код

1 a 10 11

2 b 8 10

-----------------------------‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑‑----------------------------

3 c 6 011

4 d 5 010

5 e 4 001

6 f 3 000

Рис. 1.

Можливий варіант програмної реалізації методу базується на формуванні і обробці такої таблиці

Nгр	Np	Nk	S	Код
1	1	2	18	1
1	3	6	18	0
2	1	1	10	11
2	2	2	8	10
3	3	4	11	01
3	5	6	7	00
4	3	3	6	011
4	4	4	5	010
5	5	5	4	001
5	6	6	3	000

Ця таблиця забезпечує зручний запис алгоритму поділу на підгрупи і формування кодів. Перша група (Nгр=1) складається з двох підгруп: перша - починається з першого символа (Np=1) і закінчується другим (Nк=2), друга – починається з третього символа (Nр=3) і закінчується шостим (Nк=6). Сума частот першої підгрупи S=18, другої S=18. Друга група (Nгр=2) формується в результаті поділу першої підгрупи з першої групи і складається теж з двох підгруп: перша – починається з першого символа (Nр=1) і ним закінчується (Nк=1), друга – починається другим символом (Nр=2) і ним закінчується (Nк=2). Третя група описує процес поділу другої підгрупи з першої групи. Процуес продовжується до тих пір поки кожна підгрупа не буде складатися тільки з одного символа (Nр=Nк). Відповідний новий біт коду кожної групи визначається таким чином: для першої підгрупи він встановлюється рівним одиниці, а для другої підгрупи – нулю.

Нижче приведений можливий варіант демонстраційної програми і результати її роботи

implicit integer*2(j),character*1(z)

dimension jmp(12),jmk(12),jms(12),jml(12),zmk(12,5),zm(6),jmc(6)

data zm/'a','b','c','d','e','f'/,jmc/10,8,6,5,4,3/

js=0

do 100 j=1,12

100 jml(j)=0

do 1 j=1,6

1 js=js+jmc(j)

jp=1

jk=6

ju=0

jz=1

12 jdr=32000

jmp(jz)=jp

jmk(jz+1)=jk

js1=0

jv=jp

jvr=jv

9 js1=js1+jmc(jv)

js2=js-js1

jd=js2-js1

if(abs(jd).ge.jdr) go to 11

jdr=jd

jms(jz)=js1

jms(jz+1)=js2

jvr=jv

if(jd.le.0) go to 11

jv=jv+1

go to 9

11 jmk(jz)=jvr

jmp(jz+1)=jvr+1

if(ju.eq.0) go to 50

jml(jz)=jml(ju)

jml(jz+1)=jml(ju)

do 20 j=1,jml(ju)

zmk(jz,j)=zmk(ju,j)

20 zmk(jz+1,j)=zmk(ju,j)

50 jml(jz)=jml(jz)+1

zmk(jz,jml(jz))='1'

jml(jz+1)=jml(jz+1)+1

zmk(jz+1,jml(jz+1))='0'

jz=jz+2

15 ju=ju+1

if(ju.ge.jz) go to 17

jp=jmp(ju)

jk=jmk(ju)

js=jms(ju)

if(jp.eq.jk) go to 15

if(jp+1.lt.jk) go to 12

jmp(jz)=jp

jms(jz)=jmc(jp)

jmk(jz+1)=jk

jms(jz+1)=jmc(jk)

jvr=jp

go to 11

17 do 30 j=1,10

30 write(6,31) jmp(j),jmk(j),jms(j),jml(j),(zmk(j,jj),jj=1,5)

31 format(' ',4i4,1x,5a1)

stop

end

1 2 18 1 1

3 6 18 1 0

1 1 10 2 11

2 2 8 2 10

3 4 11 2 01

5 6 7 2 00

3 3 6 3 011

4 4 5 3 010

5 5 4 3 001

6 6 3 3 000

Кодування Шеннона-Фано неоднозначне. В залежності від варіанту поділу на групи (при однаковій різниці частот між ними) можуть бути отримані різні коди для символів (рис. 2).

Символ Частота Код Символ Частота Код

с 22 11 с 22 11

e 20 101 e 20 10

h 16 100 --------------------------------------------

----------------------------------------------- h 16 011

i 16 011 і 16 010

a 10 010 a 10 001

k 10 001 k 10 0001

m 4 0001 m 4 00001

b 2 0000 b 2 00000

Рис. 2.

<<< < Предыдущая 12 / 42 3 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.08.2019286.28 Кб4open-offis-calk_super_lab.docx
#
03.11.20181.88 Mб35oporn-konsp-pip.doc
#
01.05.2025107.1 Кб0Oporny_konspekt_z_TsZ.docx
#
01.07.2025144.9 Кб0OPOR_KONSPEKT_KIT.doc
#
31.08.2019702.46 Кб9Opracjuvannja_emp.dosl_Dlja_sociologiv.doc
#
12.02.2016162.3 Кб8OPTCODn.doc
#
01.07.2025306.16 Кб1OP_-_Vidpovidi.docx
#
21.12.2018396.8 Кб2OP_lektsiyi.doc
#
01.03.2025735.23 Кб0OP_metodychka_RGR.doc
#
01.07.202554.73 Кб0OP_Testi.docx
#
01.04.2025521.63 Кб0OP_vidpovidi.docx