Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
262876.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
5.39 Mб
Скачать

6.1 Сурет. Неміс әдеби тілінің блок ұзындығының функциясы

ретіндегі энтропиясы.

Мағлұматтарды қысу алгоритмін үш бөлікке бөлуге болады:

1. Статикалық алгоритмдер, мысалы, Хаффман кодтауы. Неміс әдеби мәтінін Хаффман әдісімен қысу ASCII стандартты ерікті символдарынан тұратын ақпаратты қысумен салыстырғанда, шамамен 50% ұтысқа жетуге мүмкіндік береді.

2. Адаптивті алгоритмдер, мысалы, түрлендірілген Хаффман кодтауы. Мұнда символдардың бөліну ықтималдықтары бастапқыда бірқалыпты болады, ал кейін статистиканың жинақталуына байланысты уақытта өзгереді.

3. Динамикалық алгоритмдер, мысалы ITU V42. bis ұсынысында қолданылатын кодтау.

Энтропиялық кодтаудың негізгі мәселесі символдар ықтималдық-тарының бөлінуін білуді болжау болып табылады. Көп жағдайда символдар статистикасы алдын-ала беймағлұм және эффективті кодтаудан алдын жиілік талдауы болуы қажет. Бұл жерде бізге көмекке универсалды алгоритмдер келеді.

● Адаптивті болып табылатын универсалды қысу алгоритмдері априоролық статистиканы қажет етпейді. Мұндай эффективті кодтау кодер кірісіне ақпарат келуімен дереу басталады.

● Мұнан басқа, дерліктей жеңіл техникалық күрделікті «жылдам» алгоритмдер бар.

● Шамаланған алгоритмдердің әрбірі қысудың жоғары дәрежесіне жетуге көмектеседі.

Қысу әдістерінің мысалы ретінде, екі маңызды алгоритмді қарап шығайық: жүйе барысында динамыкалық жиілік талдау жүретін арифметикалық кодтау және Лемпель-Зивтің универсалды алгоритмі. Лемпель-Зивтің LZ77 алгоритмі 1977 жылы ұсынылған болатын және 1984 жылы түрлендірді. Ол ITU V.42.bis ұсынысында қолданылады және LZW алгоритмі деп аталады.

6.2. Арифметикалық кодтау

Арифметикалық кодтауда нормалданған бөлінуде дереккөз символдарының (және оларға сәйкес шамаланған жиіліктерінің) ықтималдықтарының сомасы әрдайым бірге тең деген факттан бастаймыз. Егер символдардың шамаланған жиіліктері тасымалдағышқа және қабылдағышқа белгісіз болса:

6.1 Кесте. Әріптер және олардың шамаланған жиіліктері.

- олар мән берілген уақытта тасымалданып жатқан ақпараттың статистикалық өзгерістері арқылы анықтала алады;

- қабылдағыш және тасымалдағыш шамаланған жиіліктерден біргелесіп кодтаудың қатаң қағидаларын орнатады.

Арифметикалық кодтаудың ерекшелігі [0, 1] интервалындағы натурал сандар ағынындағы символдар реттілігін көрсету үшін шамаланған жиіліктер қолданылатыны болып табылады.

Мұндай көрсетудің нәтижесі болып символдарды олардың ықтимал-дықтарына сәйкес қысу болып табылады. Арифметикалық кодтау идеясын келесі мысал арқылы айқындаймыз.

«GELEEESSER» реттілі әріптерінің арифметикалық кодтауын қарастырамыз. Бұл ағындағы әріптердің шамаланған жиіліктері 6.1 кестеде көрсетілген.

Кодтау процедурасы 6.2 суретте көрсетілген.

Бірінші «G» әріпіне, оның шамаланған жиілігіне сәйкес, [0.7, 0.8] интервалы дәл келеді. Алгоритмге сәйкес, G-дан басталатын әрбір әріптер тізбегі осы интервалға меншікті сан түрінде көрсетілетін болады. Осылайша, қарастырылып отырған мысалда үтірден кейінгі бірінші ондық сан анықталды.

Келесі әріптерді кодтау енді алдыңғы қадамда таңдалған интервал бөлінуге кезігетін ерекшелікпен жүзеге асатын болады. 6.2 сурет бойынша, екінші қадамда «Е» әріпіне [0.7, 0.75] интервалы сәйкес келеді.

Кодтау алгоритмі қадам бойынша жүрген 6.3 кестеде «GELEEESSER» реттілігі 740387 саны түрінде көрсетіледі. Ескере өтетін жайттар:

1. Жиі кездесетін әріптерге сәйкестікке үлкен интервалдар қойылады. Оларды көрсетуге сирек кездесетін әріптерге қарағанда азырақ ондық сан жұмалады.

2. Ұзын хабарламалар «ұзын» сандар түрінде көрсетіледі. Бұл сандарды хабарламалар тасымалына қажетті екілік формада көрсету үлкен ұзындықты кодты сөздердің пайда болуына алып келеді.

Арифметикалық кодтаудың алогритмін практикалық түрде орындау кодты сөздердің ұзындығымен шектелетін үлкен дәлдікті қажет етеді. Регистрдің керекті ұзындығын қысқарту үшін арифметикалық кодтауды орындағанда дайын аралықты нәтижелерді беретін толық санды арифметика қолданылады.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]