- •2.1. Бір оқиғаның ақпараты
- •2.1 Сурет. Қарапайым х алфавитінің ақпарат дереккөзі.
- •2.2 Сурет. I(p) символының ақпараты р пайда болу ықтималдығымен.
- •3.1. Дереккөздерді кодтау теоремасы I
- •3.1 Сурет. Кодты дарақ.
- •3.1.1 Теорема. Дереккөздерді кодтау теоремасы I.
- •4.1. Өзара және шартты ақпарат
- •4.1 Сурет. Екі байланысты дереккөздің моделі.
- •4.2. Бірлескен және шартты энтропия
- •4.2 Сурет. Екі байланысқан дискретті дереккөз.
- •4.3. Қорытындылар
- •4.3 Кесте. Символды жадсыз х және y дискретті дереккөздері.
- •5.1. Энтропия
- •5.1 Сурет. Үздіксіз сигнал.
- •5.2. Дереккөздерді кодтау теоремасы 2
- •5.3. Марковтың шекті тізбектері
- •5.3.2. Шекті дискретті марковтық r жадты дереккөздер
- •5.6 Сурет. Марковтың тізбегі кейіпіндегі дереккөз (бірінші қадам).
- •5.4. Стационарлы марковтық дереккөздің энтропиясы
- •5.5. Стационарлы марковтық дереккөздерді кодтау
- •5.6. Қорытындылар
- •5.3 Кесте. Марковтық тізбектер.
- •5.4 Кесте. Марковтық тізбектер. (жалғасы)
- •5.5 Кесте. Стационарлы Марковтық дереккөздер.
- •6.1 Сурет. Неміс әдеби тілінің блок ұзындығының функциясы
- •6.2. Арифметикалық кодтау
- •6.1 Кесте. Әріптер және олардың шамаланған жиіліктері.
- •6.2 Сурет. Арифметикалық кодтау.
- •6.2 Кесте. Арифметикалық кодтаудың алгоритмі.
- •6.3. Лемпель - Зив кодтауы.
- •Каналдар және ақпарат
- •7.2. Екілік симметриялы канал
- •7.2 Сурет. Екілік симметрилы канал арқылы мағлұмат тасымалдау диаграммасы.
- •7.3 Сурет. Шартты I(y1 / x1) және өзара I(y1 ; x1) мағлұматтары
- •7.3. Ақпарат тасымалдау
- •7.4 Сурет. Каналмен байланысқан екі жадсыз дискретті дереккөз.
- •7.5 Сурет. Ақпараттық тасқын диаграммасы
- •7.4. Қорытынды
- •7.5. Каналдың өткізгіштік қабілеті
- •7.5.2. Ақаулы екілік симметриялы каналдың
- •7.12 Сурет. Ақаулы екілік симметриялы канал.
- •7.13 Сурет. Ɛ қате ықтималдықты екілік симметриялы каналдың сеск
- •7.6. Жадсыз дискретті каналдар үшін кодтау
- •8.1 Сурет. Үздіксіз дереккөздің сигналы.
- •8.1. Дифференциалды энтропия
- •8.2 Сурет. Канал арқылы байланысқан екі жадсыз
- •8.3 Сурет. Δ кванттау интервалды үздіксіз дереккөзді бақылау сәтінде цифрлеу
- •8.2. Каналдың өткізгіштік қабілеті және Шеннон шегі
- •8.4 Сурет. Тілкемде шектелген аагш-лы каналдың үлгісі.
- •8.5 Сурет. Сигнал/шу қатынас функциясы ретіндегі өткізгіштік
- •8.7 Сурет. Шектелген тілкемдегі ақ гаусстық шудың спектрі.
- •8.8 Сурет. Ақпарат тасымалдау уақытындағы өткізшіш тілкем
6.1 Сурет. Неміс әдеби тілінің блок ұзындығының функциясы
ретіндегі энтропиясы.
Мағлұматтарды қысу алгоритмін үш бөлікке бөлуге болады:
1. Статикалық алгоритмдер, мысалы, Хаффман кодтауы. Неміс әдеби мәтінін Хаффман әдісімен қысу ASCII стандартты ерікті символдарынан тұратын ақпаратты қысумен салыстырғанда, шамамен 50% ұтысқа жетуге мүмкіндік береді.
2. Адаптивті алгоритмдер, мысалы, түрлендірілген Хаффман кодтауы. Мұнда символдардың бөліну ықтималдықтары бастапқыда бірқалыпты болады, ал кейін статистиканың жинақталуына байланысты уақытта өзгереді.
3. Динамикалық алгоритмдер, мысалы ITU V42. bis ұсынысында қолданылатын кодтау.
Энтропиялық кодтаудың негізгі мәселесі символдар ықтималдық-тарының бөлінуін білуді болжау болып табылады. Көп жағдайда символдар статистикасы алдын-ала беймағлұм және эффективті кодтаудан алдын жиілік талдауы болуы қажет. Бұл жерде бізге көмекке универсалды алгоритмдер келеді.
● Адаптивті болып табылатын универсалды қысу алгоритмдері априоролық статистиканы қажет етпейді. Мұндай эффективті кодтау кодер кірісіне ақпарат келуімен дереу басталады.
● Мұнан басқа, дерліктей жеңіл техникалық күрделікті «жылдам» алгоритмдер бар.
● Шамаланған алгоритмдердің әрбірі қысудың жоғары дәрежесіне жетуге көмектеседі.
Қысу әдістерінің мысалы ретінде, екі маңызды алгоритмді қарап шығайық: жүйе барысында динамыкалық жиілік талдау жүретін арифметикалық кодтау және Лемпель-Зивтің универсалды алгоритмі. Лемпель-Зивтің LZ77 алгоритмі 1977 жылы ұсынылған болатын және 1984 жылы түрлендірді. Ол ITU V.42.bis ұсынысында қолданылады және LZW алгоритмі деп аталады.
6.2. Арифметикалық кодтау
Арифметикалық кодтауда нормалданған бөлінуде дереккөз символдарының (және оларға сәйкес шамаланған жиіліктерінің) ықтималдықтарының сомасы әрдайым бірге тең деген факттан бастаймыз. Егер символдардың шамаланған жиіліктері тасымалдағышқа және қабылдағышқа белгісіз болса:
6.1 Кесте. Әріптер және олардың шамаланған жиіліктері.
- олар мән берілген уақытта тасымалданып жатқан ақпараттың статистикалық өзгерістері арқылы анықтала алады;
- қабылдағыш және тасымалдағыш шамаланған жиіліктерден біргелесіп кодтаудың қатаң қағидаларын орнатады.
Арифметикалық кодтаудың ерекшелігі [0, 1] интервалындағы натурал сандар ағынындағы символдар реттілігін көрсету үшін шамаланған жиіліктер қолданылатыны болып табылады.
Мұндай көрсетудің нәтижесі болып символдарды олардың ықтимал-дықтарына сәйкес қысу болып табылады. Арифметикалық кодтау идеясын келесі мысал арқылы айқындаймыз.
«GELEEESSER» реттілі әріптерінің арифметикалық кодтауын қарастырамыз. Бұл ағындағы әріптердің шамаланған жиіліктері 6.1 кестеде көрсетілген.
Кодтау процедурасы 6.2 суретте көрсетілген.
Бірінші «G» әріпіне, оның шамаланған жиілігіне сәйкес, [0.7, 0.8] интервалы дәл келеді. Алгоритмге сәйкес, G-дан басталатын әрбір әріптер тізбегі осы интервалға меншікті сан түрінде көрсетілетін болады. Осылайша, қарастырылып отырған мысалда үтірден кейінгі бірінші ондық сан анықталды.
Келесі әріптерді кодтау енді алдыңғы қадамда таңдалған интервал бөлінуге кезігетін ерекшелікпен жүзеге асатын болады. 6.2 сурет бойынша, екінші қадамда «Е» әріпіне [0.7, 0.75] интервалы сәйкес келеді.
Кодтау алгоритмі қадам бойынша жүрген 6.3 кестеде «GELEEESSER» реттілігі 740387 саны түрінде көрсетіледі. Ескере өтетін жайттар:
1. Жиі кездесетін әріптерге сәйкестікке үлкен интервалдар қойылады. Оларды көрсетуге сирек кездесетін әріптерге қарағанда азырақ ондық сан жұмалады.
2. Ұзын хабарламалар «ұзын» сандар түрінде көрсетіледі. Бұл сандарды хабарламалар тасымалына қажетті екілік формада көрсету үлкен ұзындықты кодты сөздердің пайда болуына алып келеді.
Арифметикалық кодтаудың алогритмін практикалық түрде орындау кодты сөздердің ұзындығымен шектелетін үлкен дәлдікті қажет етеді. Регистрдің керекті ұзындығын қысқарту үшін арифметикалық кодтауды орындағанда дайын аралықты нәтижелерді беретін толық санды арифметика қолданылады.
