mishev / Копия В.В. Лидовский - Теория Информации
.pdfI uPRAVNENIE 14
d.S.W. X RAWNA KOLI^ESTWU \GERBOW", WYPAW[IH NA DWUH IDEALXNYH MONETKAH. nAJTI \NTROPI@ X. pRIDUMATX MINIMALXNYJ KOD DLQ X, WY- ^ISLITX EGO SREDN@@ DLINU I OBOSNOWATX EGO MINIMALXNOSTX.
I uPRAVNENIE 15
d.S.W. X ZADANA RASPREDELENIEM P (X = 2n) = 1=2n, n = 1; 2; : : : nAJTI \NTROPI@ \TOJ D.S.W. pRIDUMATX MINIMALXNYJ KOD DLQ X, WY^ISLITX EGO SREDN@@ DLINU I OBOSNOWATX EGO MINIMALXNOSTX.
I uPRAVNENIE 16
pRO D.S.W. X IZWESTNO, ^TO EE ZNA^ENIQMI QWLQ@TSQ BUKWY KIRILLICY. pROIZWEDEN RQD POSLEDOWATELXNYH IZMERENIJ X, REZULXTAT KOTORYH | \teoriqinformacii". sOSTAWITX NA OSNOWANII \TOGO REZULXTATA PRIBLIZITELXNYJ ZAKON RASPREDELENIQ WEROQTNOSTEJ \TOJ D. S. W. I OCENITX MINIMALXNU@ SREDN@@ DLINU KODOW DLQ X.
9. sEMANTI^ESKAQ INFORMACIQ
w 50-H GODAH XX WEKA POQWILISX PERWYE POPYTKI OPREDELENIQ ABSOL@TNOGO INFORMACIONNOGO SODERVANIQ PREDLOVENIJ ESTESTWENNOGO QZYKA. sTOIT OTMETITX, ^TO SAM {ENNON ODNAVDY ZAMETIL, ^TO SMYSL SOOB]ENIJ NE IMEET NIKAKOGO OTNO[ENIQ K EGO TEORII INFORMACII, CELIKOM POSTROENNOJ NA POLOVENIQH TEORII WEROQTNOSTEJ. nO EGO SPOSOB TO^NOGO IZMERENIQ INFORMACII NAWODIL NA MYSLX O WOZMOVNOSTI SU]E- STWOWANIQ SPOSOBOW TO^NOGO IZMERENIQ INFORMACII BOLEE OB]EGO WIDA, NAPRIMER, INFORMACII IZ PREDLOVENIJ ESTESTWENNOGO QZYKA. pRIMEROM ODNOJ IZ TAKIH MER QWLQETSQ FUNKCIQ inf(s) = log2 p(s), GDE s | \TO PREDLOVENIE, SMYSLOWOE SODERVANIE KOTOROGO IZMERQETSQ, p(s) | WEROQTNOSTX ISTINNOSTI s. wOT NEKOTORYE SWOJSTWA \TOJ FUNKCIIMERY:
1)ESLI s1 ) s2 (IZ s1 SLEDUET s2) | ISTINNO, TO inf(s1) > inf(s2);
2)inf(s) > 0;
3)ESLI s | ISTINNO, TO inf(s) = 0;
4) inf(s1s2) = inf(s1) + inf(s2) , p(s1 s2) = p(s1)p(s2), T. E.
NEZAWISIMOSTI s1 I s2.
zNA^ENIE \TOJ FUNKCIQ-MERY BOLX[E DLQ PREDLOVENIJ, ISKL@^A- @]IH BOLX[EE KOLI^ESTWO WOZMOVNOSTEJ. pRIMER: IZ s1 | \a > 3" I s2 | \a = 7" SLEDUET, ^TO s2 ) s1 ILI inf(s2) > inf(s1); QSNO, ^TO s2 ISKL@^AET BOLX[E WOZMOVNOSTEJ, ^EM s1.
dLQ IZMERENIQ SEMANTI^ESKOJ INFORMACII TAKVE ISPOLXZUETSQ FUNKCIQ-MERA cont(s) = 1 p(s). qSNO, ^TO cont(s) = 1 2 inf(s) ILI inf(s) = log2(1 cont(s)).
20
I uPRAVNENIE 17
wY^ISLITX inf(s) I cont(s) PREDLOVENIQ s1, PRO KOTOROE IZWESTNO, ^TO ONO DOSTOWERNO NA 50%, I PREDLOVENIQ s2, DOSTOWERNOSTX KOTOROGO 25%.
10. sVATIE INFORMACII
cELX SVATIQ | UMENX[ENIE KOLI^ESTWA BIT, NEOBHODIMYH DLQ HRANENIQ ILI PEREDA^I ZADANNOJ INFORMACII, ^TO DAET WOZMOVNOSTX PEREDAWATX SOOB]ENIQ BOLEE BYSTRO I HRANITX BOLEE \KONOMNO I OPERATIWNO (POSLEDNEE OZNA^AET, ^TO OPERACIQ IZWLE^ENIQ DANNOJ INFORMACII S USTROJSTWA EE HRANENIQ BUDET PROHODITX BYSTREE, ^TO WOZMOVNO, ESLI SKOROSTX RASPAKOWKI DANNYH WY[E SKOROSTI S^ITYWANIQ DANNYH S NOSITELQ INFORMACII). sVATIE POZWOLQET, NAPRIMER, ZAPISATX BOLX[E INFORMACII NA DISKETU, \UWELI^ITX" RAZMER VESTKOGO DISKA, USKORITX RABOTU S MODEMOM I T.D. pRI RABOTE S KOMPX@TERAMI [IROKO ISPOLXZU- @TSQ PROGRAMMY-ARHIWATORY DANNYH FORMATA ZIP, GZ, ARJ I DRUGIH. mETODY SVATIQ INFORMACII BYLI RAZRABOTANY KAK MATEMATI^ESKAQ TEORIQ, KOTORAQ DOLGOE WREMQ (DO PERWOJ POLOWINY 80-H GODOW), MALO ISPOLXZOWALASX W KOMPX@TERAH NA PRAKTIKE.
sVATIE DANNYH NE MOVET BYTX BOLX[IM NEKOTOROGO TEORETI^ESKIE PREDELA. dLQ FORMALXNOGO OPREDELENIQ \TOGO PREDELA RASSMATRIWAEM L@BOE INFORMACIONNOE SOOB]ENIE DLINY n KAK POSLEDOWATELXNOSTX NEZAWISIMYH, ODINAKOWO RASPREDELENNYH D.S.W. Xi ILI KAK WYBORKI DLINY n ZNA^ENIJ ODNOJ D.S.W. X.
dOKAZANO [20], ^TO SREDNEE KOLI^ESTWO BIT, PRIHODQ]IHSQ NA ODNO KODIRUEMOE ZNA^ENIE D. S. W., NE MOVET BYTX MENX[IM, ^EM \NTROPIQ \TOJ D.S.W., T.E. ML(X) > HX DLQ L@BOJ D.S.W. X I L@BOGO EE KODA.
kROME TOGO, DOKAZANO [20] UTWERVDENIE O TOM, ^TO SU]ESTWUET TAKOE KODIROWANIE ({ENNONA-f\NO, Fano), ^TO HX > ML(X) 1.
rASSMOTRIM D.S.W. X1 I X2, NEZAWISIMYE I ODINAKOWO RASPREDELENNYE. HX1 = HX2 I I(X1; X2) = 0, SLEDOWATELXNO,
H(X1; X2) = HX1 + HX2 I(X1; X2) = 2HX1:
wMESTO X1 I X2 |
|
|
|
|
~ |
MOVNO GOWORITX O DWUMERNOJ D. S. W. X = (X1; X2). |
|||||
|
|
|
~ |
; X2; : : : ; Xn) MOVNO |
|
aNALOGI^NYM OBRAZOM DLQ n-MERNOJ D.S.W. X = (X1 |
|||||
|
~ |
|
|
|
|
POLU^ITX, ^TO HX = nHX1. |
~ |
|
|
~ |
|
~ |
~ |
|
|
||
pUSTX L1(X) = L(X)=n, GDE X = (X1; X2; : : : ; Xn), T.E. L1(X) | \TO |
|||||
|
|
|
~ |
|
~ |
KOLI^ESTWO BIT KODA NA EDINICU SOOB]ENIQ X. tOGDA ML1(X) | \TO |
|||||
SREDNEE KOLI^ESTWO BIT KODA NA EDINICU SOOB]ENIQ PRI PEREDA^E BESKO- |
|||||
|
|
~ |
~ |
~ |
~ |
NE^NOGO MNOVESTWA SOOB]ENIJ X. |
iZ ML(X) 1 6 HX 6 ML(X) DLQ |
||||
|
~ |
|
~ |
|
~ |
KODA {ENNONA-f\NO DLQ X SLEDUET ML1(X) 1=n |
6 HX1 6 ML1(X) |
DLQ \TOGO VE KODA.
21
tAKIM OBRAZOM, DOKAZANA OSNOWNAQ TEOREMA O KODIROWANII PRI OT-
SUTSTWII POMEH, A IMENNO TO, ^TO S ROSTOM DLINY n SOOB]ENIQ, PRI KODIROWANII METODOM {ENNONA-f\NO WSEGO SOOB]ENIQ CELIKOM SREDNEE KOLI^ESTWO BIT NA EDINICU SOOB]ENIQ BUDET SKOLX UGODNO MALO OTLI- ^ATXSQ OT \NTROPII EDINICY SOOB]ENIQ. pODOBNOE KODIROWANIE PRAKTI- ^ESKI NE REALIZUEMO IZ-ZA TOGO, ^TO S ROSTOM DLINY SOOB]ENIQ TRUDOEMKOSTX POSTROENIQ \TOGO KODA STANOWITSQ NEDOPUSTIMO BOLX[OJ. kROME TOGO, TAKOE KODIROWANIE DELAET NEWOZMOVNYM OTPRAWKU SOOB]ENIQ PO ^ASTQM, ^TO NEOBHODIMO DLQ NEPRERYWNYH PROCESSOW PEREDA^I DANNYH. dOPOLNITELXNYM NEDOSTATKOM \TOGO SPOSOBA KODIROWANIQ QWLQETSQ NEOBHODIMOSTX OTPRAWKI ILI HRANENIQ SOBSTWENNO POLU^ENNOGO KODA WMESTE S EGO ISHODNOJ DLINOJ, ^TO SNIVAET \FFEKT OT SVATIQ. nA PRAKTIKE DLQ POWY[ENIQ STEPENI SVATIQ ISPOLXZU@T METOD BLOKIROWANIQ.
pO WYBRANNOMU ZNA^ENI@ " > 0 MOVNO WYBRATX TAKOE s, ^TO ESLI RAZBITX WSE SOOB]ENIE NA BLOKI DLINOJ s (WSEGO BUDET n=s BLOKOW), TO KODIROWANIEM {ENNONA-f\NO TAKIH BLOKOW, RASSMATRIWAEMYH KAK EDINICY SOOB]ENIQ, MOVNO SDELATX SREDNEE KOLI^ESTWO BIT NA EDINICU SOOB]ENIQ BOLX[IM \NTROPII MENEE, ^EM NA ". dEJSTWITELXNO, PUSTX
~ |
~ |
~ |
~ |
~ |
|
~ |
|
|
Y |
= (Y1 |
; Y2 |
; : : : ; Yn=s), Y1 |
= (X1; X2; : : : ; Xs), Y2 = (Xs+1; Xs+2; : : : ; X2s) |
||||
|
|
|
~ |
|
|
~ |
= sHX1 |
I |
I T. D., T. E. Yi = (Xs(i 1)+1 |
; Xs(i 1)+2; : : : ; Xsi). tOGDA HY1 |
|||||||
|
~ |
|
~ |
~ |
+ 1 = sHX1 + 1, SLEDOWATELXNO, |
|
|
|
sML1(Y1) = ML(Y1) 6 HY1 |
|
|
~
ML1(Y1) 6 HX1 + 1=s;
T.E. DOSTATO^NO BRATX s = 1=". mINIMUM s PO ZADANNOMU " MOVET BYTX GORAZDO MENX[IM 1=".
pRIMER. pUSTX D. S. W. X1; X2; : : : Xn NEZAWISIMY I ODINAKOWO RASPREDELENY I MOGUT PRINIMATX TOLXKO DWA ZNA^ENIQ P (Xi = 0) = p = 3=4 I P (Xi = 1) = q = 1=4 PRI i OT 1 DO n. tOGDA
|
3 |
4 |
|
1 |
|
|
|
3 |
|
|
|||
HXi = |
|
log2 |
|
+ |
|
log2 |
4 = 2 |
|
|
|
log2 |
3 |
0:811 BIT/SIM: |
4 |
3 |
4 |
4 |
mINIMALXNOE KODIROWANIE ZDESX | \TO KODY 0 I 1 S DLINOJ 1 BIT KAVDYJ. pRI TAKOM KODIROWANII KOLI^ESTWO BIT W SREDNEM NA EDINICU SOOB]ENIQ RAWNO 1. rAZOBXEM SOOB]ENIE NA BLOKI DLINY 2. zAKON RASPRE-
DELENIQ WEROQTNOSTEJ I KODIROWANIE DLQ MERNOJ D S W ~ 1 2
2- . . . X = (X ; X )
|
~ |
00 |
01 |
10 |
11 |
X |
||||
p |
9/16 |
3/16 |
3/16 |
1/16 |
~ |
0 |
10 |
110 |
111 |
code(X) |
||||
~ |
1 |
2 |
3 |
3. |
L(X) |
22
tOGDA PRI TAKOM MINIMALXNOM KODIROWANII KOLI^ESTWO BIT W SREDNEM NA EDINICU SOOB]ENIQ BUDET UVE
ML1(X~ ) = 1 |
9 |
+ 2 |
3 |
+ 3 |
3 |
+ 3 |
1 |
=2 = |
27 |
= 0:84375; |
|
16 |
|
16 |
16 |
16 |
32 |
T.E. MENX[E, ^EM DLQ NEBLO^NOGO KODIROWANIQ. dLQ BLOKOW DLINY 3 KOLI^ESTWO BIT W SREDNEM NA EDINICU SOOB]ENIQ MOVNO SDELATX 0:823, DLQ BLOKOW DLINY 4 | 0:818 I T.D.
wSE IZLOVENNOE RANEE PODRAZUMEWALO, ^TO RASSMATRIWAEMYE D.S.W. KODIRU@TSQ TOLXKO DWUMQ ZNA^ENIQMI (OBY^NO 0 I 1). pUSTX D.S.W. KO-
|
|
~ |
|
DIRU@TSQ m ZNA^ENIQMI. tOGDA DLQ D.S.W. X I L@BOGO EE KODIROWANIQ |
|||
~ |
~ |
~ |
|
WERNO, ^TO ML(X) > |
HX= log2 m I ML1 |
(X) > HX1= log2 m. kROME |
|
|
|
~ |
~ |
TOGO, SU]ESTWUET KODIROWANIE TAKOE, ^TO ML(X) 1 |
6 HX= log2 m I |
||
~ |
|
~ |
|
ML1(X) 1=n 6 HX1 |
= log2 m, GDE n = dim(X). |
|
fORMULY TEORETI^ESKIH PRIDELOW UROWNQ SVATIQ, RASSMOTRENNYE RANEE, ZADA@T PREDEL DLQ SREDNEJ DLINY KODA NA EDINICU SOOB]ENIJ, PEREDAWAEMYH MNOGO RAZ, T.E. ONI NI^EGO NE GOWORQT O NIVNEJ GRANICE UROWNQ SVATIQ, KOTORAQ MOVET DOSTIGATXSQ NA NEKOTORYH SOOB]ENIQH I BYTX MENX[EJ \NTROPII D.S.W., REALIZU@]EJ SOOB]ENIE.
11. pROSTEJ[IE ALGORITMY SVATIQ INFORMACII
mETOD {ENNONA-f\NO SOSTOIT W SLEDU@]EM, ZNA^ENIQ D.S.W. RASPOLAGA@T W PORQDKE UBYWANIQ IH WEROQTNOSTEJ, A ZATEM POSLEDOWATELXNO DELQT NA DWE ^ASTI S PRIBLIZITELXNO RAWNYMI WEROQTNOSTQMI, K KODU PERWOJ ^ASTI DOBAWLQ@T 0, A K KODU WTOROJ | 1.
dLQ PRED[ESTWU@]EGO PRIMERA POLU^IM
~ |
p |
~ |
|
X |
code(X) |
||
00 |
9/16 |
0 |
|
01 |
3/16 |
10 |
|
10 |
3/16 |
110 |
|
11 |
1/16 |
~ |
|
111, ML1(X) = 27=32 = 0:84375 BIT/SIM. |
e]E ODIN PRIMER. kOD SOSTAWLQETSQ POSLE SORTIROWKI, T. E. POSLE PERESTANOWKI ZNA^ENIJ B I C.
X |
p |
code(X) |
|
|
A |
0.4 |
0 |
|
|
B |
0.2 |
11 |
|
ML(X) = ML1(X) = 1:6 BIT/SIM, |
C |
0.4 |
10, |
|
HX = log2 5 0:8 1:523 BIT/SIM. |
mETOD hAFFMENA (Hu man) RAZRABOTAN W 1952 G. oN BOLEE PRAKTI- ^EN I NIKOGDA PO STEPENI SVATIQ NE USTUPAET METODU {ENNONA-f\NO, BOLEE TOGO, ON SVIMAET MAKSIMALXNO PLOTNO. kOD STROITSQ PRI POMO]I
23
DWOI^NOGO (BINARNOGO) DEREWA. wEROQTNOSTI ZNA^ENIJ D.S.W. PRIPISYWA- @TSQ EGO LISTXQM; WSE DEREWO STROITSQ, OPIRAQSX NA LISTXQ. wELI^INA, PRIPISANNAQ K UZLU DEREWA, NAZYWAETSQ WESOM UZLA. dWA LISTA S NAIMENX[IMI WESAMI SOZDA@T RODITELXSKIJ UZEL S WESOM, RAWNYM SUMME IH WESOW; W DALXNEJ[EM \TOT UZEL U^ITYWAETSQ NARAWNE S OSTAW[IMISQ LISTXQMI, A OBRAZOWAW[IE EGO UZLY OT TAKOGO RASSMOTRENIQ USTRANQ- @TSQ. pOSLE POSTROJKI KORNQ NUVNO PRIPISATX KAVDOJ IZ WETWEJ, ISHODQ]IH IZ RODITELXSKIH UZLOW, ZNA^ENIQ 0 ILI 1. kOD KAVDOGO ZNA^ENIQ D. S. W. | \TO ^ISLO, POLU^AEMOE PRI OBHODE WETWEJ OT KORNQ K LISTU, SOOTWETSTWU@]EMU DANNOMU ZNA^ENI@.
dLQ METODOW hAFFMENA I {ENNONA-f\NO KAVDYJ RAZ WMESTE S SOBSTWENNO SOOB]ENIEM NUVNO PEREDAWATX I TABLICU KODOW. nAPRIMER, DLQ SLU^AQ IZ PRIMERA 2 NUVNO SOOB]ITX, ^TO KODU 10 SOOTWETSTWUET SIMWOL C, KODU 0 | A I T.D.
pOSTROIM KODY hAFFMENA DLQ ZNA^ENIJ D.S.W. IZ DWUH PREDYDU]IH PRIMEROW.
|
~ |
00 |
01 |
|
|
|
10 |
|
|
|
11 |
|
||
|
|
X |
|
|
|
|
|
|
|
|||||
|
|
p |
9=16 |
3=16 |
|
|
|
3=16 |
|
|
|
1=16 |
|
|
|
|
|
|
|
|
|
|
0 & |
|
4 |
|
.1 |
|
|
|
|
|
|
0 & |
|
|
|
.1 |
16 |
|
|
|
|
|
|
|
|
|
|
7 |
|
|
|
|
|
|
|
||
|
|
|
0 & |
.1 |
16 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
~ |
0 |
10 |
|
|
|
110 |
|
|
|
111 |
|
||
|
code(X) |
|
|
|
|
|
|
|
||||||
~ |
|
~ |
|
|
|
|
|
|
|
|
|
|
|
|
ML1(X) = ML(X)=2 = 27=32 = 0:84375 BIT/SIM. |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
X |
|
A |
|
B |
|
|
C |
|
|
|
||
|
|
p |
0.4 |
0.2 |
|
0.4 |
|
|
|
|||||
|
|
|
|
|
0 & |
0.6 |
.1 |
|
|
|
||||
|
|
|
0 & |
.1 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
code(X) |
0 |
10 |
|
11 |
|
|
|
ML1(X) = ML(X) = 1:6 BIT/SIM.
I uPRAVNENIE 18
wY^ISLITX 1 ~ DLQ BLO^NOGO KODA hAFFMENA DLQ dLINA BLOKA
ML (X) X. | 2 BITA. d.S.W. X BERETSQ IZ POSLEDNEGO PRIMERA.
I uPRAVNENIE 19
wY^ISLITX HX I ML(X) DLQ KODOW hAFFMENA I {ENNONA-f\NO DLQ X.
24
d.S.W. X ZADAETSQ SLEDU@]IM RASPREDELENIEM WEROQTNOSTEJ:
X |
1 |
2 |
3 |
4 |
5 |
p |
7=18 |
1=6 |
1=6 |
1=6 |
1=9: |
12. aRIFMETI^ESKOE KODIROWANIE
aLGORITM KODIROWANIQ hAFFMENA, W LU^[EM SLU^AE, NE MOVET PEREDAWATX NA KAVDYJ SIMWOL SOOB]ENIQ MENEE ODNOGO BITA INFORMACII. pREDPOLOVIM, IZWESTNO, ^TO W SOOB]ENII, SOSTOQ]EM IZ NULEJ I EDINIC, EDINICY WSTRE^A@TSQ W 10 RAZ ^A]E NULEJ. pRI KODIROWANII METODOM hAFFMENA I NA 0 I NA 1 PRIDETSQ TRATITX NE MENEE ODNOGO BITA. nO \NTROPIQ D. S. W., GENERIRU@]EJ TAKIE SOOB]ENIQ 0:469 BIT/SIM. mETOD hAFFMENA DAET DLQ MINIMALXNOGO SREDNEGO KOLI^ESTWA BIT NA ODIN SIMWOL SOOB]ENIQ ZNA^ENIE 1 BIT. hOTELOSX BY IMETX TAKU@ SHEMU KODIROWANIQ, KOTORAQ POZWOLQLA BY KODIROWATX NEKOTORYE SIMWOLY MENEE ^EM ODNIM BITOM. oDNOJ IZ LU^[IH SREDI TAKIH SHEM QWLQETSQ ARIFMETI^ESKOE KODIROWANIE, RAZRABOTANNOE W 70-H GODAH XX WEKA.
pO ISHODNOMU RASPREDELENI@ WEROQTNOSTEJ DLQ WYBRANNOJ DLQ KODIROWANIQ D. S. W. STROITSQ TABLICA, SOSTOQ]AQ IZ PERESEKA@]IHSQ TOLXKO W GRANI^NYH TO^KAH OTREZKOW DLQ KAVDOGO IZ ZNA^ENIJ \TOJ D.S.W.; OB_EDINENIE \TIH OTREZKOW DOLVNO OBRAZOWYWATX OTREZOK [0,1], A IH DLINY DOLVNY BYTX PROPORCIONALXNY WEROQTNOSTQM SOOTWETSTWU- @]IH ZNA^ENIJ D. S. W. aLGORITM KODIROWANIQ ZAKL@^AETSQ W POSTROENII OTREZKA, ODNOZNA^NO OPREDELQ@]EGO DANNU@ POSLEDOWATELXNOSTX ZNA^ENIJ D.S.W. zATEM DLQ POSTROENNOGO OTREZKA NAHODITSQ ^ISLO, PRINADLEVA]EE EGO WNUTRENNEJ ^ASTI I RAWNOE CELOMU ^ISLU, DELENNOMU NA MINIMALXNO WOZMOVNU@ POLOVITELXNU@ CELU@ STEPENX DWOJKI. |TO ^ISLO I BUDET KODOM DLQ RASSMATRIWAEMOJ POSLEDOWATELXNOSTI. wSE WOZMOVNYE KONKRETNYE KODY | \TO ^ISLA STROGO BOLX[IE NULQ I STROGO MENX[IE ODNOGO, PO\TOMU MOVNO OTBRASYWATX LIDIRU@]IJ NOLX I DESQTI^NU@ TO^KU, NO NUVEN E]E ODIN SPECIALXNYJ KOD-MARKER, SIGNALIZIRU@]IJ O KONCE SOOB]ENIQ. oTREZKI STROQTSQ TAK. eSLI IMEETSQ OTREZOK DLQ SOOB]ENIQ DLINY n 1, TO DLQ POSTROENIQ OTREZKA DLQ SOOB- ]ENIQ DLINY n, RAZBIWAEM EGO NA STOLXKO VE ^ASTEJ, SKOLXKO ZNA^ENIJ IMEET RASSMATRIWAEMAQ D.S.W. |TO RAZBIENIE DELAETSQ SOWER[ENNO TAKVE KAK I SAMOE PERWOE (S SOHRANENIEM PORQDKA). zATEM WYBIRAETSQ IZ POLU^ENNYH OTREZKOW TOT, KOTORYJ SOOTWETSTWUET ZADANNOJ KONKRETNOJ POSLEDOWATELXNOSTI DLINY n.
pRINCIPIALXNOE OTLI^IE \TOGO KODIROWANIQ OT RASSMOTRENNYH RANEE METODOW W EGO NEPRERYWNOSTI, T. E. W NENUVNOSTI BLOKIROWANIQ. |FFEKTIWNOSTX ARIFMETI^ESKOGO KODIROWANIQ RASTET S ROSTOM DLINY
25
SVIMAEMOGO SOOB]ENIQ (DLQ KODIROWANIQ hAFFMENA ILI {ENNONA-f\NO \TOGO NE PROISHODIT). hOTQ ARIFMETI^ESKOE KODIROWANIE DAET OBY^NO LU^[EE SVATIE, ^EM KODIROWANIE hAFFMENA, ONO POKA ISPOLXZUETSQ NA PRAKTIKE SRAWNITELXNO REDKO, T.K. ONO POQWILOSX GORAZDO POZVE I TREBUET BOLX[IH WY^ISLITELXNYH RESURSOW.
pRI SVATII ZADANNYH DANNYH, NAPRIMER, IZ FAJLA WSE RASSMOTRENNYE METODY TREBU@T DWUH PROHODOW. pERWYJ DLQ SBORA ^ASTOT SIMWOLOW, ISPOLXZUEMYH KAK PRIBLIVENNYE ZNA^ENIQ WEROQTNOSTEJ SIMWOLOW, I WTOROJ DLQ SOBSTWENNO SVATIQ.
pRIMER ARIFMETI^ESKOGO KODIROWANIQ. pUSTX D.S.W. X MOVET PRINIMATX TOLXKO DWA ZNA^ENIQ 0 I 1 S WEROQTNOSTQMI 2/3 I 1/3 SOOTWETSTWENNO. sOPOSTAWIM ZNA^ENI@ 0 OTREZOK [0,2/3], A 1 | [2/3,1]. tOGDA
DLQ D S W ~
. . . X,
|
~ |
~ |
|
|
|
|
||||
|
dim(X) = 3; HX = HX=3 = log2 3 2=3 0:9183 BIT/SIM.; |
|||||||||
TABLICA POSTROENIQ KODOW | |
|
|
|
|
||||||
|
iNTERWALY I KODY |
|
wEROQTNOSTX |
|
kOD hAFFMENA |
|||||
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
111[2726 ; 1] 3 3231 = 0:11111 |
|
1=27 |
|
0000 |
||||
|
11[98 ; 1] |
110[98 ; 2726 ] 3 1615 = 0:1111 |
|
2=27 |
|
0001 |
||||
|
|
101[2722 ; 98 ] 3 87 = 0:111 |
|
2=27 |
|
010 |
||||
1[32 ; 1] |
10[32 ; 98 ] |
100[32 ; 2722 ] 3 43 = 0:11 |
|
4=27 |
|
001 |
||||
|
|
011[2716 ; 32 ] 3 85 = 0:101 |
|
2=27 |
|
011 |
||||
|
01[94 ; 32 ] |
010[94 ; 2716 ] 3 21 = 0:1 |
|
4=27 |
|
100 |
||||
|
|
001[ |
8 |
; 94 ] 3 83 = 0:011 |
|
4=27 |
|
101 |
||
|
|
27 |
|
|
||||||
0[0; 32 ] |
00[0; 94 ] |
000[0; |
8 |
] 3 41 = 0:01 |
|
8=27 |
|
11. |
||
27 |
|
|
||||||||
|
~ |
|
|
|
|
|
|
|
|
|
|
ML1(X) = 65=81 0:8025 BIT/SIM. (ARIFMETI^ESKOE), |
|||||||||
|
~ |
|
|
|
|
|
|
|
|
|
|
ML1(X) = 76=81 0:9383 BIT/SIM. (BLO^NYJ hAFFMENA), |
|||||||||
|
ML1(X) = ML(X) = 1 BIT/SIM. (hAFFMENA). |
sREDNEE KOLI^ESTWO BIT NA EDINICU SOOB]ENIQ DLQ ARIFMETI^E- SKOGO KODIROWANIQ POLU^ILOSX MENX[E, ^EM \NTROPIQ. |TO SWQZANO S TEM, ^TO W RASSMOTRENNOJ PROSTEJ[EJ SHEME KODIROWANIQ, NE OPISAN KOD-MARKER KONCA SOOB]ENIQ, WWEDENIE KOTOROGO NEMINUEMO SDELAET \TO SREDNEE KOLI^ESTWO BIT BOLX[IM \NTROPII.
pOLU^ENIE ISHODNOGO SOOB]ENIQ IZ EGO ARIFMETI^ESKOGO KODA PROISHODIT PO SLEDU@]EMU ALGORITMU.
26
{AG 1. w TABLICE DLQ KODIROWANIQ ZNA^ENIJ D. S. W. OPREDELQETSQ INTERWAL, SODERVA]IJ TEKU]IJ KOD, | PO \TOMU INTERWALU ODNOZNA^NO OPREDELQETSQ ODIN SIMWOL ISHODNOGO SOOB]ENIQ. eSLI \TOT SIMWOL | \TO MARKER KONCA SOOB]ENIQ, TO KONEC.
{AG 2. iZ TEKU]EGO KODA WY^ITAETSQ NIVNQQ GRANICA SODERVA]EGO EGO INTERWALA, POLU^ENNAQ RAZNOSTX DELITSQ NA DLINU \TOGO VE INTERWALA. pOLU^ENNOE ^ISLO S^ITAETSQ NOWYM TEKU]IM ZNA^ENIEM KODA. pEREHOD K [AGU 1.
I uPRAVNENIE 20
wY^ISLITX SREDNEE KOLI^ESTWO BIT NA EDINICU SVATOGO SOOB]ENIQ O ZNA^ENII KAVDOJ IZ D. S. W., IZ ZADANNYH SLEDU@]IMI RASPREDELENIQMI WEROQTNOSTEJ, PRI SVATII METODAMI {ENNONA-f\NO, hAFFMENA I ARIFMETI^ESKIM.
X1 |
1 |
2 |
|
3 |
4 |
|
X2 |
1 |
2 |
5 |
6 |
7 |
|
|||
p |
1=3 1=3 1=6 1=6; |
|
p |
0:2 0:1 0:3 0:25 0:15; |
|
|||||||||||
|
|
X3 |
|
|
1 |
4 |
9 |
16 |
25 |
36 |
49 |
|
|
|
||
|
|
|
|
|
|
|||||||||||
|
|
p |
|
|
0:1 0:1 0:1 0:3 0:1 |
0:1 |
0:2; |
|
|
|
||||||
|
|
|
|
|
2 |
1 |
0 |
1 |
2 |
|
|
|
|
|
||
|
|
|
|
X4 |
|
|
|
|
|
|||||||
|
|
|
|
p |
1=3 |
1=4 1=5 1=6 1=20: |
|
|
|
|
I uPRAVNENIE 21
wY^ISLITX DLINY KODOW hAFFMENA I ARIFMETI^ESKOGO DLQ SOOB]ENIQ AAB, POLU^ENNOGO OT D.S.W. X SO SLEDU@]IM RASPREDELENIEM WEROQT-
NOSTEJ P (X = A) = 1=3, P (X = B) = 2=3.
I uPRAVNENIE 22
sOSTAWITX ARIFMETI^ESKIJ KOD DLQ SOOB]ENIQ BAABC, POLU^ENNOGO OT D.S.W. X SO SLEDU@]IM RASPREDELENIEM WEROQTNOSTEJ P (X = A) = 1=4, P (X = B) = 1=2, P (X = C) = 1=4. kAKOW BUDET ARIFMETI^ESKIJ KOD DLQ \TOGO VE SOOB]ENIQ, ESLI X RASPREDELENA PO ZAKONU P (X = A) = 1=3, P (X = B) = 7=15, P (X = C) = 1=5?
I uPRAVNENIE 23
d.S.W. X MOVET PRINIMATX TRI RAZLI^NYH ZNA^ENIQ. pRI POSTROENII BLO^NOGO KODA S DLINOJ BLOKA 4 DLQ X NEOBHODIMO BUDET RASSMOTRETX
D S W ~ WYBORKU ^ETYREH ZNA^ENIJ sKOLXKO RAZLI^NYH ZNA^E
. . . X | X. -
NIJ MOVET IMETX ~ eSLI S^ITATX SLOVNOSTX POSTROENIQ KODA PRO
X? -
PORCIONALXNOJ KOLI^ESTWU RAZLI^NYH ZNA^ENIJ KODIRUEMOJ D. S. W., TO WO SKOLXKO RAZ SLOVNEE STROITX BLO^NYJ KOD DLQ X PO SRAWNENI@ S NEBLO^NYM?
I uPRAVNENIE 24
sOSTAWITX KODY hAFFMENA, BLO^NYJ hAFFMENA (DLQ BLOKOW DLINY 2 I 3) I ARIFMETI^ESKIJ DLQ SOOB]ENIQ ABAAAB, WY^ISLITX IH DLINY.
27
pRIBLIZITELXNYJ ZAKON RASPREDELENIQ WEROQTNOSTEJ D.S.W., SGENERIROWAW[EJ SOOB]ENIE, OPREDELITX ANALIZOM SOOB]ENIQ.
13. aDAPTIWNYE ALGORITMY SVATIQ. kODIROWANIE hAFFMENA
qWLQETSQ PRAKTI^NYM, ODNOPROHODNYM, NE TREBU@]IM PEREDA^I TABLICY KODOW. eGO SUTX W ISPOLXZOWANII ADAPTIWNOGO ALGORITMA, T.E. ALGORITMA, KOTORYJ PRI KAVDOM SOPOSTAWLENII SIMWOLU KODA, KROME TOGO, IZMENQET WNUTRENNIJ HOD WY^ISLENIJ TAK, ^TO W SLEDU@]IJ RAZ \TOMU VE SIMWOLU MOVET BYTX SOPOSTAWLEN DRUGOJ KOD, T.E. PROISHODIT ADAPTACIQ ALGORITMA K POSTUPA@]IM DLQ KODIROWANIQ SIMWOLAM. pRI DEKODIROWANII PROISHODIT ANALOGI^NYJ PROCESS.
w NA^ALE RABOTY ALGORITMA DEREWO KODIROWANIQ SODERVIT TOLXKO ODIN SPECIALXNYJ SIMWOL, WSEGDA IME@]IJ ^ASTOTU 0. oN NEOBHODIM DLQ ZANESENIQ W DEREWO NOWYH SIMWOLOW: POSLE NEGO KOD SIMWOLA PEREDAETSQ NEPOSREDSTWENNO. oBY^NO TAKOJ SIMWOL NAZYWA@T escapeSIMWOLOM (hESCi). rAS[IRENNYJ ASCII KODIRU@T KAVDYJ SIMWOL 8- BITNYM ^ISLOM, T.E. ^ISLOM OT 0 DO 255. pRI POSTROENII DEREWA KODIROWANIQ NEOBHODIMO DLQ WOZMOVNOSTI PRAWILXNOGO DEKODIROWANIQ KAK-TO UPORQDO^IWATX STRUKTURU DEREWA. rASPOLOVIM LISTXQ DEREWA W PORQDKE WOZRASTANIQ ^ASTOT I ZATEM W PORQDKE WOZRASTANIQ STANDARTNYH KODOW SIMWOLOW. uZLY SOBIRA@TSQ SLEWA NAPRAWO BEZ PROPUSKOW. lEWYE WETWI POME^A@TSQ 0, A PRAWYE | 1.
rASSMOTRIM PROCESS POSTROENIQ KODOW PO ADAPTIWNOMU ALGORITMU hAFFMENA DLQ SOOB]ENIQ ACCBCAAABC, KOTOROE SOOTWETSTWUET WYBORKE 10-I ZNA^ENIJ D.S.W. X IZ 2-GO PRIMERA NA POSTROENIE NEADAP-
TIWNOGO KODA hAFFMENA: |
|
|
|
|
1Ts |
|
|
|
|
|
|
|
2Ts |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
s1/A |
|
|
|
|
|
s1/C |
||||||||||
WHODNYE |
KOD |
DLINA |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
DANNYE |
|
KODA |
DEREWA |
|
0/ |
|
|
|
|
T |
|
|
|
|
|
|
T |
||||||||
|
|
|
ESCs |
|
|
|
|
|
1Ts |
|
|
|
|||||||||||||
A |
'A' |
8 |
1 |
|
|
|
h |
|
|
|
i |
|
|
|
|
|
|
|
|
T |
s1/A |
||||
C |
0'C' |
9 |
2 |
|
|
|
|
|
|
|
|
|
|
0/ |
h |
ESCs |
i |
|
|||||||
C |
1 |
1 |
3 |
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
4 |
|
|
|||||
B |
00'B' |
10 |
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
C |
1 |
1 |
5 |
|
|
|
|
|
Ts |
T |
s2/C |
|
|
|
|
|
|
|
|
Ts |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|||||
A |
001 |
3 |
6 |
|
|
|
1Ts |
T |
|
|
|
|
|
|
|
|
|
2Ts |
T |
2/Cs |
|||||
A |
01 |
2 |
7 |
|
|
|
s1/A |
|
|
|
|
|
|
|
|
||||||||||
A |
01 |
2 |
8 |
0/ |
h |
ESCs |
|
|
|
|
1Ts |
|
1/Bs |
||||||||||||
B |
001 |
3 |
9 |
|
|
|
i |
|
|
|
|
|
h |
|
|
i |
T |
|
|
|
|||||
C |
01 |
2 |
|
|
|
|
|
|
|
|
|
|
|
0/ |
|
|
1/As |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
ESCs |
|
|
28
|
|
|
|
5Ts |
|
|
|
|
|
6Ts |
|
|
|
|
|
|
|
7Ts |
||||
|
|
|
|
|
T |
|
|
|
|
|
|
T |
|
|
|
|
|
|
T |
|||
|
|
2Ts |
3/Cs |
|
|
|
3Ts |
3/Cs |
|
|
|
|
4Ts |
3/Cs |
||||||||
|
|
|
|
|
|
T |
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
T |
|
|
|
1Ts |
T |
1/Bs |
|
|
|
1Ts |
2/As |
|
|
|
|
|
1Ts |
3/As |
||||||
|
h |
|
|
|
|
|
|
h |
|
i |
T |
|
|
|
|
|
h |
|
|
T |
|
|
0/ |
i |
1/As |
|
0/ |
ESCs |
1/Bs |
|
|
0/ |
|
i |
1/Bs |
|
|||||||||
|
ESCs |
|
|
|
|
|
|
ESCs |
|
|||||||||||||
|
|
|
|
|
|
|
8Ts |
|
|
|
|
|
|
|
|
|
9Ts |
|
|
|||
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
|
T |
|
|
|||
|
|
|
|
|
|
4Ts |
4/As |
|
|
|
|
|
5Ts |
4/As |
|
|||||||
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
|
|
|
|
1Ts |
3/Cs |
|
|
|
|
|
2Ts |
3/Cs |
|
|
||||||
|
|
|
|
h |
|
|
T |
|
|
|
|
|
|
h |
|
i |
T |
|
|
|
|
|
|
|
0/ |
|
i |
1/Bs |
|
|
|
|
0/ |
ESCs |
2/B.s |
|
|
||||||||
|
|
|
ESCs |
|
|
|
|
|
|
|
|
zDESX L1(ACCBCAAABC) = 4:1 BIT/SIM. eSLI NE ISPOLXZOWATX SVATIQ, TO L1(ACCBCAAABC) = 8 BIT/SIM. dLQ RASSMATRIWAEMOJ D.S.W. RANEE BYLI POLU^ENY ZNA^ENIQ ML1(X) = 1:6 BIT/SIM I HX 1:523 BIT/SIM. nO S ROSTOM DLINY SOOB]ENIQ SREDNEE KOLI^ESTWO BIT NA SIMWOL SOOB]ENIQ PRI ADAPTIWNOM ALGORITME KODIROWANIQ BUDET MALO OTLI^ATXSQ OT ZNA^ENIQ, POLU^ENNOGO PRI ISPOLXZOWANII NEADAPTIWNOGO METODA hAFFMENA ILI {ENNONA-f\NO, T.K. ALFAWIT SIMWOLOW OGRANI^EN I POLNYJ KOD KAVDOGO SIMWOLA NUVNO PEREDAWATX TOLXKO ODIN RAZ.
tEPERX RASSMOTRIM PROCESS DEKODIROWANIQ SOOB]ENIQ 'A'0'C'100 'B'1001010100101. zDESX I DALEE SIMWOL W APOSTOFAH OZNA^AET WOSEMX BIT, PREDSTAWLQ@]IH SOBOJ ZAPISX DWOI^NOGO ^ISLA, NOMERA SIMWOLA, W TABLICE ASCII+. w NA^ALE DEKODIROWANIQ DEREWO hAFFMENA SODERVIT TOLXKO escape-SIMWOL S ^ASTOTOJ 0. s RASKODIROWANIEM KAVDOGO NOWOGO SIMWOLA DEREWO ZANOWO PERESTRAIWAETSQ.
WHODNYE |
SIMWOL |
|
DANNYE |
|
DEREWA |
'A' |
A |
1 |
0'C' |
C |
2 |
1 |
C |
3 |
00'B' |
B |
4 |
... |
... |
... |
|
|
|
wYBRANNYJ SPOSOB ADAPTACII ALGORITMA O^ENX NE\FFEKTIWNYJ, T.K. POSLE OBRABOTKI KAVDOGO SIMWOLA NUVNO PERESTRAIWATX WSE DEREWO KODIROWANIQ. sU]ESTWU@T GORAZDO MENEE TRUDOEMKIE SPOSOBY, PRI
29