- •I. Ақпаратты өлшеу бірліктері. Ақпаратты берудің формалары. Ақпарат көлемі. Ақпаратты өлшеу.
- •1.Кітаптың 100 беті бар; әр бетте - 35 жол, әр жолда - 50 символ. Кітаптағы ақпараттың көлемін анықтау.
- •2. Бір, екі, үш символдан тұратын екілік қатарлардың барлық саны қанша.
- •2.Лоторея барабанында 32 шар бар. Бірінші шыққан нөмір(мысалы, 15 нөмір) туралы хабарда қанша ақпарат бар?
- •3.Сүйек ойынында алты қырлы кубик қолданылады. Кубиктің әрбір лақтыруынан ойыншы қанша бит ақпарат алады?
- •1.Қорабта 50 шар бар. Оның ішінде 40 ақ және 10 қара шар. Қорабтан шарды «қарамай» шығарғанда, ақ шардың түсу ықтималдылығы қара шардан жоғары екені айқын.
2.Лоторея барабанында 32 шар бар. Бірінші шыққан нөмір(мысалы, 15 нөмір) туралы хабарда қанша ақпарат бар?
Шешімі: 32 шарлардың ішінен кез келген шарда шығару тең ықтималды болғандықтан, шыққан бір нөмір туралы ақпарат көлемі теңдеумен табылады: 2х=32. Бірақ 32=25 демек, х=5 бит болады. Жауабы нақты қандай нөмір шыққанына тәуелді емес екені айқын.
3.Сүйек ойынында алты қырлы кубик қолданылады. Кубиктің әрбір лақтыруынан ойыншы қанша бит ақпарат алады?
Шешімі:Кубиктің әр қырының түсуі тең ықтималды. Сондықтан кубикті бір лақтырғандағы нәтижесіндегі ақпарат саны 2х =6 теңдеуінен табылады. Теңдеудің шешімі: x= log26. Логарифмдер кестесінен (үтірден кейін 3-таңбалық дәлдікпен) шығатыны: x=2,585 бит.
Ақпараттың алфавиттік өлшемі
Мәтіннің ішіндегі ақпарат санын анықтауда, ақпаратты алфавиттік тұрғыдан өлшеу мүмкіндігін береді. Ақпаратты алфавиттік тұрғыдан өлшеу объективті, себебі мәтінді өабылдайтын субъектіге (адамға ) тәуелді емес. Мәтінді жазуға пайдаланып көптеген символдар, алфавит деп аталады. Алфавиттің қуаттылығы деп, алфавиттегі символдардың толық санын айтады. Егерде алфавиттегі барлық символдар бірдей жиілікпен (тең ықтималды) кезігеді деп жорамалдалса, онда әр символды берер ақпаратының саны мына формуламен есептеледі: i=log2N. Мұндағы N - алфавиттің қуаттылығы. Сонымен, 2 символдық алфавитте әр символдың «салмағы» 1 бит (log22=1), 4 символдық алфавитте - 2 бит (log28=2), 8 символдық алфавитте – 3 бит (log28=3) т.с.с. болады. Демек қуаттылығы 256 (28) тең алфавиттің бір символы, мәтінде 8 бит ақпарат береді. Ақпараттың осындай саны байт деп аталады. Компьютерге мәтінді ұсынуға 256 символдан тұратын алфавит пайдалынылады. 1 байт = 8 бит. Егер барлық мәтінде К символ болса, онда алфавиттік тұрғыдан өлшегенде ондағы ақпарат саны мына формуламен табылады: I=K*i, мұндағы і – алфавитте қолданылатын әр символдың ақпараттық салмағы.Ақпараттың көлемдік мөлшері өте үлкен сан болады. Сондықтан қолдануға ыңғайлы болу үшін көлемдік мөлшердің ірі өлшем бірліктері анықталып енгізілген. Ол өлшем бірліктері екіге еселі, яғни, екінің дәрежесі болуы керек. Оларға мыналар жатады: килобайт (kilobyte), мегабайт (megabyte) және гигабайт (gigabyte), терабайт (terabyte). Егер мынадай қысқаша атаулары Кб (Kb), Мб (Mb), Гб (Gb), Тб (Tb), Пб (Pb) сәйкес қолдансақ, онда олардың мәндері былай анықталынады:
1 Кбайт (килобайт) - 210 байт = 1024 байт
1 Мбайт (мегабайт) - 210 Кбайт = 1024 Кбайт
1 Гбайт (гигабайт) = 210 Мбайт = 1024 Мбайт
1 Тбайт (терабайт) = 210 Гбайт = 1024 Гбайт
1 Петабайт (пбайт) = 250 Пбайт =1024 Пбайт
1. Компьютердің көмегімен терілген кітапта 150 бет бар, әр бет 40 жолдан, әр жол - 60 символдан турады. Кітаптағы ақпарат көлемі қандай?
Шешімі: Компьютерлік алфавиттің қуаттылығы 256-ға тең. Бip символ 1 байт ақпарат береді. Сонда, кітаптың бip бетіндегі ақпарат 40 х 60 = 2400 байттан тұрады. Кітаптағы барлық ақпараттың көлемі (әртүрлі бірлікпен):
2400 х 150 = 360 000 байт.
360000/1024 = 351,5625 Кбайт.
351,5625/1024 = 0,34332275 Мбайт.
Ақпарат саны және ықтималдық
Клод Шеннонның ақпарат мөлшерін ықтималдық жолмен өлшеуді анықтағанын, жоғарыда айтылды. Кездейсоқ оқиғаларды сипаттау үшін ықтималдық және энтропия ұғымдары қолданылады. Ақпараттық теорияда, ақпараттың өлшемінің анықталуы энтропиялық тұрғыдан қарастыру негізделген. Яғни, хабар алынғаннан кейін, ондағы ақпарат саны, кездейсоқты оқиғадан кейін, белгісіздіктің қаншалықты азайғанына байланысты анықталады. Мысалы, қандайда бip символдар тізбегінің ішінен нақты әріптің шығуының кездейсоқтығы. Егер хабарда алғашқы белгісіздік толығымен анықталса, уақиға туралы толык ақпарат алынды деп есептеледі.
