Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
корпусна теорія 1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
63.32 Кб
Скачать

1. 3. 2. Кількісні міри інформації

В залежності від поставлених цілей аналізу інформації, її кількість визначають різними методами. Так, вимір інформації на об’єкті управління є необхідним для розрахунку потреби в управлінських кадрах, добору корисних відомостей для управлінських рішень, визначення інформаційних ресурсів автоматизованих інформаційних систем тощо. При аналізі інформацію можна розглядати на синтаксичному, семантичному і прагматичному рівнях.

Синтаксичний рівень розгляду інформації повністю ігнорує її зміст та споживчі (корисні) властивості. Розгляд інформації пов’язаний лише зі сприйняттям формально-структурних характеристик даних, що представляють цю інформацію. Враховують лише такі характеристики, як спосіб і форма подання інформації, тип носія, швидкість передачі та обробки, розміри кодів, надійність та точність перетворень цих кодів і т. п.

Формально-структурний розгляд інформації характерний для технічних систем, таких як телефон, факс, телеграф, комп’ютер, комп’ютерна мережа тощо.

Семантичний рівень розгляду інформації визначає смисловий зміст інформації. На цьому рівні аналізують відомості, що містять дані як об’єкти інформаційного процесу, розглядають змістовні зв’язки між одиницями даних.

Прагматичний рівень аналізу інформації відбиває її відповідність тим цілям, заради яких збирають і опрацьовують цю інформацію. Так, для систем управління прагматичний аспект відображає цінність і корисність інформації для прийняття ефективних управлінських рішень.

Згідно з трьома рівнями аналізу інформації її і вимірюють. При цьому термінологічно говорять про кількість інформації та об’єм даних, розрізняючи ці дві кількісні характеристики. Оскільки вимірювання кількості інформації на семантичному та прагматичному рівні виходить за межі цих методичних вказівок, зупинимося на її синтаксичних мірах. Таке вимірювання має два аспекти — теоретичний і практичний.

У теоретичному аспекті увагу концентрують на зв’язку між інформацією і ентропією — мірою невизначеності стану деякої системи (ентропія — від грецького έν — в та τροπή — зміна, перетворення, поворот). З цих позицій інформацію трактують як кількісну міру усунення невизначеності (ентропії) в результаті отримання повідомлень та вважають її мірою організації, впорядкованості розглядуваної системи. За мінімальну одиницю інформації у цьому випадку служить біт, якому дамо таке означення:

Бітце така кількість інформації, яку отримує людина, діставши відповідь на питання,сформульоване таким чином, що на нього однозначно можна відповісти "так" або "ні".

У практичних завданнях синтаксичного виміру інформації увагу концентрують на знаковому поданні інформації у вигляді даних.

Існує багато різних систем і одиниць виміру даних. Кожна наукова дисципліна, кожна галузь діяльності людей використовує свої, найбільш зручні або традиційні одиниці. Так, у економіці інформацію, що циркулює на підприємстві, можуть вимірювати кількістю різних документів, екземплярів документів, рядків і символів у документах, кількістю техніко-економічних показників тощо. У телеграфії одиницею виміру є п’ятизначний код. Об’єм даних у текстових повідомленнях прийнято вимірювати кількістю символів алфавіту, засобами якого подано повідомлення.

В інформатиці для виміру даних використовується той факт, що різні типи даних мають універсальне двійкове представлення, і тому вводять свої одиниці даних, базовані на двійкових кодах.

Найменшою одиницею є байт, довжина якого традиційно рівна восьми бітам, що дозволяє закодувати 256 різних незалежних значень.

З одиницями, що позначають більші обсяги інформації існує певна плутанина, пов’язана з тим, що для комп’ютерної техніки кратні розміри зручніше представляти степенями числа 2, а не 10, як це звичайно прийнято. Тому, наприклад, в залежності від намірів виробників апаратури комп’ютера чи розуміння і бажання авторів тексту 1 мегабайт може означати як 1 млн байтів (106), так і 1048576 байтів (220). З метою виправлення такого стану речей у грудні 1998 року Міжнародна електротехнічна комісія (МЕК) — провідна міжнародна організація стандартизації в галузі електротехніки — подала міжнародний стандарт назв і префіксів одиниць виміру інформації для використання в галузі обробки даних та їх пересилання, який подано нижче у таблиці.

Абревіатура

Назва

Степінь

Значення

K

Kilo

103

1000

Ki

Kibi

210

1024

M

Mega

106

1000000

Mi

Mebi

220

1048576

G

Giga

109

1000000000

Gi

Gibi

230

1073741824

T

Tera

1012

1000000000000

Ti

Tebi

240

1099511627776

P

Peta

1015

1000000000000000

Pi

Pebi

250

1125899906842624

Хоча цей стандарт вже утверджено, плутанина існує і сьогодні, що пов’язане з тим, що запропоновані назви не дістали широкого вжитку. Тому і тепер зустрічаючи у інструкціях, специфікаціях пристроїв чи у відповідних текстах, наприклад, абревіатуру G важко точно сказати, чи це 109 чи 230 байт. Похибка становить від 2% для пари кіло-кібі до 11% — для пари пета-пебі, що необхідно враховувати при розрахунках об’ємів пам’яті для збереження інформації. Принагідно зазначимо, що для розрізняння бітів та байтів при використанні їх як частини інших одиниць виміру, використовують велику та малу букви “b”. Наприклад, мегабіти типово скорочують як b, тобто Mbps — це мегабіт за секунду (megabitspersecond), а MBps — відповідно мегабайт за секунду (megabytespersecond).