- •20 Лекція 4. Представлення даних в еом
- •Кодування даних двійковим кодом
- •Кодування текстових даних
- •Кодування графічних даних
- •Кодування звукової інформації
- •Основні структури даних
- •Лінійні структури (списки даних, вектори даних)
- •Ієрархічні структури даних
- •Впорядкування структур даних
- •Одиниці вимірювання даних
- •Одиниці зберігання даних
- •Поняття про файлову структуру
20 Лекція 4. Представлення даних в еом
Представлення даних в ЕОМ
Операції з даними
Кодування даних двійковим кодом
Кодування текстових даних
Кодування графічних даних
Кодування звукової інформації
Основні структури даних
Лінійні структури (списки даних, вектори даних)
Таблиці даних, матриці даних
Ієрархічні структури даних
Впорядкування структур даних
Файли і файлова структура
Поняття про файлову структуру
Одиниці представлення даних
Одиниці вимірювання даних
Одиниці зберігання даних
Операції з даними
В ході інформаційного процесу дані перетворюються з одного вигляду в іншій за допомогою спеціальних методів. Обробка даних включає безліч різних операцій. У структурі можливих операцій з даними можна виділити наступні основні:
• збір даних — накопичення інформації з метою забезпечення достатньої повноти для ухвалення рішень;
• формалізація даних — приведення даних, що поступають з різних джерел, до однакової форми, щоб зробити їх порівняними між собою, тобто підвищити їх рівень доступності;
• фільтрація даних — відсіювання «зайвих» даних, в яких немає необхідності для ухвалення рішень; при цьому повинен зменшуватися рівень «шуму», а достовірність і адекватність даних повинні зростати;
• сортування даних — впорядкування даних за заданою ознакою з метою зручності використання; підвищує доступність інформації;
• архівація даних — організація зберігання даних в зручній і легкодоступній формі; служить для зниження економічних витрат по зберіганню даних і підвищує загальну надійність інформаційного процесу в цілому;
• захист даних—комплекс мерів, направлених на запобігання втраті, відтворення і модифікації даних;
• транспортування даних—прием і передача (доставка і постачання) даних між видаленими учасниками інформаційного процесу; при цьому джерело даних в інформатиці прийнято називати сервером, а споживача — клієнтом;
• перетворення даних — переклад даних з однієї форми в іншу або з однієї структури в іншу. Перетворення даних часто пов'язане із зміною типу носія, наприклад книги можна зберігати в звичайній паперовій формі, але можна використовувати для цього і електронну форму, і мікрофотоплівку. Необхідність в багатократному перетворенні даних виникає також при їх транспортуванні, особливо якщо вона здійснюється засобами, не призначеними для транспортування даного виду даних. Як приклад можна згадати, що для транспортування цифрових потоків даних по каналах телефонних мереж (які спочатку були орієнтовані тільки на передачу аналогових сигналів у вузькому діапазоні частот) необхідне перетворення цифрових даних в якусь подібність звукових сигналів, чим і займаються спеціальні пристрої — телефонні модеми.
Кодування даних двійковим кодом
Для автоматизації роботи з даними, що відносяться до різних типів, дуже важливо уніфікувати їх форму уявлення — для цього зазвичай використовується прийом кодування, тобто вираз даних одного типу через дані іншого типу. Природні людські мови — це не що інше, як системи кодування понять для виразу думок за допомогою мови. До мов близько примикають азбуки (системи кодування компонентів мови за допомогою графічних символів). Історія знає цікаві, хоча і безуспішні спроби створення «універсальних» мов і азбук. Мабуть, безуспішність спроб їх впровадження пов'язана з тим, що національні і соціальні утворення природним чином розуміють, що зміна системи кодування суспільних даних неодмінно приводить до зміни суспільних методів (тобто норм має рацію і моралі), а це може бути пов'язано з соціальними потрясіннями.
Та ж проблема універсального засобу кодування досить успішно реалізується в окремих галузях техніки, науки і культури. Як приклади можна привести систему запису математичних виразів, телеграфну азбуку, морську азбуку прапорця, систему Брайля для сліпих і багато що інше.
Своя система існує і в обчислювальній техніці — вона називається двійковим кодуванням і заснована на представленні даних послідовністю всього двох піків: 0 і 1. Ці знаки називаються двійковими цифрами, по-англійськи — binary Hgil або скорочено bit (битий).
COMPUTER
43 4F 4D 50 55 54 45 52 Код ASCII
— •. --_ .... .——. .._ - . .... Код морзе
Код Брайля
Код морський сигнальний
її у в» в» в її в
у в єв в єв
у у в єв у в
Мал. 1.2. Приклади різних систем кодування
Бітом можуть бути виражені всього два поняття: 0 або 1 (та або пет, чорне або біле, істина плі брехня і т. п.). Якщо кількість бітів збільшити до двох, то вже можна виразити чотири різні поняття:
00 01 10 11
Трьома бітами можна закодувати вісім різних значенні:
000 001 010 011 100 101 110 111
змінюючи на одиницю кількість розрядів в системі двійкового кодування збільшуємо в два рази кількість значень, яка може бути виражене в даній системі, тобто загальна формула має вигляд:
N=2m
де N — кількість незалежних кодованих значень;
т — розрядність двійкового кодування, прийнята в даній системі.
Кодування цілих і дійсних чисел
Цілі числа кодуються двійковим кодом досить просто — досить узяти ціле число і ділити його навпіл до тих пір, поки приватне не дорівнюватиме одиниці. Сукупність залишків від кожного ділення, записана справа наліво разом з (оследним приватним, і утворює двійковий аналог десяткового числа.
19:2 = 9+1
9:2=4+1
4:2=2+0
2:2=1+0
Таким чином, 19ш= 100112.
(для кодування цілих чисел від 0 до 255 досить мати 8 розрядів двійкової коди (8 битий). Шістнадцять біт дозволяють закодувати цілі числа від 0 до 65 535, 24 бита — вже більше 16,5 мільйонів різних значень.
для кодування дійсних чисел використовують 80-розрядне кодування. При цьому число заздалегідь перетвориться в нормалізовану форму:
3,1415926 = 0,31415926*101
300 000 = 0,3*106
123 456 789 = 0,123456789 *1010
перша частина числа називається мантисою, а друга — характеристикою. Велику частину з 80 біт відводять для зберігання мантиси (разом із знаком), деяку фіксовану кількість розрядів відводять для зберігання характеристики (теж із знаком).