
- •2. Структури и моделі даних. Формати представлення інформації.
- •1. Представлення цифрової інформації - системи числення
- •2. Представлення нечислової інформації - кодування тексту
- •3. Представлення зображення - Два способи кодування зображення растрове и векторне представлення графіки.
- •Загальні підходи до представлення інформації
- •- Формула Шеннона.
- •Даний вираз використовується, якщо події рівноімовірні, а ситуацію або результат можна повністю визначити. Об'ємний підхід
- •Загальна характеристика процесів збору, обробки і передачі інформації
- •Моделювання як метод вирішення прикладних завдань
- •Основные понятия информационного моделирования
- •Связи в информационных моделях
- •Роль математичного моделювання при обробці інформації.
- •История методологии математического моделирования
Загальні підходи до представлення інформації
Існує два основні підходи у визначенні «кількості інформації»:
1. імовірнісний підхід - розвинув американський математик Клод Шеннон
2. об'ємний підхід - виник в результаті створення ЕОМ.
Імовірнісний підхід
Тут вводиться термін ентропія - кількісна міра невизначності. Теорія Шенона описувалася на фундаментальному понятті ентропії і пов'язаного з нею поняття - кількості інформації.
За відсутності невизначеності ентропія = 0, при максимальній невизначеності ентропія повинна досягати максимального значення.
- Формула Шеннона.
m — число повідомлень, i - номер повідомлень, Pi — вероятность i-го повідомлень.
Якщо число повідомлень рівноімовірні, то було введено поняття міри Хартлі - запропонував обчислювати інформацію, яка приходиться на одне повідомлення, яке складається з рівноймовірніх символів через логарифм загального числа можливих повідомлень
.
Даний вираз використовується, якщо події рівноімовірні, а ситуацію або результат можна повністю визначити. Об'ємний підхід
В технічному пристрої найпростіше реалізувати 2 протилежних фізичних стани: намагніченість в двох протилежних напрямах; прилад пропускає струм чи ні; конденсатор, заряджений або розряджений. Тому творці комп'ютерів віддають перевагу двійковій системі числення (0 і 1 - біт).
Біт — найменша одиниця інформації.
Об'єм інформації в двійкових знаках підраховується по кількості двійкових символів:
8 бит - 1 байт; 1024 байт- 1 кбайт; 1024 кбайт - 1 Мбайт; 1024 Мбайт - 1 Гбайт
Між імовірнісною і об'ємною кількістю інформації співвідношення неоднозначне. Не всякий тест, записаний двійковими символами, допускає вимірювання об'єму інформації в кібернетичному сенсі, але допускає його в об'ємному. А якщо якесь повідомлення можна заміряти 2-мя способами, то вони не обов'язково співпадають, при цьому кібернетична кількість інформації не може бути більша за об'ємну.
Загальна характеристика процесів збору, обробки і передачі інформації
Під збором інформації розуміється процес відбору її з навколишнього середовища і введенні її в інформаційну систему (ІС), яка її оброблятиме, зберігатиме і передаватиме. Метою процесу збору інформації є забезпечення готовності інформації до подальшого просування в системі і представлення її в різних формах (кодування сигналу в лінії, символи на дисплеї, віддруковані символи і тому подібне).
Умовно процес збору інформації можна розділити на два методи:
1)механічний збір, який полягає в тому, що джерело інформації (подія, досвід) викликає зміну фізичного стану деякого об'єкту, яка реєструється механічним способом;
2)спостереження, здійснюване людиною, з подальшим відтворенням по пам'яті - реєстрацією.
При механічному зборі інформації, наприклад системою датчиків, міра достовірності отримуваної інформації постійна і заздалегідь відома (що визначається класом точності вимірювального приладу). Механічний збір інформації здійснюється за допомогою датчиків. При цьому розрізняють наступні типи датчиків: механічні, електричні, оптичні, акустичні і випромінюючі. На практиці, як правило, використовують комбінації декількох типів датчиків, наприклад: електромагнітні, фотоелектричні, ультразвукові і тому подібне.
В процесі збору інформація може поступати в інформаційні системи в наступних видах:
1) аналоговий, тобто у вигляді деякої безперервної функції часу, що відображає зміну інформації;
2)дискретну, у вигляді «Так», «Ні», 1, 0, і тому подібне, тобто зміна стану стрибком;
3)кодову або цифрову, коли інформація представляється у формі поєднань «0» і «1», відповідних певним символам.
Під обробкою інформації розуміють її перетворення у вигляд, зручний для подальшого просування в інформаційні системи. Інформація, яка не може бути зібрана механічними засобами, збирається людиною. При цьому простим способом збору інформації є її реєстрація - запис на носії.
Обробка інформації в інформаційний системах розкладається на ряд етапів і здійснюється безпосередньо після реалізації процесу збору інформації.
Першим етапом є перетворення інформації (кодування) у вигляд, властивий даній інформаційній системі. Наприклад, людина, як інформаційна система, не здатна сприймати інформацію у вигляді електромагнітних коливань, і, отже, електромагнітні коливання необхідно представити в акустичні (звукові) коливання або оптичні образи. Для інформаційних систем - це представлення символів у форматі даного типу.
Другим етапом (найбільш важливим) є ідентифікація, розпізнавання інформації. Розпізнавання інформації може здійснюватися:
- за ознаками
- за ідентифікуючими ключами (час, супровідні сигнали і тому подібне)
Найбільш поширений метод розпізнавання по ознаках. В цьому випадку в системі фіксується набір ознак (наприклад, набір поєднань «0» і «1» в коді). Потім отримана інформація порівнюється з фіксованими ознаками і виноситься ухвала про приналежність інформації до того або іншого типу. Найпростіше подібний метод реалізується у вигляді дешифрування коду і використовується для розпізнавання символів.
Для ідентифікації мовних сигналів розроблена спеціальна система ознак: частота основного тону, нестаціонарність і так далі Тут ідентифікація не однозначна.
Набагато складнішою проблемою є ідентифікація графічних образів.
Якщо для ідентифікації використовується ключ (кодове слово, біт ознаки і тому подібне), то використовується тільки один ознака - ключ і ідентифікація однозначна.
Третім етапом є цілеспрямована зміна інформації. Сюди відносять:
- виконання арифметичних операцій - розрахунків;
- доповнення і об'єднання інформації з вже наявною в системі;
- реалізація процедур ухвалення рішення при оцінці інформації від різних джерел (моделювання ситуацій, експертні оцінки і тому подібне)
- представлення інформації в зручному для споживача вигляді (зображення, звук і тому подібне)
Реалізація процедур передачі інформації визначається типом носія інформації, структурою і завданнями інформаційної системи, вимогами до надійності (перешкодозахищеності). Цими вимогами і визначається гранично допустима пропускна спроможність інформаційної системи. Очевидно, що найменшою швидкістю передачі володіє інформаційна система з носіями інформації на папері, а найбільшою - інформаційні системи з оптичними лініями зв'язку. Найбільш поширеним типом носія є електромагнітне коливання (сигнал). Завдання, що вирішуються інформаційною системою, і її структура тісно зв'язані. Передача всередині ЕОМ, при зв'язку 2-х ЕОМ, мережа ЕОМ. Перешкодозахищеність реалізується шляхом надмірного кодування. Тут використовуються коди, які вказують на помилки і виправляють помилки.