Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

EKh / конспект ММ / 2-2-Інформація

.doc
Скачиваний:
12
Добавлен:
20.02.2016
Размер:
108.54 Кб
Скачать
    1. Інформація та інформаційні процеси

2.2.1. Загальні характеристики інформації.

В кібернетичних системах здійснюються процеси, які можна віднести до трьох категорій – матеріальні (наприклад, хімічні перетворення в технологічній послідовності операцій), енергетичні (на здійснення будь-яких процесів потрібно витрачати енергію) та інформаційні (обмін інформацією з системою управління). Таким чином, інформація є невід’ємним елементом функціонування управляємих систем, і тому потрібно розуміти її характеристики, орієнтуватись в тому, які процеси здійснюються за її участю і які вимоги до неї ставить система управління.

Інформація відображує таку властивість об’єкта , як різноманітність– чим більш різноманітний об’єкт (кількість вимірюваних параметрів, кількість станів по кожному з параметрів), тим більше слів потрібно використати для його описання і тим більше об’єм інформації.

Інформація, на відміну від матерії та енергії, не підлягає дії закону збереження – вона може утворюватись чи зростати, і може зникати.

Поняття інформації має сенс лише в сполученні з поняттям «управління». Будь-які знання запам’ятовують для того, щоб використати для якоїсь мети, а це і є елемент управління. В неорганічному світі інформація цілеспрямовано не використовується. В найпростіших біологічних організмах вже є механізми використання інформації з навколишнього середовища (наприклад, реакція рослин на зміну температури або освітленості). Найвищого рівня здатність видобувати інформацію розвинена у людини.

Інформація нематеріальна сама по собі, але проявляється завжди в матеріальній формі – на матеріальних носіях.

Носій інформації – це фізичний процес (наприклад, струм в провіднику, звукові чи світлові хвилі) або фізичний об’єкт (папір, дискета, магнітна стрічка).

Сигнал – це сукупність повідомлення та його фізичного носія . Повідомлення – сама інформація, яка міститься на носії.

Мова – система, яка пов’язує носія та повідомлення.. Мова містить чотири головних елементи:

  • знаки (букви, звуки, цифри);

  • слова ( сполучення знаків, які мають смислове значення);

  • словник (повний комплект слів та їх значень);

  • граматика, або синтаксис – правила використання букв та знаків.

Сучасна теорія інформації, основи якої були закладені американським математиком Клодом Шенноном в 1949 р, розглядає і аналізує різні питання інформатики на 3-х рівнях:

  • синтаксичний рівень аналізує внутрішні властивості мови як системи букв (знаків). Параметрами цього рівня є кількість знаків, кількість слів у мові, швидкість передавання інформації через канали зв’язку. Ці проблеми важливі для техніки зв’язку , економічності передавання інформації та роботи обладнання, бо чим більший потік знаків через канал зв’язку, тим більші економічні, енергетичні та матеріальні витрати. Завдання теорій інформатики синтаксичного рівня – оптимізація і економічність передавання інформації, мовні механізми її захисту від пошкодження в каналі зв’язку .

  • семантичний (змістовний) рівень. На цьому рівні розглядаються проблеми відношень між словами та змістом. Головна мета теорій цього рівня – оцінювання кількості інформації в повідомленні.

  • Прагматичний (практичний) рівень - оцінювання інформації з точки зору системи управління, коли важливим є лише зміст інформації та його практичні характеристики – актуальність (важливість і своєчасність), точність, повнота, цінність з точки зору ефективності управління. Математичне моделювання – це робота з інформацією (вхідними даними) на прагматичному рівні.

Вимірювання кількості інформації. Одиниця вимірювання кількості інформації на синтаксичному рівнібіт (від binary digitдвійкова одиниця). Біт – найменша кількість інформації, яка міститься в повідомленні «так» або «ні». Використовують і інші одиниці вимірювання кількості інформації на синтаксичному рівні:

  • 1 Байт = 8 біт. Це довжина кодового слова в перших поколіннях ЕОМ.

  • 1 кілобайт (Кб) = 210 = 1024 байт = 8192 кілобіт ( 1000 байт).

  • 1 мегабайт (Мб)= 106 байт

Частіше в техніці використовують одиницю «байт», яка дорівнює 8 біт.

Розглянемо штучну (машинну) «мову», створену для дискретного періодичного передавання показань термометра з температурним інтервалом 0-128 оС від вимірювального приладу до управляючої системи. Мову оберемо двійкову, тобто вона має лише два знаки (букви)– «0» та «1», які є синонімами виразів звичайної мови «ні» і «так». Кількість слів мови (словник) – 128, якщо сусідні значення температури відрізняються на 1 оС. Потрібно визначити довжину одного слова мови, тобто кількість знаків-букв в слові – порції інформації, яка відображує значення температури в переданому сигналі-слові. Вимога до мови – слова повинні відрізнятись між собою щонайменше однією буквою.

Проілюструвати механізм вирішення цієї задачі можна простим прикладом, показаним на рис.3.1. Припустимо, що потрібно передати значення температури 70 оС з точністю до 1оС, перетворене в форму одного слова мови. Слово складається лише з нулів та одиниць. Завдання полягає в тому, щоб визначити, скільки там має бути знаків, і як вони повинні бути розташовані.

Щоб відповісти на це питання, досить було б задати 7 питань, на які відповідь має складатись лише з двох значень – «так» або «ні», 0 або 1 (рис. 3.1).

Рис.2.2.1. Схема двійкового кодування повідомлення

Розділимо інтервал, в якому може знаходитись відповідь, на дві частини Перше запитання записане на рисунку в нижньому рядку: чи знаходиться температура в лівій половині повного інтервалу 1-128 оС, тобто на ділянці 1-64 оС ? Негативна відповідь дає першу букву слова – «0», і інформацію про те, що вірне значення розташоване в правій половині інтервалу, 65-128 оС. Далі аналогічну процедуру повторюємо для інтервалу 65-128 оС, поділивши його надвоє точкою 96 оС і одержуємо другу букву «1» в слові. Зрозуміло, що в повному інтервалі можливих температур 1-128 оС потрібно задати стільки запитань, скільки разів потрібно виконати ділення надвоє, щоб досягти ширини інтервалу 1оС. Можна бачити, що ділень потрібно 7, а це і означає довжину слова – 7 біт, саме ж слово має вигляд 0111011.

Якщо точність оцінювання температури збільшити вдвічі (відстань між сусідніми значеннями 0.5 оС ), зросте і кількість «слів»- сигналів вдвічі, до 256. Але довжина слова зросте лише на 1 біт і буде дорівнювати 8 біт.

Співвідношення між максимальною кількістю слів мови N, довжиною слова H і кількістю знаків-букв S дає відома формула Хартлі, яку можна записати в ступеневій або логарифмічній формі:

або (2.2.1)

В формулі Хартлі всі значення мають однакову імовірність. Якщо ж урахувати в наведеному прикладі, що окремі значення температури мають різну імовірність, можна суттєво скоротити довжину слова. Наприклад, якщо справа ідеться про температуру навколишнього середовища, то можна відкинути значення температур, які перевищують 60оС, тоді кількість слів N буде меншою. Точно це завдання вирішується за формулою Шеннона, яка враховує імовірність р1, р2, …рN кожного з n=1…N повідомлень

. (2.2.2)

Формула Хартлі є частковим випадком формули Шеннона. Дійсно, якщо всі імовірності мають однакове значення p=1/N, тоді одержуємо:

. (2.2.3)

На рис.2.2.2 наведено графік функції, яка входить в квадратні дужки в формулу Шеннона (2.2.3).

Рис.2.2.2 Залежність кількості інформації, яку несе повідомлення, від його імовірності.

З графіка можна зробити важливий висновок, який робить поняття інформації більш зрозумілим: повідомлення, яке має імовірність «0» ( стан неможливий) або «1» (стан достовірний, як 22=4) – ніякої інформації не несуть, і їх використання для цілей управління не дає ніякої користі. Отже, інформаціяце виключно такі повідомлення, які знімають з об’єкта невизначеність.

В теорії інформації величину «Н», яка визначається за формулами Хартлі або Шеннона, називають «ентропія інформації». Цей термін означає повну кількість потенціального знання, яке до одержання повідомлення ще є «незнанням». Н – апріорна величина, яку можна підрахувати, взагалі не одержуючи повідомлення, вона є лише наслідком властивостей даної мови. А інформація, яка міститься в повідомленні – це та частина невизначеності («незнання»), яку повідомлення знімає з об’єкта. Вона є різницею між початковою та кінцевою ентропією, яка залишилась після одержання повідомлення:

. (2.2.4)

В частковому випадку, коли повідомлення вичерпне, кінцева ентропія дорівнює нулю, а І=Н. Але можлива ситуація, коли повідомлення неповне або неточне, тоді в загальному випадку І Н0 . Наприклад, якщо датчик температури дає підвищену помилку, не 1 оС, як передбачено, а 4оС, НК=2 біт, і кількість одержаної інформації буде І=7-2=5 біт.

Таким чином з наведених прикладів зрозуміло, що кількість циркулюючої в системах управління інформації – це величина, яка залежить від структури самої системи управління. Чим вона складніша (містить більшу кількість параметрів, більшу кількість вимірюваних станів) – тим більший об’єм інформації, але тим точнішими і кращими будуть результати управління.

2.2.2. Інформаційні процеси

Формування інформації. Вхідну інформацію для систем управління (а для об’єкта вона є вихідною) формують різноманітні вимірювальні прилади. Кожний з них формує сигнал, який несе зашифроване на відповідному носії повідомлення . В сигналі інформація зашифрована інформаційним параметром.

З точки зору інформатики і незалежно від типу носія, сигнали відрізняються типом інформаційного параметра і характером сигналу.

Інформаційних параметрів використовують головним чином три типи:

  • амплітуда (величина, або числове значення параметра);

  • частота коливань параметра з постійною амплітудою;

  • фаза (положення сигнала-імпульса на точно визначеному відрізку часу - такті).

Рис. 2.2.3. Типи інформаційних параметрів: амплітуда (а), частота (б) і фаза (в)

Сам сигнал може бути в двох формах – безперервним (аналоговим) або дискретним (періодичним). При цьому безперервність або навпаки дискретність може бути як по амплітуді, так в часі.

Рис. 2.2.4. Сигнали, дискретні і безперервні за часом (а) і амплітудою (б)

Безперервний (аналоговий) сигнал такий, що значення інформаційного параметра можуть бути будь-яким числом, а сусідні значення відрізняються нескінченно малими величинами. Безперервний в часі сигнал означає, що прилад дає сигнал в будь-який момент часу (наприклад, діаграмна стрічка на самопишучому приладі)

Дискретність (періодичність) сигналу по амплітуді означає, що існує кінцева кількість рівнів сигналу. Кожний рівень містить в собі деякий кінцевий інтервал  значень амплітуди сигнала. Кількість таких рівнів і є кількістю станів параметра . Наприклад, якщо цифровий термометр дає показання, які представлені лише цілими числами без десяткової частини ( з точністю до 1оС) , то це означає, що сигнали мають дискретні рівні 0-1, 1-2, 2-3, 3-4 оС і т.д. Будь-які нецілі числа такий прилад не розрізняє і вони виявляються в одному з інтервалів.

Дискретність за часом означає, що інформаційний сигнал поступає періодично, з деяким часовим інтервалом . Таку форму мають, наприклад, регулярні записи в журналі спостережень.

Дискретність або безперервність сигналу може бути властивістю об’єкта або властивістю приладу. Наприклад, сигнал напруги електролізера в записі на діаграмній стрічці є безперервним в часі , а в записі в журналі – дискретним. Сигнали про вхід-вихід завантажувального пристрою в лінії гальванопокрить - дискретні і в часі, і по амплітуді (кількість пристроїв, оброблених в лінії за годину).

Існують прилади, які автоматично перетворюють дискретні сигнали в безперервні, і навпаки, безперервні в дискретні – аналого-цифрові та цифро-аналогові перетворювачі. Операція перетворення дискретного сигналу в безперервний виконуються за допомогою математичних операцій апроксимації числового ряду, інтерполяції. Зворотне перетворення називають квантуванням. Необхідність таких операцій зумовлена тим, що ЕОМ працюють з дискретними потоками даних, а прилади (датчики та виконавчі механізми типу електродвигунів) – з безперервними електричними сигналами .

Кодування інформації. Кодуванням інформації називають переклад повідомлення з одного носія на інший. Процес кодування здійснюється, наприклад, коли струм в телефонному провіднику перетворюється спочатку в механічні коливання мембрани, а потім коливання мембрани – в звукові коливання повітря. Кодом можна назвати будь-яку мову або комп’ютерну програму. Кодуванням є також розглянутий вище процес перетворення сигнала від електричного термометра в двійкову форму.

Кодування в техніці є процесом на синтаксичному рівні – воно виконується як механічна операція, заснована на властивостях мови, і не зачіпає змісту повідомлення.

В теоріях кодування використовуються формули Хартлі і Шеннона. Завдання теорії кодування в проектуванні різних кібернетичних систем – створити код (мову), яка була б досить економічною і одночасно захищеною від спотворень. Якщо в мові, яку ми розглянули для термометра, в повідомленні-слові буде невірним хоч один знак – повідомлення буде помилковим. Захист кодів від порушень заснований на надлишковості коду. Надлишковість – це властивість мови, яка означає, що довжина одного слова HФАКТ перевищує необхідну мінімальну величину Н при заданих значеннях S (кількість букв) та N (кількість слів мови), визначену формулою Хартлі, тому при наявності помилкових букв зміст повідомлення можна прочитати. Звичайні європейські мови надзвичайно надлишкові. При S30 та Н 5 згідно формули Хартлі можна було б очікувати N=305=24.3106 слів у мові, тоді як реально, наприклад, найбільші словники не перевищують 30 тис слів. Таким чином, коефіцієнт надлишковості звичайних мов складає 24.3 106/ 30103  1000! Це і дає можливість використовувати великі скорочення слів і розпізнавати тексти з великою кількістю помилок. В технічних мовах надлишковість набагато менша, але вона є необхідною умовою захисту інформації від пошкоджень, які виникають при передаванні інформації через технічні системи (канали зв’язку). Наприклад, можна кожну букву повторювати тричі, тоді один помилковий символ легко розпізнати.

Передавання інформації. Сукупність технічних засобів, призначених для передавання інформаційних сигналів від джерела до приймача, називають «каналом передачі» або «каналом зв’язку» (рис. 3.4). Елементами каналу зв’язку є технічні пристрої для кодування та декодування сигналів.

.

Рис. 2.2.5. Структура каналу зв’язку для передавання інформації

Швидкість передавання сигналів в каналах обернено пропорційна тривалості одного імпульсу : , і вимірюється в біт/с, її називають «смуга пропускання частот». В електричних лініях зв’язку обмежена мінімальна тривалість одного імпульсу *, а внаслідок цього і максимальна швидкість передавання, бо через наявність електричної ємності та індуктивності провідників короткий імпульс прямокутної форми спотворюється і тому приймач електричних сигналів його не розпізнає.

В каналах передавання сигналів завжди під дією зовнішніх впливів і внутрішніх неконтрольованих процесів виникають шуми (самовільні додаткові сигнали), які і є причиною появи помилок в сигналах. Тому швидкість передавання сигналів насправді менша теоретично можливої. Запобігають цим шкідливим явищам за допомогою технічних пристроїв, наприклад, підсилювачів сигналу, і програмними методами, наприклад, використанням захисних кодів, стійких до зовнішніх пошкоджень.

Зберігання інформації. Інформація не завжди використовується в момент її одержання, найчастіше її потрібно деякий час зберігати. В окремих випадках (музеї, архіви) термін зберігання досягає багатьох років. Тому важливим елементом функціонування будь-яких кібернетичних систем є наявність якісних систем зберігання інформації. Якість техніки зберігання інформації характеризує і якість управління і рівень самої кібернетичної системи . Процес зберігання інформації настільки важливий, що поява принципово нових технічних систем зберігання означає початок нової технічної революції. Таке значення мало винайдення паперу (Єгипет, 2 тисячоліття до н.е.), перфораційної карти для ткацького станка (1741 р, Ада Лавлейс – дочка відомого англійського поета Дж.Байрона, її ім’ям названа одна з мов програмування –АДА), фотографія (1839), кіно (1895), магнітний запис (1928), запис променем лазера (1980).

Існує декілька вимог до системи зберігання.

  • Компактність, тобто висока щільність запису і малий об’єм фізичного носія. На папері щільність запису невисока, одна сторінка типової книги містить приблизно 50-60 рядків і стільки ж букв в рядку, тобто 2500-3000 байт (2.5-3 кілобайт). Дискета 3.5´´ на магнітній плівці вміщує 1.4 мегабайт, тобто приблизно до 500 сторінок звичайного тексту – ціла книга (без малюнків). Дискета з лазерним записом містить вже 700 мегабайт, тобто цілу бібліотеку з 500 книг. Правда, рисунки кодуються інакше, і займають набагато більше пам’яті – високоякісний кольоровий малюнок може мати більше 5-10 Мб, набагато більше, ніж ціла книга (це особливості кодування різнотипної інформації на синтаксичному рівні).

  • Надійність. Це важлива властивість, яка означає стійкість носія до зовнішніх впливів і внутрішніх процесів. Вона особливо важлива для систем тривалого зберігання. Дуже надійними були неолітичні системи збереження інформації - малюнки, вибиті на кам’яних стінах печер та скель, вони збереглись протягом десятків тисяч років. Такі ж надійні шумерські таблички з обпеченої глини, які збереглись протягом 3-4 тисяч років. На жаль, інформаційна ємність таких технічних систем дуже низька (на синтаксичному рівні, на відміну від також надзвичайно високої змістовної ємності на семантичному рівні). Відомі проблеми тривалого зберігання паперових документів – окислення, старіння, дія біологічних чинників, вологи, освітлення, тощо. Магнітна стрічка також недосить стійка. Полімерний носій (лавсанова плівка) з часом втрачає механічні властивості і стійкість, магнітний шар руйнується механічно, інформація на магнітному шарі руйнується під впливом електромагнітних полів полів, радіаційних випромінювань. Лазерні диски також вимагають дуже обережного поводження, їх полімерна основа з часом здатна руйнуватись, не витримує механічних пошкоджень і різких температурних впливів, може втратити прозорість. Робочий шар також дуже чутливий до механічних впливів. Ідеально надійної системи зберігання інформації не існує.

  • Сумісність. Ця властивість може бути представленою як «читабельність» - вона означає здатність повідомлення на даному носії до того, щоб бути зчитаним різними користувачами – людиною, різними ЕОМ, іншими машинами (сканер). З точки зору сумісності паперові документи якісні – їх здатна читати людина, ЕОМ (через сканер), факс. Розвиток інформаційних технологій призвів до високої спеціалізації нових сучасних систем запису та зчитування інформації, тобто погіршення сумісності. Модернізація техніки і програмного забезпечення створює нову проблему – інформація, записана на фізичних носіях раніше, може не читатись на нових ЕОМ або новими програмами і стає недоступною для використання, тобто фактично втрачається, незважаючи на фізичну непошкодженість.

  • Швидкість доступу. Ця властивість особливо важлива для виконання управлінських функцій. З точки зору швидкості доступу до інформації різні носії відрізняються на багато порядків. В бібліотеках час доступу складає хвилини –години, на зовнішніх магнітних носіях – до 10-2 с, лазерних – до 10-5 с, а на електронних мікросхемах – до 10-7 с.

Представлення інформації. Інформація-сигнал на виході каналу зв’язку може бути представлена в різній формі (на різних носіях), в залежності від того, хто чи що є одержувачем. Одержувачем може бути людина, тоді інформація може бути представлена на екрані монітора, на папері, на фотоплівці. У випадку, коли інформаційний сигнал призначений для використання технічними пристроями, він має відповідну закодовану структуру команди для даного пристрою (наприклад, системи комп’ютерного управління технологічними процесами).

Переробка інформації. Це найважливіший інформаційний процес, який здійснюється на більш складному семантичному (змістовому) рівні. В цьому процесі змінюється сама інформація – з вхідної вона перетворюється в нову інформацію (народжується нова інформація).

Існують три типи процесів переробки інформації.

  • Перетворення інформації. Це процес перетворення вхідної інформації за визначеними математичними алгоритмами. Саме до цього типу належить математичне моделювання, де вхідні дані х1…хМ перетворюються в вихідні Y1, Y2,Y3…YN, а також алгоритми перетворення сигналів вимірювальних приладів в числові значення рівнів параметрів. Наприклад, перетворення сигналу електричного термометра (напруга) в значення температури, апроксимація дискретного ряду показань в безперервний, тощо.

  • Класифікація та логічний аналіз. Процес аналогічний тому, який відбувається в бібліотеці – розподіл інформації на групи за сформульованими ознаками, для зручності збереження і пошуку.

  • Пошук інформації. Процес, зворотний по відношенню до класифікації. Два останніх процеси здійснюються на основі положень математичної логіки. Існують спеціальні алгоритмічні мови для програмування логіко-математичних операції. Вони використовуються для побудови систем управління комп’ютерними базами даних , алгоритмів штучного інтелекту, адаптивних алгоритмів управління, тощо.

Використання інформації. Цей інформаційний процес здійснюється вже на найвищому прагматичному рівні, він являє собою використання повідомлень (незалежно від типу носія) для цілей управління. Інформація, тобто відокремлене від носія повідомлення використовується управляючою системою в математичній моделі об’єкта управління. Властивості інформації на цьому рівні – актуальність, повнота, точність.

Академік АН України В.М.Глушков вперше сформулював поняття про два інформаційних бар’єри, які виникають в кібернетичних системах в процесі використання інформації.

  • Якщо потік вхідної інформації перевищує швидкість її переробки управляючою системою, надлишкова її частина не може бути використана для управління і ігнорується (бар’єр насичення).

  • Ресурси кібернетичної системи (енергетичні, матеріальні, фінансові) розподіляються на дві частини – на виконання головної функції об’єкта і на управління. В процесі функціонування кібернетичної системи з часом зростає об’єм циркулюючої інформації і як наслідок –витрати ресурсів на цей процес. Витрати здійснюються за рахунок виконання головної функції. При таких умовах наступає момент, коли всі ресурси витрачаються на управління, а головна функція не буде виконуватись (бар’єр розвитку).

Вказані два бар’єри описують механізми негативних явищ, які потрібно враховувати при проектуванні і експлуатації технічних систем.

Соседние файлы в папке конспект ММ