
- •Раздел 1. Базовые понятия информатики. Аннотация
- •Структура информатики
- •Програма
- •Информационные технологии.
- •1.2. Информация, данные, знания.
- •Свойства информации
- •1.4. Виды информации
- •1.5. Формы представления информации
- •Машинное представление.
- •1.7. Меры качества и количества информации
- •Статистическая (энтропийная) мера.
- •Можно сформулировать содержательные требования к h(хi).
- •Вопросы для самопроверки
1.4. Виды информации
Классификация информации представляет интерес с позиции систематизации способов работы с ней. Детальная классификация может быть осуществлена только для фиксированной предметной области, фиксированного класса задач. В данном случае ограничимся классификацией необходимой для обзорного изложения средств информатики.
По характеру:
- качественная (например, цвет, название объекта),
- количественная (рост, вес, …).
Качественная информация по своей природе дискретна и представляется конечным числом значений.
Количественная информация может быть или дискретна или не прерывна (аналоговая).
Современные компьютеры (ЭВМ) работают в основном с дискретной информацией. В связи с этим при использовании ЭВМ для работы с непрерывной информацией возникают вопросы перехода от непрерывной к дискретной форме представления и наоборот.
1.5. Формы представления информации
Машинное представление.
Для представления в ЭВМ дискретной информации применяется алфавитный способ, основанный на использовании конечного набора символов любой природы, называемого алфавитом (алфавит естественного языка, совокупность десятичных цифр). Символы алфавита – буквы. Любая конечная последовательность букв – слово.
Системой счисления называется совокупность правил поименования и записи чисел.
Системы счисления различаются набором базисных чисел и правилами образования из них других чисел. В настоящее время используются в основном позиционные системы счисления. (Значение каждой цифры поставлено в зависимости от того места, где она стоит в изображении числа).
Десятичная запись любого числа х в виде полинома.
Х=аn*10n+an-1*10n-1+…a1*101+a0*100+a-1*10-1+…+a-m*10-m+…
Например, 445.21
4*102+4*101+5*100+2*10-1+1*10-2
Основание десятичной системы -0,1,2,3,4,5,6,7,8,9
Двоичная система счисления.
Х=an*2n+an-1*2n-1+…+a1*21+a0*20+a-1*2-1+…+a-m*2-m+…
Основание двоичной системы -0,1.
Другие системы счисления.
Восьмеричная - базисные числа- 0, 1, 2, 3, 4, 5, 6, 7
83,5=123,48
Форматы данных представляемых в ЭВМ:
1) числа с фиксированной запятой (могут занимать байт или слово) (рис. 1.5.) - последний разряд знаковый диапазон для байта от -12810 до +12 710, для слова от –32768 до +32767. При выполнении арифметических операций числа нормализуются (от –1 до +1). В универсальных ЭВМ такое представление почти не используется из-за накопления ошибок из-за нормализации;
Рис. 1.5. Представление чисел с фиксированной запятой.
числа с плавающей запятой (занимают два слова) (рис. 1.6.)
,
где m-мантисса, P-характеристика
(порядок) числа, N –
основание системы. Если
-
то запись числа нормализована слева.
Если в
первое число после запятой не 0, то число
нормализовано справа.
Нормализованное (справа) число одинарной точности представляется следующим образом: знак числа в бите 15 первого слова (0-положительные, 1- отрицательные числа), порядок - в битах 7-14 первого слова m-мантисса занимает остальные 23 бита в двух словах.
Рис.1.6. Представление чисел с плавающей запятой.
Нормализованное число двойной точности записывается в четыре слова. Под мантиссу отводится 55 бит.
Арифметические операции для чисел с плавающей запятой намного сложнее, чем для чисел с фиксированной запятой. Однако, накопление ошибок меньше.
1.6. Смена форм представления информации
1.6.1. Кодирование - выражение данных одного типа (например, десятичные) через данные другого типа (например, двоичные). В вычислительной технике зачастую используется двоичное кодирование. В быту азбука Морзе, система записи математических выражений.
Может применяться последовательно несколько систем кодирования. Например, названия объектов заменяются на последовательность номеров, номера (десятичные) заменяются двоичным кодом.
- Кодирование числовых данных заключается в переходе из одной системы счисления в другую.
- Кодирование текстовых данных.
Каждому символу ставится в соответствие уникальная комбинация двоичных цифр. Для избежания проблем связанных с передачей информации Американский национальный институт стандартов (ANSI)принял стандартный код для обмена информацией.
Система ASCII(American Standart Code for Information Interchange)
В этом коде комбинация двоичных разрядов используется для представления строчных и прописных букв английского алфавита, знаков пунктуации, цифр от0 до 9, а также кодов управления передачей информации.
В системе ASCII закреплены две таблицы кодирования: базовая (от 0 до 127) и расширенная (от 128 до 255) (7 бит и 8 бит соответственно0
0-31 – управляющие коды
32-127 – коды английского алфавита, знаки препинания и цифры
128-255 – национальные алфавиты
Система Windows 1251 – система кодировки русского языка (к примеру, буква А имеет в этой системе код – 192, буква Б – 193).
KOH – 8 (код обмена информацией восьмизначный).
ISO (International Standart Organization). В этой системе коды А и Б – 176 и 177 соответственно.
- Кодирование графических данных
Растровый способ – разбиение изображения на ячейки и кодирование цвета (яркости) цвета в каждой ячейки.
Векторный способ – представление контуров графического объекта последовательностью точек (их координат).
- Кодирование звуковой информации.
Метод FM (Frequency Modulation) – звук раскладывается на последовательность простейших гармонических сигналов различных частот, каждый из которых представляет правильную синусоиду.
Метод WT (Wave Table) – таблично волновой. Основывается на таблице образцов звуков для различных музыкальных инструментов.