Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по информатике_new.doc
Скачиваний:
41
Добавлен:
15.08.2019
Размер:
1.35 Mб
Скачать

Что такое информация, ее представление в эвм

Понятие "информация"

Слово информация произошло от латинского слова informatio, что означает разъяснение, изложение.

Определения

Информация - это отображение реального мира с помощью сведений (сообщений).

Сообщение - это форма представления информации в виде текста, речи, изображений, цифровых данных, графиков, таблиц и т.д.

Можно сказать, что информация - это сведения об объектах и явлениях окружающей среды. Например, экономическая информация - это совокупность сведений, отражающих социально-экономические процессы, таможенная информация - это совокупность сведений, отражающих таможенную политику (таможенный контроль и регулирование товарообмена) на таможенной территории Российской Федерации, правовая информация - это совокупность сведений, отражающих социально-правовые процессы и т.д.

Наряду с термином "информация" в информатике используется понятие "данные". Это понятие уже, чем информация, т.к. представляет отрывочные, не связанные между собой сведения. Однако в работе с компьютерными программами чаще употребляется термин "данные".

В технологическом процессе обработки данных можно выделить 4 этапа:

  1. Формирование первичных данных - первичные сообщения о хозяйственных операциях, документы, содержащие нормативные и юридические акты, результаты экспериментов, например, параметры новой модели самолета или автомобиля и т.д.

  2. Накопление и систематизация данных, т.е. организация такого размещения данных, которое обеспечило бы быстрый поиск и отбор нужных сведений, методическое обновление данных, защиту от искажений и т.д.

  3. Обработка данных - процессы, в результате которых на основе ранее накопленных данных формируются новые виды данных - обобщающие, аналитические, рекомендательные, прогнозные и т.д. Эти данные вторичной обработки могут быть подвергнуты следующей обработке и принести более глубокие, точные обобщения.

  4. Отображение данных - представление данных в форме, удобной для человека. Это вывод на печать, графические изображения (иллюстрации, графики, диаграммы и т.д.), звук и т.д.

Сообщения, формируемые на первом этапе, могут иметь разный вид: обычный бумажный документ, звук, видео, числовые данные на каком-то носителе. Как правило, носители первичной информации (физические носители, полученные от аналоговых устройств) - бумага, пластинки, кассеты, видеокассеты очень недолговечны.

Компьютерные технологии предлагают принципиально новый подход - цифровое (дискретное) представление информации на магнитных и лазерных носителях. Посредством технических и программных средств ЭВМ первичные данные преобразуются в машинный код.

Данные характеризуются своим типом и множеством операций над ними. Данные в компьютере условно делятся на простые и сложные.

Примеры простых данных, которые может обрабатывать компьютер:

Типы данных

Операции

Числа (числовые данные)

Все арифметические операции

Тексты (символьные данные)

Замещение, вставка, удаление символов, сравнение, конкатенация строк

Логические (бинарные) данные

Все логические операции (конъюнкция, дизъюнкция, отрицание и др.)

Изображения: рисунки, графика, анимация (графические данные)

Операции над пикселями, из которых состоит изображение: яркость, цвет, контрастность

Видео данные

Удаление фрагмента, вставка фрагмента, работа с кадрами

Аудио данные

Усиление, уменьшение, удаление фрагмента, вставка фрагмента

К сложным данным относятся: массивы и списки (однотипные), структуры, записи, таблицы (разнотипные). Такие сложные данные, как правило, могут содержать числа, текст, графику, анимацию, видео и т.д.

Представление информации в ЭВМ

Понятие систем счисления

Определения

Система счисления - это способ наименования и изображения чисел с помощью символов, имеющих определенные количественные значения.

В зависимости от способа изображения чисел системы делятся на позиционные и непозиционные.

В позиционных системах количественное значение каждой цифры зависит от места (позиции) в числе.

В непозиционных системах цифры не меняют своего количественного значения при изменении их расположения в числе.

Примеры,

позиционная система - арабская десятичная система (0 - 9),

непозиционная - римская, где для каждого числа используется специфическое сочетание символов XIV, CXXVII и т. д.

Информация в ЭВМ кодируется в двоичной и двоично-десятичной форме.

В двоичной системе любое число представляется комбинацией 0 и 1, что является очень удобным с точки зрения физики (два состояния: есть сигнал или нет сигнала, включено - выключено и т.д.).

Двоично-десятичная система получила широкое распространение в современных ЭВМ ввиду легкости перевода в десятичную систему и обратно. В этой системе все десятичные числа кодируются четырьмя двоичными цифрами и в таком виде записываются последовательно друг за другом.

При программировании иногда используется шестнадцатеричная система. Перевод из нее в десятичную - прост. Выполняется так же как из двоичной в десятичную.

Таблица кодов десятичных и шестнадцатеричных цифр в двоичной системе

Цифра

0

1

2

3

4

5

6

7

8

9

А

В

С

D

E

F

Код

0000

0001

0010

0011

0100

0101

0110

0111

1000

1001

1010

1011

1100

1101

1110

1111

Независимо от типа информации, кодируется она в виде элементарных единиц памяти, принимающих значения 0 или 1 и называемых битами.

Определения

Бит (binary digit -bit) - это двоичный разряд, принимающий значения 0 или 1.

Байт (byte)- это единица представления одного символа информации, состоящая из 8-ми бит.

Байт служит также единицей измерения компьютерной информации, но когда счет идет на сотни тысяч и миллионы байт, то используются более крупные единицы, килобайты, мегабайты, гигабайты, терабайты и т.д.

1 Кбайт=1024 байт (210)

1 Мбайт=1024 Кбайт (220)

1 Гбайт=1024 Мбайт (230)

1 Тбайт=1024 Гбайт (240).

Для представления символов используются кодовые таблицы, в которых каждой букве, цифре или служебным знакам соответствует какой-либо код - десятичное число в диапазоне от 0 до 255. Таким образом, можно закодировать 256 символов, поскольку каждый символ - это 8 разрядов, то число возможных перестановок равно 28=256.

Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange), в которой кодируется ровно половина символов от 0 до 127.

Вторая половина не определена американским стандартом и предназначена для размещения символов национальных алфавитов (в частности кириллицы), псевдографических символов и некоторых математических знаков.

Таким образом, кодовая таблица ASCII состоит из основного стандарта и расширенного стандарта, который для различных операционных систем может различаться.

Основной стандарт содержит десятичные коды от 0 до 127 (или шестнадцатеричные коды 00 - 7F), расширенный - десятичные коды от 128 до 255 (или шестнадцатеричные коды 8F - FF).

Основной стандарт

0

Цифры, знаки

Буквы латинского алфавита

127

Расширенный стандарт DOS

Расширенный стандарт Win

128

Буквы национальных алфавитов

Символы псевдографики

255

128

Символы псевдографики

Буквы национальных алфавитов

255

Например, "0" - соответветствует десятичному коду 00, "." - соответветствует десятичному коду 46, латинская буква "А" - соответствует десятичному коду 65, строчная буква "q" - соответствует десятичному коду 113.

Основной стандарт является общепринятым в мире, а расширенный в зависимости от операционной системы может меняться, поэтому для кодирования русских букв существуют и другие кодовые таблицы, например КОИ - 8 (код для обмена информацией).

В настоящее время ведущими фирмами предложена новая система кодировки символов Unicode (Universal Code), в которой каждый символ кодируется не одним, а двумя байтами, один из которых содержит сведения о языке принадлежности символа. Правда, объем информации увеличивается вдвое, но зато можно избавиться от множества программ-перекодировщиков.