Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Дискретные модели данных текст,графика, звук.doc
Скачиваний:
24
Добавлен:
11.07.2019
Размер:
98.82 Кб
Скачать

§20 Дискретные модели данных в компьютере. Представление текста, графики и звука

В этом параграфе обсудим способы компьютерного кодирования тек­стовой, графической и звуковой информации. С текстовой и графической информацией конструкторы ЭВМ «научили» работать машины, начиная с третьего поколения (1970-е годы). А работу со звуком «освоили» лишь машины четвертого поколения, современные персональные компьютеры. С этого момента началось распространение технологии мультимедиа.

Что принципиально нового появлялось в устройстве компьютеров с освоением ими новых видов информации? Главным образом, это перифе­рийные устройства для ввода и вывода текстов, графики, видео, звука. Процессор же и оперативная память по своим функциям изменились мало. Существенно возросло их быстродействие, объем памяти. Но, как это было на первых поколениях ЭВМ, так и осталось на современных ПК — основным навыком процессора в обработке данных является уме­ние выполнять вычисления с двоичными числами. Обработка текста, гра­фики и звука представляет собой тоже обработку числовых данных. Если сказать еще точнее — то это обработка целых чисел. По этой причине компьютерные технологии называют цифровыми технологиями.

О том, как тексты, графика и звук сводятся к целым числам, будет рас­сказано дальше. Предварительно отметим, что здесь мы снова встретимся с главной формулой информатики:2l = N.

Смысл входящих в нее величин здесь следующий: i — разрядность ячейки памяти (в битах), iV — количество различных целых положитель­ных чисел, которые можно записать в эту ячейку.

Текстовая информация

Принципиально важно, что текстовая информация уже дискретна — состоит из отдельных знаков. Поэтому возникает лишь технический воп­рос, как разместить ее в памяти компьютера.

Напомним о байтовом принципе организации памяти компьютеров, об­суждавшемся в базовом курсе информатики. Вернемся к рис. 4.7. Каждая клеточка на нем обозначает бит памяти. Восемь подряд расположенных битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера. Именно по адресам про­цессор обращается к данным, читая или записывая их в память (рис. 4.12).

байт № 1 байт № 2

Рис. 4.12. Байтовая организация памяти

Модель представления текста в памяти весьма проста. За каждой бук­вой алфавита, цифрой, знаком препинания и иным общепринятым при записи текста символом закрепляется определенный двоичный код, дли­на которого фиксирована. В популярных системах кодировки (ASCII, KOI8 и др.) каждый символ заменяется на 8-разрядное целое положитель­ное двоичное число; оно хранится в одном байте памяти. Это число являет­ся порядковым номером символа в кодовой таблице. Согласно главной формуле информатики, определяем, что размер алфавита, который мож­но закодировать, равен: 28 = 256. Этого количества вполне достаточно для размещения двух алфавитов естественных языков (английского и русского) и всех необходимых дополнительных символов.

Поскольку в мире много языков и много алфавитов, то постепенно со­вершается переход на международную 16-битовую систему кодировки Unicode. В ней каждый символ занимает 2 байта, что обеспечивает 216 = 65 536 кодов для различных символов.

При работе с электронной почтой почтовая программа иногда нас спрашивает, не хотим ли мы прибегнуть к кодировке Unicode для пере­сылаемых сообщений. Таким способом можно избежать проблемы несо­ответствия кодировок, из-за которой иногда не удается прочитать рус­ский текст.

Не следует представлять себе текст, хранимый в памяти компьютера или на внешнем носителе, лишь как поток байтов, каждый из которых яв­ляется лишь кодом символа текста. Форматы хранения текстовой инфор­мации определяются форматами текстовых файлов, используемых той или иной программой обработки текстов. Файлы, создаваемые с по­мощью текстовых процессоров (например, Microsoft Word), включают в себя не только коды символов алфавита, но и данные формата: тип и раз­мер шрифта, положение строк, поля и отступы и прочую дополнительную информацию.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]