Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзаменационные вопросы с ответами.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
12.79 Mб
Скачать
  1. Сжатие информации.

Сжатие данных (data compression) — процесс,
обеспечивающий уменьшение объема данных. может осуществляться как программным, так и аппаратным или
комбинированным методами.

Сжатие текстов связано с более компактным расположением байтов, кодирующих символы. Определенные результаты
дает статистическое кодирование, в котором наиболее часто
встречающиеся символы имеют коды наименьшей длины.

Сжатие изображений (image compression) —

•изображение делится на блоки пикселей, каждый из которых подвергается обработке, устраняющей избыточность;

•осуществляется кодирование с переменной длиной кодов,
что исключает длинные цепочки нулей и единиц в последовательностях битов;

•дополнительное сжатие движущегося изображения за счет
сравнения каждого изображения с предыдущим, чтобы сохранять только изменившуюся его часть.

Допускается потеря той информации, которая считается несущественной. Например, можно
при обработке изображений удалить из аналогового сигнала частоты, которые находятся вне спектра, воспринимаемого глазом
человека. Нередко
допускается игнорирование цвета каждого второго пикселя либо
группа пикселей заменяется одним со средним значением цвета.
Осуществляется также групповое кодирование. Его сущность заключается в кодировании групп одинаковых пикселей. Размер файла сжатого дискретного неподвижного изображения зависит от четырех параметров: площади изображения,
квадрата разрешения, числа бит, необходимых для представления пикселя и коэффициента сжатия. Кодирование видеоинформации. В связи с большим объемом
информации, содержащейся в видеопотоке (до 6 Мбайт/с), для
записи информации в ЭВМ обычно применяют кодирование со
сжатием потока данных на входе с использованием алгоритмов
семейства MPEG/JPEG

Стандарт MPEG (Motion Picture Expert Group) включает несколько компонентов: системного потока, описывающего структуру смешанного аудио- и видеопотока, а также MPEG-video и
MPEG-audio. В случае MPEG-video сжатие достигается за счет четырех
факторов.

  • 1 Вместо элементарных цветов кодируется яркость (luminance,
Y) и цветность (chrominance, U & V), причем цветность «прорежена» по вертикали и горизонтали в 2 раза по сравнению с яркостью

  • 2 
Дискретно-косинусное преобразование с последующим
квантованием Это преобразование переводит
пространственное представление сигнала в частотное. Результат
преобразования подвергается квантованию, т. е. огрублению
точности

  • 3.Устранение временной избыточности с компенсацией движения. для ликвидации избыточности, заключающейся в большой корреляции между соседними кадрами, передается разность между ними.


  • Квазиоптимальное кодирование. Коэффициенты, полученные после DCT, векторы движения
и все остальное кодируются кодами переменной длины. Это кодирование называют квазиоптимальным, поскольку кодовая таблица не строится заново для каждого конкретного случая, а выбрана при разработке стандарта на основе анализа типичных видеопоследовательностей .

  1. Кодирование информации.

первой технологической формой получения, передачи, хранения информации являлось аналоговое (непрерывное) представление звукового, оптического или другого сигнала.

Аналогово-цифровое (дискретное) преобразование – заключается в формировании последовательностей n-разрядных двоичных слов, представляющие с заданной точностью аналоговые сигналы. Для выполнения этого преобразования в начале осуществляется квантование аналогового сигнала. В результате преобразования получается дискретный сигнал. Наименьшее изменение аналогового сигнала, которое регистрируется устройством, осуществляющим преобразование, называется разрешением.

АЦП чаще всего изготавливают в виде интегральных схем. В необходимых случаях осуществляется обратное преобразование.

Дискретный сигнал – сигнал, имеющий конечное (обычно небольшое) число значений. Практически всегда цифровой сигнал имеет два или три значения.

В цифровых системах используют двоичные сигналы, имеющие значения «+» и «-». Вместе с тем, при передаче данных в большинстве случаев применяется троичный сигнал со значениями (+), (-), (0). В такой системе «единица» представляется отсутствием сигнала, в то время, как «ноль» характеризуется положительным либо отрицательным сигналом. При этом полярность импульсов, представляющей нули должна чередоваться, т.е. за положительным импульсом должен следовать отрицательный и наоборот. Дискретные сигналы помехоустойчивы, легко восстановить форму.

Кодирование графической информации

Любой цвет можно представить в виде трех основных цветов: красного, зеленого и синего. В связи с этим цвета кодируются с помощью трех байтов. Первый отвечает за красный цвет, второй – за зеленый, а третий -  за синий. Чем больше значения байта цветовой составляющей, тем выше яркость этого цвета.  Задавая любые значения от 0 до 255 для каждого из байтов, можно закодировать любой из 16.5 млн. цветов.

При кодировании изображение разбивается на точки (пиксели). Чем больше количество таких точек, тем выше качество изображения. Когда рисунок разбит на точки, тогда можно, двигаясь по строкам, закодировать цвет каждой точки. В некоторых форматах кроме трех основных цветов может добавляться байт прозрачности, определяющий, на сколько тот или иной цвет прозрачен по отношению к базовому.

В файле рисунка хранится информация о высоте и ширине изображения. Это необходимо для того, чтобы при раскодировании изображения у нас получилась двумерная картинка, а не линейная последовательность цветов.

Кодирование текстовой информации

Любой текст состоит из последовательности символов. Символами могут быть буквы, цифры, знаки препинания, знаки математических действий, круглые и квадратные скобки и т.д.

Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому символу ставится в соответствие некоторое неотрицательное число, называемое кодом символа, и это число записывается в память ЭВМ в двоичном виде. Конкретное соответствие между символами и их кодами называется системой кодировки.

В современных ЭВМ, в зависимости от типа операционной системы и конкретных прикладных программ, используются 8-разрядные и 16-разрядные (Windows 95, 98, NT) коды символов. Использование 8-разрядных кодов позволяет закодировать 256 различных знаков, этого вполне достаточно для представления многих символов, используемых на практике. При такой кодировке для кода символа достаточно выделить в памяти один байт. Так и делают: каждый символ представляют своим кодом, который записывают в один байт памяти.

В персональных компьютерах обычно используется система кодировки ASCII (American Standard Code for Information Interchange - американский стандартный код для обмена информации). Он введен в 1963 г. и ставит в соответствие каждому символу семиразрядный двоичный код. Легко определить, что в коде ASCII можно представить 128 символов.

В системе ASCII закреплены две таблицы кодирования базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время, очевидно, что если, кодировать символы не восьмиразрядными двоичными числами, а числами с большим разрядом то и диапазон возможных значений кодов станет на много больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной - UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов - этого поля вполне достаточно для размещения в одной таблице символов большинства языков планеты.

Код (code) — совокупность знаков, символов и правил представления информации.

Кодирование символьной информации

К о д и р у е м ы е ( о б о з н а ч а е м ы е ) элементы входного алфавита

обычно называют с и м в о л а м и.

Символом, как правило, является цифра, буква, знак пунктуации или иероглиф естественного языка, знак препинания, знак пробела, специальный знак, символ операции. Кроме этого, учитываются управляющие («непечатные») символы.

К о д и р у ю щ и е ( о б о з н а ч а ю щ и е ) элементы выходного алфавита называются з н а к а м и; количество различных знаков в выходном алфавите назовем значностью (например «бинарный» или «двоичный» код); количество

знаков в кодирующей последовательности для одного символа —разрядностью кода.

При записи и передаче данных часто используются избыточные коды, т. е. такие, которые за счет усложнения структуры позволяют повысить надежность передачи данных.

Коды с обнаружением ошибок. Распространенным методом обнаружения ошибок является к о н т р о л ь по ч е т н о с т и . В этом случае при записи байта информации в запоминающее устройство генерируется дополнительный контрольный бит, в который записывается «О», если это число четное, и «1», если оно нечетное.

Корректирующие коды. В приложениях, требующих повышенной надежности хранения информации, применяются более серьезные, чем контроль четности, методы обеспечения целостности данных. К ним относятся корректирующие коды (Error Correction Code — ЕСС), позволяющие не только обнаруживать ошибки, но и восстанавливать искаженную информацию за счет ее избыточности. Наиболее широко применяются помехоустойчивые коды Рида — Соломона (Reed —

Solomon), а также код Хемминга, позволяющий исправлять одиночные

ошибки, появляющиеся в блоках данных.

Кодирование и обработка чисел

Система счисления — способ именования и изображения чисел с помощью символов, имеющих определенные количественные значения. В зависимости от способа изображения чисел системы счисления делятся на:

непозиционные; цифры не меняют значения от перестановки внутри числа

позиционные. значение каждой цифры зависит от ее места в числе.

Основание позиционной системы счисления — количество (Р) различных цифр, используемых для изображения числа в позиционной системе счисления. Значения цифр лежат в пределах от 0 до Р - 1.

В общем случае запись любого числа N в системе счисления

с основанием Р будет представлять собой ряд (многочлен) вида:

Нижние индексы определяют местоположение цифры в числе (разряд):

• положительные значения индексов — для целой части числа (m разрядов);

• отрицательные значения — для дробной (s разрядов).

Максимальное целое число, которое может быть представлено в m разрядах:

Минимальное значащее, не равное 0 число, которое можно записать в s разрядах дробной части:

Имея в целой части числа m разрядов, а в дробной — s, можно

записать P m+S разных чисел.

Двоичная система счисления (основание Р= 2) использует для представления информации две цифры — 0 и 1.

для перевода числа из позиционной системы счисления с любым основанием в десятичную систему счисления можно воспользоваться выражением (1.1).

Например, двоичное число 101110,101 равно десятичному числу 46,625:

1 0 1 1 10,101 = 1 х 2^ 5 + 0 х 2^4+ 1 х 2^3+ 1 х 2 ^2+ 1 х 2 ^1 + 0 х 2° +

+ 1 X 2^-1 + 0 X 2^- 2 + 1 X 2^-3 = 46,625

Шестнадцатеричная система счисления часто используется
при программировании. позиционная система счисления по целочисленному основанию 16. В качестве цифр этой системы счисления обычно используются цифры от 0 до 9 и латинские буквы от A до F. Буквы A, B, C, D, E, F имеют значения 10, 11, 12, 13, 14, 15 соответственно.

Двоично-десятичная система счисления получила большое
распространение в современных компьютерах ввиду легкости
перевода в десятичную систему и обратно. Она используется
там, где основное внимание уделяется не простоте технического
построения машины, а удобству работы пользователя. В двоично-десятичной системе счисления основанием системы счисления является число 10, но каждая десятичная цифра (0, 1, ..., 9)
кодируется четырьмя двоичными цифрами.

Представление чисел в ЭВМ применяются две формы представления чисел:

• естественная форма, или форма с фиксированной точкой —(ФТ);

• нормальная форма, или форма с плавающей (точкой) — ПТ).

В форме представления с
фиксированной запятой (точкой) числа изображаются в виде последовательности цифр с постоянным для всех чисел положением запятой, отделяющей целую часть от дробной.

В современных компьютерах естественная форма используется как вспомогательная и только для целых
чисел. В памяти ЭВМ числа с фиксированной точкой хранятся в
трех форматах:

•полуслово — это обычно 16 бит или 2 байта;

•слово — 32 бита или 4 байта;

•двойное слово — 64 бита или 8 байтов.

Плавающая запятая (точка). В форме представления с плавающей запятой (точкой) число изображается в виде двух групп
цифр:

•мантисса;

•порядок.

При этом абсолютная величина мантиссы должна быть
меньше 1, а порядок должен быть целым числом. В общем виде
число в форме с плавающей запятой может быть представлено
так: N=±M x Р±r,

где М — мантисса числа (|M| < 1); r — порядок числа (целое число); Р — основание системы счисления.

Двоичное кодирование звуковой информации.

Кодирование видеоинформации. В связи с большим объемом
информации, содержащейся в видеопотоке (до 6 Мбайт/с), для
записи информации в ЭВМ обычно применяют кодирование со
сжатием потока данных на входе с использованием алгоритмов
семейства MPEG/JPEG

Стандарт MPEG (Motion Picture Expert Group) включает несколько компонентов: системного потока, описывающего структуру смешанного аудио- и видеопотока, а также MPEG-video и
MPEG-audio. В случае MPEG-video сжатие достигается за счет четырех
факторов.

1 Вместо элементарных цветов кодируется яркость (luminance,
Y) и цветность (chrominance, U & V), причем цветность «прорежена» по вертикали и горизонтали в 2 раза по сравнению с яркостью

2 
Дискретно-косинусное преобразование с последующим
квантованием Это преобразование переводит
пространственное представление сигнала в частотное. Результат
преобразования подвергается квантованию, т. е. огрублению
точности

3.Устранение временной избыточности с компенсацией движения. для ликвидации избыточности, заключающейся в большой корреляции между соседними кадрами, передается разность между ними.


4. Квазиоптимальное кодирование. Коэффициенты, полученные после DCT, векторы движения
и все остальное кодируются кодами переменной длины. Это кодирование называют квазиоптимальным, поскольку кодовая таблица не строится заново для каждого конкретного случая, а выбрана при разработке стандарта на основе анализа типичных видеопоследовательностей .

  1. История развития ЭВМ. Классификация ЭВМ.

История см вопр 66