
- •Содержание
- •Информатика. Предмет информатики. Основные задачи информатики.
- •Информация – Свойства, Классификация. Показатели качества информации
- •Информация - от латинского слова informatio, что в переводе обозначает сведение, разъяснение, ознакомление.
- •Информация - снятая неопределенность наших знаний
- •Сообщение - наименьший элемент языка, имеющий идею или смысл, пригодный для общения.
- •Классификация информации по разным признакам
- •Меры и единицы количества и объема информации. Энтропия
- •Формы и способы представления информации. Системы счисления
- •Сводная таблица переводов целых чисел
- •Умножение
- •Диапазоны значений целых чисел без знака
- •Диапазоны значений целых чисел со знаком
- •2. А положительное, b отрицательное и по абсолютной величине больше, чем а.
- •3. А положительное, b отрицательное и по абсолютной величине меньше, чем а.
- •Кодирование информации (текст, числа, цвет, графика, звук)
- •Способы кодирования информации
- •Логические основы эвм. Логические операции. Законы логического вывода
- •Вопросы для самопроверки:
- •Глава2. Технические средства реализации информационных процессов История развития вычислительной техники
- •В 1924 году Холлерит создал фирму ибм (ibm, International Business Machines Corporation).
- •I поколение эвм
- •Второе поколение компьютеров, использующее транзисторы, появилось в 1955
- •Третье поколение эвм 1968 - 1973
- •Четвертое поколение эвм 1974 – ……….
- •Технические характеристики эвм четвертого поколения
- •Классификация компьютеров
- •Самый быстрый компьютер по данным сайта
- •1572864 Кол-во ядер
- •1572864 Гб памяти
- •Персональные компьютеры
- •Десктоп
- •Моноблок
- •Ноутбуки
- •Понятие и основные виды архитектуры эвм
- •1. Принцип программного управления. Из него следует, что программа состоит из набора команд, которые выполняются процессором автоматически друг за другом в определенной последовательности.
- •Состав и назначение основных элементов персонального компьютера, их характеристики
- •Устройства ввода/вывода данных, их разновидности и основные характеристики
- •Вопросы для самопроверки:
- •Глава 3. Программные средства реализации информационных процессов Понятие программного обеспечения Системное программное обеспечение: назначение, возможности, структура
- •Развитие операционных систем:
- •Прикладное программное обеспечение
- •Вопросы для самопроверки:
- •Глава 4. Офисные приложения
- •Вопросы для самопроверки:
- •Глава 5. Базы данных
- •Назначение и основы использования систем искусственного интеллекта
- •Вопросы для самопроверки:
- •Глава 6. Локальные и глобальные сети эвм
- •2. Hub (концентратор):
- •Bridle (Мост):
- •4. Router (маршрутизатор):
- •5. Switch (коммутатор):
- •Html- язык разметки гипертекста
- •Вопросы для самопроверки:
- •Глава 7. Основы защиты информации и сведений, составляющих государственную тайну. Методы защиты информации
- •Государство
- •Нормативные документы в области информационной безопасности
- •Выписка из уголовного кодекса рф (1 января 1997 года)
- •Угроза информационной безопасности государства
- •2. Техногенные :
- •3. Стихийные угрозы
- •5.Системы резервного копирования
- •6.Системы бесперебойного питания.
- •7.Антивирусные средства
- •8.Межсетевые экраны
- •4. По особенностям алгоритма вируса
- •Вопросы для самопроверки:
- •Раздел II. Моделирование, алгоритмизация и программирование Глава 1. Модели решения функциональных и вычислительных задач
- •Вопросы для самопроверки:
- •Глава 2. Алгоритмизация и программирование. Технологии программирования
- •Логическая структура любого алгоритма может быть представлена комбинацией трех базовых структур: следование, ветвление, цикл.
- •Вопросы для самопроверки:
- •Глава 3. Языки программирования
- •Логические типы данных
- •Вопросы для самопроверки:
- •Глоссарий
- •Список рекомендуемой литературы
Кодирование информации (текст, числа, цвет, графика, звук)
Код — это правило отображения одного набора объектов или знаков в другой набор знаков без потери информации. Чтобы избежать потерь информации, это отображение должно быть таким, чтобы можно было всегда однозначно возвратиться к прежнему набору объектов или знаков.
Например, любую информацию можно передать русским языком с помощью 33 букв русского алфавита и добавочных знаков препинания.
Все разделы курса информатики пересекаются между собой, что проявляется в использовании одних и тех же понятий при описании объектов изучения. Так, ключевыми понятиями раздела «Кодирование и измерение информации» по прежнему являются понятия информации и информационного процесса, наряду с новыми понятиями, такими, как «кодирование», «бит»,«байт» и другие.
Кодирование — это представление, моделирование одного набора знаков другим с помощью кода. Кодовая таблица — это соответствие между набором знаков и их кодами, обычно разными числами.
Способы кодирования информации
Способы кодирования информации: символьный, лингвистический, табличный, графический.
Любой способ кодирования характеризуется наличием основы (алфавит, тезаурус, спектр цветности, система координат, основание системы счисления и т.п.) и правил конструирования информационных образов на этой основе.
Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек, и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации. Информация никогда не появляется в чистом виде, она всегда как-то представлена, как-то закодирована.
Двоичное кодирование – один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.
Кодирование символьной (текстовой) информации
Основная операция, производимая над отдельными символами текста - сравнение символов.
При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.
Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.
Таблица перекодировки - таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.
Наиболее популярные таблицы перекодировки: ANSI;ДКОИ-8, ASCII, CP1251, Unicode.
Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.
Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.
Кодирование числовой информации
Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.
Основной системой счисления для представления чисел в компьютере является двоичная позиционная система счисления.
Кодирование текстовой информации
В настоящее время, большая часть пользователей, при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, сколько всего символов и какое количество бит нам нужно.
10 цифр, 12 знаков препинания, 15 знаков арифметических действий, буквы русского и латинского алфавита, ВСЕГО: 155 символов, что соответствует 8 бит информации.
Единицы измерения информации.
1 байт = 8 бит
1 Кбайт = 1024 байтам
1 Мбайт = 1024 Кбайтам
1 Гбайт = 1024 Мбайтам
1 Тбайт = 1024 Гбайтам
Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.
Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой
Стандарт UNICODE 4.0 представляет собой новую систему кодирования символов, выводимых на экран монитора или на принтер, позволяющую закодировать 1 114 112 символов (в стандарте их принято называть code points).
Стандарт UNICODE поддерживается тремя формами,
32-битной (UTF-32), 16-битной (UTF-16) и 8-битной (UTF-8)
Основным отображением кодирования символов является код ASCII - American Standard Code for Information Interchange- американский стандартный код обмена информацией, который представляет из себя таблицу 16 на 16, где символы закодированы в шестнадцатеричной системе счисления.
Таблица ASCII (непечатаемые символы)
Число |
Команда |
Значение |
Число |
Команда |
Значение |
0 |
NUL |
Пустой символ |
10 |
DLE |
Закр. канала связи |
1 |
SOH |
Начало заголовка |
11 |
DC1 |
Упр. устройством 1 |
2 |
STX |
Начало текста |
12 |
DC2 |
Упр. устройством 2 |
3 |
ETX |
Конец текста |
13 |
DC3 |
Упр. устройством 3 |
4 |
EOT |
Конец передачи |
14 |
DC4 |
Упр. устройством 4 |
5 |
ENQ |
Запрос |
15 |
NAK |
Отрицание получения |
6 |
ACK |
Подтвержд. получения |
16 |
SYN |
Синхронизация |
7 |
BEL |
Звуковой сигнал |
17 |
ETB |
Конец пакета |
8 |
BS |
Обратный ход каретки |
18 |
CAN |
Отмена |
9 |
HT |
Горизонт. табуляция |
19 |
EM |
Закрытие среды |
A |
LF |
Начало строки |
1A |
SUB |
Замена |
B |
VT |
Вертикальная табуляция |
1B |
ESC |
Завершение |
C |
FF |
Начало формы |
1C |
FS |
Разделитель файлов |
D |
CR |
Возврат каретки |
1D |
GS |
Разделитель групп |
E |
SO |
Передача |
1E |
RS |
Разделитель записей |
F |
Si |
Прием |
1F |
DC1 |
Разделитель модулей |
Таблица ASCII (печатаемые символы)
Число |
Сим-вол |
Число |
Сим-вол |
Число |
Сим-вол |
Число |
Сим-вол |
Число |
Сим-вол |
Число |
Сим-вол |
20 |
пробел |
30 |
. |
40 |
@ |
50 |
P |
60 |
' |
70 |
p |
21 |
! |
31 |
0 |
41 |
A |
51 |
Q |
61 |
a |
71 |
q |
22 |
" |
32 |
1 |
42 |
B |
52 |
R |
62 |
b |
72 |
r |
23 |
# |
33 |
2 |
43 |
C |
53 |
S |
63 |
c |
73 |
s |
24 |
$ |
34 |
3 |
44 |
D |
54 |
T |
64 |
d |
74 |
t |
25 |
% |
35 |
4 |
45 |
E |
55 |
U |
65 |
e |
75 |
u |
26 |
& |
36 |
5 |
46 |
F |
56 |
V |
66 |
f |
76 |
v |
27 |
' |
37 |
6 |
47 |
G |
57 |
W |
67 |
g |
77 |
w |
28 |
( |
38 |
7 |
48 |
H |
58 |
X |
68 |
h |
78 |
x |
29 |
) |
39 |
8 |
49 |
I |
59 |
Y |
69 |
i |
79 |
y |
2A |
* |
3A |
9 |
4A |
J |
5A |
Z |
6A |
j |
7A |
z |
2B |
+ |
3B |
: |
4B |
K |
5B |
[ |
6B |
k |
7B |
{ |
2C |
, |
3C |
; |
4C |
L |
5C |
\ |
6C |
l |
7C |
| |
2D |
- |
3D |
< |
4D |
M |
5D |
] |
6D |
m |
7D |
} |
2E |
. |
3E |
> |
4E |
N |
5E |
^ |
6E |
n |
7E |
~ |
2F |
/ |
3F |
? |
4F |
O |
5F |
_ |
6F |
o |
7F |
DEL |
Кодирование графической информации
Важным этапом кодирования графического изображения является разбиение его на дискретные элементы (дискретизация).
Основными способами представления графики для ее хранения и обработки с помощью компьютера являются растровые и векторные изображения
Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур (чаще всего отрезков и дуг). Положение этих элементарных отрезков определяется координатами точек и величиной радиуса. Для каждой линии указывается двоичные коды типа линии (сплошная, пунктирная, штрихпунктирная), толщины и цвета.
Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.
Матричный принцип кодирования графических изображений заключается в том, что изображение разбивается на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.
Pixel (picture element - элемент рисунка) - минимальная единица изображения, цвет и яркость которой можно задать независимо от остального изображения.
В соответствии с матричным принципом строятся изображения, выводимые на принтер, отображаемые на экране дисплея, получаемые с помощью сканера.
Качество изображения будет тем выше, чем "плотнее" расположены пиксели, то есть чем больше разрешающая способность устройства, и чем точнее закодирован цвет каждого из них.
Для черно-белого изображения код цвета каждого пикселя задается одним битом.
Если рисунок цветной, то для каждой точки задается двоичный код ее цвета.
Если говорить о кодировании цветных графических изображений, то нужно рассмотреть принцип декомпозиции произвольного цвета на основные составляющие. Применяют несколько систем кодирования: HSB, RGB и CMYK. Первая цветовая модель проста и интуитивно понятна, т. е. удобна для человека, вторая наиболее удобна для компьютера, а последняя модель CMYK-для типографий. Использование этих цветовых моделей связано с тем, что световой поток может формироваться излучениями, представляющими собой комбинацию " чистых" спектральных цветов : красного, зеленого, синего или их производных. Различают аддитивное цветовоспроизведение (характерно для излучающих объектов) и субтрактивное цветовоспроизведение (характерно для отражающих объектов). В качестве примера объекта первого типа можно привести электронно-лучевую трубку монитора, второго типа - полиграфический отпечаток.
1) Модель HSB характеризуется тремя компонентами: оттенок цвета (Hue), насыщенность цвета (Saturation) и яркость цвета (Brightness). Можно получить большое количество произвольных цветов, регулируя эти компоненты. Эту цветовую модель лучше применять в тех графических редакторах, в которых изображения создают сами, а не обрабатывают уже готовые. Затем созданное свое произведение можно преобразовать в цветовую модель RGB, если ее планируется использовать в качестве экранной иллюстрации, или CMYK, если в качестве печатной, Значение цвета выбирается как вектор, выходящий из центра окружности. Направление вектора задается в угловых градусах и определяет цветовой оттенок. Насыщенность цвета определяется длиной вектора, а яркость цвета задается на отдельной оси, нулевая точка которой имеет черный цвет. Точка в центре соответствует белому (нейтральному) цвету, а точки по периметру - чистым цветам.
2) Принцип метода RGB заключается в следующем: известно, что любой цвет можно представить в виде комбинации трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Другие цвета и их оттенки получаются за счет наличия или отсутствия этих составляющих. По первым буквам основных цветов система и получила свое название - RGB. Данная цветовая модель является аддитивной, то есть любой цвет можно получить сочетание основных цветов в различных пропорциях. При наложении одного компонента основного цвета на другой яркость суммарного излучения увеличивается. Если совместить все три компоненты, то получим ахроматический серый цвет, при увеличении яркости которого происходит приближение к белому цвету.
При 256 градациях тона (каждая точка кодируется 3 байтами) минимальные значения RGB (0,0,0) соответствуют черному цвету, а белому - максимальные с координатами (255, 255, 255). Чем больше значение байта цветовой составляющей, тем этот цвет ярче. Например, темно-синий кодируется тремя байтами ( 0, 0, 128), а ярко-синий (0, 0, 255).
3) Принцип метода CMYK. Эта цветовая модель используется при подготовке публикаций к печати. Каждому из основных цветов ставится в соответствие дополнительный цвет (дополняющий основной до белого). Получают дополнительный цвет за счет суммирования пары остальных основных цветов. Значит, дополнительными цветами для красного является голубой (Cyan,C) = зеленый + синий = белый - красный, для зеленого - пурпурный (Magenta, M) = красный + синий = белый - зеленый, для синего - желтый (Yellow, Y) = красный + зеленый = белый - синий. Причем принцип декомпозиции произвольного цвета на составляющие можно применять как для основных, так и для дополнительных, то есть любой цвет можно представить или в виде суммы красной, зеленой, синей составляющей или же в виде суммы голубой, пурупурной, желтой составляющей. В основном такой метод принят в полиграфии. Но там еще используют черный цвет (BlacК, так как буква В уже занята синим цветом, то обозначают буквой K). Это связано с тем, что наложение друг на друга дополнительных цветов не дает чистого черного цвета.
Поскольку и цвета кодируются в двоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, то для кодирования каждого пикселя вам потребуется 4 бита (16=24), а если есть возможность использовать 16 бит (2 байта) для кодирования цвета одного пикселя, то вы можете передать тогда 216 = 65536 различных цветов. Использование трех байтов (24 битов) для кодирования цвета одной точки позволяет отразить 16777216 (или около 17 миллионов) различных оттенков цвета - так называемый режим “истинного цвета” (True Color). Заметим, что это используемые в настоящее время, но далеко не предельные возможности современных компьютеров.
Различают несколько режимов представления цветной графики:
а) полноцветный (True Color);
б) High Color;
в) индексный.
При полноцветном режиме для кодирования яркости каждой из составляющих используют по 256 значений (восемь двоичных разрядов), то есть на кодирование цвета одного пикселя (в системе RGB) надо затратить 8*3=24 разряда. Это позволяет однозначно определять 16,5 млн цветов. Это довольно близко к чувствительности человеческого глаза. При кодировании с помощью системы CMYK для представления цветной графики надо иметь 8*4=32 двоичных разряда.
Режим High Color - это кодирование при помощи 16-разрядных двоичных чисел, то есть уменьшается количестко двоичных разрядов при кодировании каждой точки. Но при этом значительно уменьшается диапазон кодируемых цветов.
При индексном кодировании цвета можно передать всго лишь 256 цветовых оттенков. Каждый цвет кодируется при помощи восьми бит данных. Но так как 256 значений не передают весь диапазон цветов, доступный человеческому глазу, то подразумевается, что к графическим данным прилагается палитра (справочная таблица), без которой воспроизведение будет неадекватным: море может получиться красным, а листья - синими. Сам код точки растра в данном случае означает не сам по себе цвет, а только его номер (индекс) в палитре. Отсюда и название режима - индексный.
Соответствие между количеством отображаемых цветов (К) и количеством бит для их кодировки (а) находиться по формуле:
К = 2а.
А |
К |
Достаточно для… |
4 |
24 = 16 |
|
8 |
28 = 256 |
Рисованных изображений типа тех, что видим в мультфильмах, но недостаточно для изображений живой природы |
16 (High Color) |
216 = 65536 |
Изображений, которые на картинках в журналах и на фотографиях |
24 (True Color) |
232 = 16 777 216 |
Обработки и передачи изображений, не уступающих по качеству наблюдаемым в живой природе |
Двоичный код изображения, выводимого на экран, хранится в видеопамяти. Видеопамять - это электронное энергозависимое запоминающее устройство. Размер видеопамяти зависит от разрешающей способности дисплея и количества цветов. Но ее минимальный объем определяется так, чтобы поместился один кадр (одна страница) изображения, т.е. как результат произведения разрешающей способности на размер кода пикселя.
Vmin = M * N * a.
Двоичный код восьмицветной палитры.
Цвет |
Составляющие |
||
|
к |
З |
С |
Красный |
1 |
0 |
0 |
Зеленый |
0 |
1 |
0 |
Синий |
0 |
0 |
1 |
Голубой |
0 |
1 |
1 |
Пурпурный |
1 |
0 |
1 |
Желтый |
1 |
1 |
0 |
Белый |
1 |
1 |
1 |
Черный |
0 |
0 |
0 |
Шестнадцатицветная палитра позволяет увеличить количество используемых цветов. Здесь будет использоваться 4-разрядная кодировка пикселя: 3 бита основных цветов + 1 бит интенсивности. Последний управляет яркостью трех базовых цветов одновременно (интенсивностью трех электронных пучков).
Двоичный код шестнадцатицветной палитры.
Цвет |
Составляющие |
|||
|
К |
З |
С |
Интенс |
Красный |
1 |
0 |
0 |
0 |
Зеленый |
0 |
1 |
0 |
0 |
Синий |
0 |
0 |
1 |
0 |
Голубой |
0 |
1 |
1 |
0 |
Пурпурный |
1 |
0 |
1 |
1 |
Ярко-желтый |
1 |
1 |
0 |
1 |
Серый(белый) |
1 |
1 |
1 |
0 |
Темно-серый |
0 |
0 |
0 |
1 |
Ярко-голубой |
0 |
1 |
1 |
1 |
Ярко-синий |
0 |
0 |
1 |
0 |
… |
|
|
|
|
Ярко-белый |
1 |
1 |
1 |
1 |
Черный |
0 |
0 |
0 |
0 |
При раздельном управлении интенсивностью основных цветов количество получаемых цветов увеличивается. Так для получения палитры при глубине цвета в 24 бита на каждый цвет выделяется по 8 бит, то есть возможны 256 уровней интенсивности (К = 28).
Двоичный код 256-цветной палитры.
Цвет |
Составляющие |
||
|
K |
З |
С |
Красный |
11111111 |
00000000 |
00000000 |
Зеленый |
00000000 |
11111111 |
00000000 |
Синий |
00000000 |
00000000 |
11111111 |
Голубой |
00000000 |
11111111 |
11111111 |
Пурпурный |
11111111 |
00000000 |
11111111 |
Желтый |
11111111 |
11111111 |
00000000 |
Белый |
11111111 |
11111111 |
11111111 |
Черный |
00000000 |
00000000 |
00000000 |
Векторное и фрактальное изображения
Векторное изображение - это графический объект, состоящий из элементарных отрезков и дуг. Базовым элементом изоражения является линия. Как и любой объект, она обладает свойствами: формой (прямая, кривая), толщиной., цветом, начертанием (пунктирная, сплошная). Замкнутые линии имеют свойство заполнения (или другими объектами, или выбранным цветом). Все прочие объекты векторной графики составляются из линий. Так как линия описывается математически как единый объект, то и объем данных для отображения объекта средствами векторной графики значительно меньше, чем в растровой графике. Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.
К программным средствам создания и обработки векторной графики относятся следующие ГР: CorelDraw, Adobe Illustrator, а также векторизаторы (трассировщики) - специализированные пакеты преобразования растровых изображений в векторные.
Фрактальная графика основывается на математических вычислениях, как и векторная. Но в отличии от векторной ее базовым элементом является сама математическая формула. Это приводит к тому, что в памяти компьютера не хранится никаких объектов и изображение строится только по уравнениям. При помощи этого способа можно строить простейшие регулярные структуры, а также сложные иллюстрации, которые иммитируют ландшафты.
Кодирование звуковой информации
Из курса физики вам известно, что звук - это колебания воздуха. По своей природе звук является непрерывным сигналом. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение.
Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел, а для этого его необходимо дискретизировать и оцифровать.
Можно поступить следующим образом: измерять амплитуду сигнала через равные промежутки времени и записывать полученные числовые значения в память компьютера.
В основе кодирования звука с использованием ПК лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала. Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редактор звукозаписи). Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения (глубины кодирования звука - количество уровней).
Цифровой звук – это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды.
Оцифровка звука — технология поделенным временным шагом и последующей записи полученных значений в численном виде. Другое название оцифровки звука — аналогово-цифровое преобразование звука.
Оцифровка звука включает в себя два процесса:
процесс дискретизации (осуществление выборки) сигнала по времени
процесс квантования по амплитуде.
Дискретизация по времени
Процесс дискретизации по времени - процесс получения значений сигнала, который преобразуется, с определенным временным шагом - шагом дискретизации . Количество замеров величины сигнала, осуществляемых в одну секунду, называют частотой дискретизации или частотой выборки, или частотой сэмплирования (от англ. « sampling» – «выборка»). Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено. Это подтверждается теоремой Котельникова (в зарубежной литературе встречается как теорема Шеннона, Shannon). Согласно ей, аналоговый сигнал с ограниченным спектром точно описуем дискретной последовательностью значений его амплитуды, если эти значения берутся с частотой, как минимум вдвое превышающей наивысшую частоту спектра сигнала. То есть, аналоговый сигнал, в котором наивысшая частота спектра равна Fm, может быть точно представлен последовательностью дискретных значений амплитуды, если для частоты дискретизации Fd выполняется: Fd>2Fm. На практике это означает, что для того, чтобы оцифрованный сигнал содержал информацию о всем диапазоне слышимых частот исходного аналогового сигнала (0 – 20 кГц) необходимо, чтобы выбранное значение частоты дискретизации составляло не менее 40 кГц. Количество замеров амплитуды в секунду называют частотой дискретизации (в случае, если шаг дискретизации постоянен). Основная трудность оцифровки заключается в невозможности записать измеренные значения сигнала с идеальной точностью.
Линейное (однородное) квантование амплитуды
Отведём для записи одного значения амплитуды сигнала в памяти компьютера N бит. Значит, с помощью одного N -битного слова можно описать 2N разных положений. Пусть амплитуда оцифровываемого сигнала колеблется в пределах от -1 до 1 некоторых условных единиц. Представим этот диапазон изменения амплитуды - динамический диапазон сигнала - в виде 2N -1 равных промежутков, разделив его на 2N уровней - квантов. Теперь, для записи каждого отдельного значения амплитуды, его необходимо округлить до ближайшего уровня квантования. Этот процесс носит название квантования по амплитуде. Квантование по амплитуде – процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью. Каждый из 2N возможных уровней называется уровнем квантования, а расстояние между двумя ближайшими уровнями квантования называется шагом квантования. Если амплитудная шкала разбита на уровни линейно, квантование называют линейным (однородным). Точность округления зависит от выбранного количества (2N) уровней квантования, которое, в свою очередь, зависит от количества бит (N), отведенных для записи значения амплитуды. Число N называют разрядностью квантования (подразумевая количество разрядов, то есть бит, в каждом слове), а полученные в результате округления значений амплитуды числа – отсчетами или сэмплами (от англ. “ sample” – “замер”). Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными. Этот способ оцифровки сигнала - дискретизация сигнала во времени в совокупности с методом однородного квантования - называется импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation – PCM). Оцифрованный сигнал в виде набора последовательных значений амплитуды уже можно сохранить в памяти компьютера. В случае, когда записываются абсолютные значения амплитуды, такой формат записи называется PCM ( Pulse Code Modulation). Стандартный аудио компакт-диск (CD-DA), применяющийся с начала 80-х годов 20-го столетия, хранит информацию в формате PCM с частотой дискретизации 44.1 кГц и разрядностью квантования 16 бит.
Другие способы оцифровки
Способ неоднородного квантования предусматривает разбиение амплитудной шкалы на уровни по логарифмическому закону. Такой способ квантования называют логарифмическим квантованием. При использовании логарифмической амплитудной шкалы, в области слабой амплитуды оказывается большее число уровней квантования, чем в области сильной амплитуды (при этом, общее число уровней квантования остается таким же, как и в случае однородного квантования). Аналогово-цифровое преобразование, основанное на применении метода неоднородного квантования, называется неоднородной импульсно-кодовой модуляцией - неоднородной ИКМ (Nonuniform PCM).
Альтернативным способом аналогово-цифрового преобразования является разностная импульсно-кодовая модуляция – разностная ИКМ (англ. «Differential PCM» – DPCM). В случае разностной ИКМ квантованию подвергают не саму амплитуду, а относительные значения величины амплитуды. В полной аналогии с ИКМ, разностная ИКМ может сочетаться с использованием как однородного, так и неоднородного методов квантования. Разностное кодирование имеет много разных вариантов.
Аналогово-цифровые преобразователи (АЦП)
Вышеописанный процесс оцифровки звука выполняется аналогово-цифровыми преобразователями (АЦП). Это преобразование включает в себя следующие операции:
Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени - отсчетов. Эта задача решается путём использования специальной схемы на входе АЦП - устройства выборки-хранения.
Квантование по уровню представляет собой замену величины отсчета сигнала ближайшим значением из набора фиксированных величин - уровней квантования.
Кодирование или оцифровку, в результате которого значение каждого квантованного отсчета представляется в виде числа, соответствующего порядковому номеру уровня квантования.
Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определенной разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для записи звука в полосе частот 20-20 000 Гц, требуется частота дискретизации от 44,1 и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192 и даже 384 кГц). Для получения качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.
Кодирование оцифрованного звука перед его записью на носитель
Для хранения цифрового звука существует много различных способов. Оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени.
Блок оцифрованной аудио информации можно записать в файл без изменений, то есть последовательностью чисел - значений амплитуды. В этом случае существуют два способа хранения информации.
Первый - PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд. (В таком виде записаны данные на всех аудио CD.)
Второй - ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).
Можно сжать данные так, чтобы они занимали меньший объем памяти, нежели в исходном состоянии. Тут тоже есть два способа.
Кодирование данных без потерь (lossless coding) - способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К нему прибегают в тех случаях, когда сохранение оригинального качества данных особо значимо. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия.
Кодирование данных с потерями (lossy coding). Здесь цель - добиться схожести звучания восстановленного сигнала с оригиналом при как можно меньшем размере сжатого файла. Это достигается путем использования алгоритмов, «упрощающих» оригинальный сигнал (удаляющих из него «несущественные», неразличимые на слух детали). Это приводит к тому, что декодированный сигнал перестает быть идентичным оригиналу, а является лишь «похоже звучащим». Методов сжатия, а также программ, реализующих эти методы, существует много. Наиболее известными являются MPEG-1 Layer I,II,III (последним является всем известный MP3), MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA), TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия, обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). В основе всех lossy-кодеров лежит использование так называемой психоакустической модели. Она занимается этим самым «упрощением» оригинального сигнала. Степень сжатия оригинального сигнала зависит от степени его «упрощения» - сильное сжатие достигается путем «воинственного упрощения» (когда кодером игнорируются множественные нюансы). Такое сжатие приводит к сильной потере качества, поскольку удалению могут подлежать не только незаметные, но и значимые детали звучания.
Терминология
кодер – программа (или устройство), реализующая определенный алгоритм кодирования данных (например, архиватор, или кодер MP 3), которая в качестве ввода принимает исходную информацию, а в качестве вывода возвращает закодированную информацию в определенном формате.
декодер – программа (или устройство), реализующая обратное преобразование закодированного сигнала в декодированный.
кодек (от англ. « codec » - « Coder / Decoder ») - программный или аппаратный блок, предназначенный для кодирования/декодирования данных.
Наиболее распространённые кодеки
MP3 – MPEG-1 Layer 3
ОGG – Ogg Vorbis
WMA – Windows Media Audio
MPC - MusePack
AAC – MPEG-2/4 AAC (Advanced Audio Coding)
Стандарт MPEG-2 AAC
Стандарт MPEG-4 AAC
Некоторые форматы оцифровки звука в сравнении
Название формата |
Квантование, бит |
Частота дискретизации, кГц |
Число каналов |
Величина потока данных с диска, кбит/с |
Степень сжатия/упаковки |
CD |
16 |
44,1 |
2 |
1411,2 |
1:1 без потерь |
Dolby Digital (AC3) |
16-24 |
48 |
6 |
до 640 |
~12:1 с потерями |
DTS |
20-24 |
48; 96 |
до 8 |
до 1536 |
~3:1 с потерями |
DVD-Audio |
16; 20; 24 |
44,1; 48; 88,2; 96 |
6 |
6912 |
2:1 без потерь |
DVD-Audio |
16; 20; 24 |
176,4; 192 |
2 |
4608 |
2:1 без потерь |
MP3 |
плавающий |
до 48 |
2 |
до 320 |
~11:1 с потерями |
AAC |
плавающий |
до 96 |
до 48 |
до 529 |
с потерями |
AAC+ (SBR) |
плавающий |
до 48 |
2 |
до 320 |
с потерями |
Ogg Vorbis |
до 32 |
до 192 |
до 255 |
до 1000 |
с потерями |
WMA |
до 24 |
до 96 |
до 8 |
до 768 |
2:1, есть версия без потерь |