
Мурманский филиал ПГУПС
Лектор: к.т.н. Бойко М.А.
Продолжительность: 1 академический час
ЛЕКЦИЯ № 3
Темы занятия :
Мощность алфавита.
Таблицы кодирования символов.
Кодирование изображений.
Кодирование звука.
Сжатие информации
Примеры решения типовых задач.
Цифровая электронная подпись.
Мощность алфавита
Алфавит – набор символов, используемых для создания информационных сообщений. Например, алфавит русского языка включает 32 буквы (символа), однако следует учитывать, что в информационном сообщении могут присутствовать кроме букв специальные символы: запятая, точка, восклицательный знак, скобки и др.
Мощность алфавита (математ . - мощность множества) – количество (набор) символов, используемых для передачи сообщения.
В вычислительной технике используют алфавит из двух символов : 0 и 1
Примечание:
*Максимальное
количество N вариантов (наборов) для
бинарного n-разрядного
слова составляет
Например, количество возможных вариантов восьмиразрядного слова (1 байт), составленного из 0 и 1, составляет 28 =256.
Задача № 1.1.:
Скорость чтения учащегося составляет приблизительно 250 символов в минуту. Приняв мощность используемого алфавита за 64, определите, какой объем информации в килобайтах получит учащийся, если он будет непрерывно читать в течение 40 минут?
Решение:
1)
Количество информации, которое несет
один знак алфавита (из 64 знаков) равен:
2) Количество символов, которые читает учащийся за 40 минут равно: 250 x 40 = 10 000.
3) Количество информации, которое получает учащийся за 40 минут равно: 10 000 ⋅ 6 = 60 000 бит = 7,3 Кбайт.
Таблицы кодирования символов
Кодирование символов в ЭВМ. Каждый символ (буква или знак) текста размещается в ячейке прямоугольной таблицы и кодируется двоичным кодом, составленным из номеров столбца и строки в двоичной системе счисления. Таблица кодировки символов определены международными стандартами.
КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов.
ASC-II (American Standard Code for Information Interchange - американский стандартный код информационного обмена), для чего используется алфавит мощностью 28=256 возможных символов (см. таблицу 1). К широко используемым кодировкам относятся также таблицы КОИ-8, ДКОИ и другие. ASCII в американском варианте английского языка произносится [э́ски], тогда как в Великобритании чаще произносится [а́ски]; по-русски произносится также [а́ски] или [аски́].
Таблица 1
Фрагмент таблицы кодировки символов asc-II
Двоичн. код. |
0000 |
0001 |
0010 |
0011 |
0100 |
0101 |
0110 |
0111 |
1000 |
1001 |
1010 |
1011 |
1100 |
1101 |
1110 |
1111 |
0000 |
|
|
|
0 |
@ |
P |
‘ |
p |
А |
Р |
а |
|
|
|
р |
|
0001 |
|
|
! |
1 |
A |
Q |
a |
q |
Б |
С |
б |
|
|
|
с |
|
0010 |
|
|
“ |
2 |
B |
R |
b |
r |
В |
Т |
в |
|
|
|
т |
|
0011 |
|
|
# |
3 |
C |
S |
c |
s |
Г |
У |
г |
|
|
|
у |
|
0100 |
|
|
$ |
4 |
D |
T |
d |
t |
Д |
Ф |
д |
|
|
|
ф |
|
0101 |
|
|
% |
5 |
E |
U |
e |
u |
Е |
Х |
е |
|
|
|
х |
|
0110 |
|
|
& |
6 |
F |
V |
f |
v |
Ж |
Ц |
ж |
|
|
|
ц |
|
0111 |
|
|
‘ |
7 |
J |
W |
g |
w |
З |
Ч |
з |
|
|
|
ч |
|
1000 |
|
|
( |
8 |
H |
X |
h |
x |
И |
Ш |
и |
|
|
|
ш |
|
1001 |
|
|
) |
9 |
I |
Y |
I |
y |
Й |
Щ |
й |
|
|
|
щ |
|
1010 |
|
|
* |
: |
J |
Z |
j |
z |
К |
Ъ |
к |
|
|
|
ъ |
|
1011 |
|
|
+ |
; |
K |
[ |
k |
{ |
Л |
Ы |
л |
|
|
|
ы |
|
1100 |
|
|
, |
< |
L |
\ |
l |
| |
М |
Ь |
м |
|
|
|
ь |
|
1101 |
|
|
- |
= |
M |
] |
m |
} |
Н |
Э |
н |
|
|
|
э |
|
1110 |
|
|
. |
> |
N |
^ |
n |
- |
О |
Ю |
о |
|
|
|
ю |
|
1111 |
|
|
/ |
? |
O |
_ |
o |
|
П |
Я |
п |
|
|
|
я |
|
Примеры : 1) Число 57 в соответствии с таблицей ASCII в двоичной системе – 00110101 00110111 .
2) Символ $ (доллар) имеет восьмиразрядный двоичный код 00100100, так как координата
символа
по оси X
равна
,
а координата по оси Y
равна
.
Unicode
(англ. UTF,
Unicode transformation format).
- двухбайтовая
кодировка позволяющая закодировать
символов. Коды в стандарте Юникод
разделены на несколько областей. Область
с кодами от U+0000 до U+007F содержит символы
набора ASCII
с соответствующими кодами. Далее
расположены области знаков различных
письменностей, знаки пунктуации и
технические символы. Часть кодов
зарезервирована для использования в
будущем.
Для обозначения символо в Unicode используется запись вида «U+xxxx» (для кодов 0…FFFF), или «U+xxxxx» (для кодов 10000…FFFFF), или «U+xxxxxx» (для кодов 100000…10FFFF), где xxx — шестнадцатеричные цифры. Например, символ «я» (U+044F) имеет код 044F16 = 110310.
Под символы кириллицы выделены области знаков с кодами от U+0400 до U+052F, от U+2DE0 до U+2DFF, от U+A640 до U+A69F
Примечание №1 : Шестнадцатеричный код символов указывается в «Таблице символов» (Пуск – Программы – Служебные – Специальные – Таблица символов). Перевод чисел из 16-ричной системы в двоичную и десятичную удобно выполнять с использованием встроенного калькулятора (Пуск- Программы –Стандартные- Калькулятор)»