
- •Классификация антивирусных продуктов
- •Лжеантивирусы
- •Работа антивируса
- •Базы антивирусов
- •2. Робота з текстовим редактором
- •44. Кодирование символов. Виды кодировок. Таблицы ascii. Unicode
- •Непечатаемые символы
- •Печатаемые символы
- •Unicode
- •Что такое ascii?
- •Ввод ascii символов с клавиатуры
- •Ascii Конвертор
- •Ascii Art
- •Бесплатная почта на ascii.Org.Ru
- •46. Запуск Word. Вихід з Word. Налаштування інтерфейсу користувача. Відкриття та збереження документу.
- •Вправа 1. Запуск Word.
- •Вправа 2. Вихід Word.
- •Вправа 3. Налаштування інтерфейсу користувача.
- •Вправа 4. Відкриття та збереження документу.
- •Завдання для самостійної роботи
- •Текстові редактори
- •Слово.Абзац
- •Особливості буфера обміну Перевірка орфографії
- •Практичне завдання
Печатаемые символы
Число |
Символ |
Число |
Символ |
Число |
Символ |
Число |
Символ |
Число |
Символ |
Число |
Символ |
20 |
пробел |
30 |
. |
40 |
@ |
50 |
P |
60 |
' |
70 |
p |
21 |
! |
31 |
0 |
41 |
A |
51 |
Q |
61 |
a |
71 |
q |
22 |
" |
32 |
1 |
42 |
B |
52 |
R |
62 |
b |
72 |
r |
23 |
# |
33 |
2 |
43 |
C |
53 |
S |
63 |
c |
73 |
s |
24 |
$ |
34 |
3 |
44 |
D |
54 |
T |
64 |
d |
74 |
t |
25 |
% |
35 |
4 |
45 |
E |
55 |
U |
65 |
e |
75 |
u |
26 |
& |
36 |
5 |
46 |
F |
56 |
V |
66 |
f |
76 |
v |
27 |
' |
37 |
6 |
47 |
G |
57 |
W |
67 |
g |
77 |
w |
28 |
( |
38 |
7 |
48 |
H |
58 |
X |
68 |
h |
78 |
x |
29 |
) |
39 |
8 |
49 |
I |
59 |
Y |
69 |
i |
79 |
y |
2A |
* |
3A |
9 |
4A |
J |
5A |
Z |
6A |
j |
7A |
z |
2B |
+ |
3B |
: |
4B |
K |
5B |
[ |
6B |
k |
7B |
{ |
2C |
, |
3C |
; |
4C |
L |
5C |
\ |
6C |
l |
7C |
| |
2D |
- |
3D |
< |
4D |
M |
5D |
] |
6D |
m |
7D |
} |
2E |
. |
3E |
> |
4E |
N |
5E |
^ |
6E |
n |
7E |
~ |
2F |
/ |
3F |
? |
4F |
O |
5F |
_ |
6F |
o |
7F |
DEL |
Однако базового набора кодов стало быстро не хватать. Возросший дефицит знакомест в стандартной таблице ASCII потребовал ее немедленного расширения. В результате возникла новая таблица кодировок, получившая название "расширенная таблица ASCII", число знакомест в которой возросло до 28 (256 знакомест). Эта таблица получила название международного стандарта IS 646, а восьмибитный код - Latin-1. В него были добавлены в основном латинские буквы со штрихами и диакритические символы. Вскоре появился новый стандарт IS 8859, в котором вводилось понятие "кодовая страница", т.е. набор из 256 символов для определения языка или группы языков, т.е. IS 8859-1 это Latin-1, IS 8859-2 включал славянские языки с латинским алфавитом (чешский, польский, вергерский), IS 8859-3 включал турецкий, мальтийский, эсперанто, галисийский языки, и т.д. Недостатком такого подхода является то, что программное обеспечение должно следить за кодовыми страницами, смешивать языки при этом невозможно, кроме того не были созданы кодовые страницы японского и китайского языков.
Unicode
В январе 1991 года возник консорциум UNICODE (Unicode Consortium), целью которого является продвижение, развитие и реализация стандарта Unicode как международной системы кодирования для обмена информацией, а также поддержание качества этого стандарта в будущих версиях.
Стандарт UNICODE 4.0 представляет собой новую систему кодирования символов, выводимых на экран монитора или на принтер, позволяющую закодировать 1 114 112 символов (в стандарте из принято называть code points). Большинство символов, используемых в основных языках мира занимают 65 536 code points, образуя Basic Multilingual Plane (BMP) (Основной Многоязычный Уровень - мой перевод). Оставшиеся (более миллиона) code points вполне достаточно для кодирования всех известных символов, включая малораспространенные языки и исторические знаки. Стандарт UNICODE поддерживается тремя формами, 32-битной (UTF-32), 16-битной (UTF-16) и 8-битной (UTF-8). Восьмибитная форма UTF-8 была разработана для удобной совместимости с ASCII-ориентироваными системами кодирования. Стандарт UNICODE совместим с Международным стандартом International Standard ISO/IEC 10646.
Наиболее просто устроена форма UTF-32. В ней каждый символ закодирован при помощи 32-битного блока. Благодаря этому каждый символ UTF-32 обладает однозначным соответствием между декодированным символом и блоком кода. Это форма имеет фиксированную длину знакоместа. Она покрывает все кодовое пространство UNICODE - 0...10FFFF16. Это гарантирует полную совместимость с UTF-16 и UTF-8. Форма UTF-32 является наиболее предпочитаемой для большинства UNIX платформ.
Стандарт UNICODE содержит 96 382 символа, взятых их мировых шрифтов. Этих символов более чем достатонно для общения на всех известных языках мира, а также для написания классических (исторических ) шрифтов многих языков. UNICODE всключает в себя шрифты европейских алфавитов, средне-азиатское письмо, направленное справа на лево, шрифты Азии, и многие другие. Подмножество символов (code points) HUN включает 70 207 идеографических символов определяемых по национальным и промышленным стандартам Китая, Японии, Кореи, Тайвани, Вьетнама и Сингапура. Более того, UNICODE содержит знаки пунктуации, математические символы, технические символы, герметрические фотмы и графические метки (dingbats), фонетические знаки.
Ниже приведена сравнительная таблица кодов ASCII и UNICODE, взятая из Фрагмента спецификации UNICODE 4.0 (Unicode Standard, Version 4.0), размещенного на сайте Unicode Consortium.