
- •1) Коды ascii и кои-8: характеристики, состав, структура.
- •2) Альтернативная и основная кодировки.
- •3) Кодировки iso 8859-5 и сp 1251
- •4) Понятие о кодах ebcdic и дкои
- •5) Кодировки Unicode, utf-8. Iso 8859-5 и 10646
- •6) Понятие о клавиатурных раскладках. Оновные принципы.
- •7) Раскладки qwerty и йцукен и соответствие между знаками кириллицы и латинского алфавита для обычной и фонетической латино-кириллических раскладок.
- •8) Раскладки Дворака и Diktor.
5) Кодировки Unicode, utf-8. Iso 8859-5 и 10646
Unicode— стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Коды в стандарте Юникод разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей, знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. Юникод имеет несколько форм представления : UTF-8, UTF-16 и UTF-32. Была разработана также форма представления UTF-7 для передачи по семибитным каналам, но из-за несовместимости с ASCII она не получила распространения и не включена в стандарт.
UTF-8 в настоящее время распространённая кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста. Нашла широкое применение в операционных системах и веб-пространстве. Текст, состоящий только из символов Юникода с номерами меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом.
ISO 8859-5 — 8-битная кодовая страница из семейства кодовых страниц стандарта ISO-8859 для представления кириллицы.
ISO 8859-5 была создана на базе «основной кодировки» (все русские буквы сохранили своё расположение, за исключением заглавной Ё).
Имеются буквы многих языков, использующих кириллицу, однако в целом ISO 8859-5 — не очень удобная кодировка, поскольку в ней отсутствуют многие нужные символы, такие как тире (—), кавычки-ёлочки («»), градус (°) и др. Нет также буквы Ґ, используемой в украинской письменности.
Порядок символов этой кодовой страницы использовался при размещении букв кириллицы в наборе символов Unicode (со сдвигом вверх на 864 позиции).
Консорциум Юникода работает в тесной связи с рабочей группой ISO/IEC/JTC1/SC2/WG2, которая занимается разработкой международного стандарта 10646 (ISO/IEC 10646). Между стандартом Юникода и ISO/IEC 10646 установлена синхронизация, хотя каждый стандарт использует свою терминологию и систему документации.
Стандарт ISO/IEC 10646 также имеет две основные формы кодирования символов: UCS-2 (2 байта на символ, аналогично UTF-16) и UCS-4 (4 байта на символ, аналогично UTF-32). UCS значит универсальный многооктетный (многобайтовый) кодированный набор символов. UCS-2 можно считать подмножеством UTF-16 (UTF-16 без суррогатных пар), а UCS-4 является синонимом для UTF-32.
6) Понятие о клавиатурных раскладках. Оновные принципы.
Раскла́дка клавиату́ры — соглашение о соответствии типографических символов (букв, цифр, знаков препинания и т. д.) письменного языка клавишам клавиатуры компьютера, печатной машинки или другого устройства, с помощью которого вводится текст. Раскладка устанавливает несколько соответствий между клавишами и значениями, вводимыми с их помощью:
механическая раскладка (англ. mechanical layout) — форма, размеры и взаимное расположение клавиш на клавиатуре;
визуальная раскладка (англ. visual layout) — маркировка клавиш;
функциональная раскладка (англ. functional layout) — значения, вводимые одиночным или совместным нажатием клавиш. Она обеспечивается минимум двумя составными частями:
аппаратная раскладка — соответствие скан-кода (идентификатора) и физической клавиши. Она постоянна для данной клавиатуры;
программная раскладка — соответствие скан-кодов и кодов символов (и управляющих кодов), передаваемых программе (и, как правило, отображаемых на экране в виде букв необходимого алфавита. Именно она обычно имеется в виду под раскладкой).
Возможно существование нескольких раскладок для одного письменного языка. Например, существуют раскладки ЙЦУКЕН и фонетическая (ЯВЕРТЫ) для русского языка; QWERTY, Дворака и Colemak для английского языка.