
- •Предпосылки создания и развитие Юникода
- •Версии Юникода
- •Кодовое пространство
- •Система кодирования
- •Модифицирующие символы
- •Формы нормализации
- •Примеры
- •Двунаправленное письмо
- •Представленные символы
- •Способы представления
- •Порядок байтов
- •Юникод и традиционные кодировки
- •Реализации
- •Проблемы Юникода
- •«Юникод» или «Уникод»?
«Юникод» или «Уникод»?
«Unicode» — одновременно и имя собственное (или часть имени, например, Unicode Consortium), и имя нарицательное, происходящее из английского языка.
На первый взгляд предпочтительнее использовать написание «Уникод». В русском языке уже есть морфемы «уни-» (слова с латинским элементом «uni-» традиционно переводились и писались через «уни-»: универсальный, униполярный, унификация, униформа) и «код». Напротив, торговые марки, заимствованные из английского языка, обычно передаются посредством практической транскрипции, в которой деэтимологизированное сочетание букв «uni-» записывается в виде «юни-» («Юнилевер», «Юникс» и т. п.), то есть точно так же, как в случае с побуквенными сокращениями, вроде UNICEF «United Nations International Children’s Emergency Fund» — ЮНИСЕФ.
Написание «Юникод» уже твёрдо вошло в русскоязычные тексты. Согласно Поисковой системе Яндекс, частота использования этого слова примерно в 11 раз превышает «Уникод»[19]. В Википедии используется более распространённый вариант.В MS Windows используется вариант «Юникод».
На сайте Консорциума есть специальная страница, где рассматриваются проблемы передачи слова «Unicode» в различных языках и системах письма. Для русской кириллицы указан вариант «Юникод»[1].
Формы, принятые иностранными организациями для русской передачи слова «Unicode», являются рекомендательными.
См. также
-
Символы, представленные в Юникоде
-
ASCII
-
ISO 8859-1
-
UTF-8
-
Кириллица в Юникоде
-
Дроби в Юникоде
-
XeTeX
-
Шрифты, поддерживающие юникод
-
Свободные универсальные шрифты
-
Windows Glyph List 4
-
Широкий символ
-
Проект:Внесение символов алфавитов народов России в Юникод
Примечания
↑ Показывать компактно
-
↑ 1 2 Unicode Transcriptions (англ.). Архивировано из первоисточника 22 августа 2011. Проверено 10 мая 2010.
-
↑ Уникод в словаре Paratype
-
↑ The Unicode® Standard: A Technical Introduction. Архивировано из первоисточника 22 августа 2011. Проверено 4 июля 2010.
-
↑ History of Unicode Release and Publication Dates. Архивировано из первоисточника 22 августа 2011. Проверено 4 июля 2010.
-
↑ The Unicode Consortium. Архивировано из первоисточника 22 августа 2011. Проверено 4 июля 2010.
-
↑ 1 2 3 Foreword. Архивировано из первоисточника 22 августа 2011. Проверено 4 июля 2010.
-
↑ 1 2 General Structure. Архивировано из первоисточника 22 августа 2011. Проверено 5 июля 2010.
-
↑ European Alphabetic Scripts. Архивировано из первоисточника 22 августа 2011. Проверено 4 июля 2010.
-
↑ Unicode 88. Архивировано из первоисточника 22 августа 2011. Проверено 8 июля 2010.
-
↑ Unicode and Microsoft Windows NT (англ.). Microsoft Support. Архивировано из первоисточника 22 августа 2011.
-
↑ Unicode используется почти на 50% веб-сайтов (рус.). Архивировано из первоисточника 22 августа 2011.
-
↑ Roadmap to the TIP (Tertiary Ideographic Plane)
-
↑ http://www.cl.cam.ac.uk/~mgk25/ucs/utf-8-history.txt (англ.)
-
↑ Регистр в Unicode - это непросто
-
↑ В большинстве шрифтов для ПК реализованы «прописные» (маюскульные) моноширинные цифры.
-
↑ В некоторых случаях документ (не простой текст) в Юникоде может занимать существенно меньше места, чем документ в однобайтовой кодировке. Например, если некая веб-страница содержит примерно поровну русского и греческого текста, то в однобайтовой кодировке придётся либо русские, либо греческие буквы записывать, используя возможности формата документов, в виде кодов с амперсандом, которые занимают 6—7 байт на символ (при использовании десятичных кодов), т. е. в среднем на букву придётся 3,5—4 байта, в то время как UTF-8 занимает только 2 байта на греческую или русскую букву.
-
↑ Один из файлов шрифтов Arial Unicode имеет размер 24 мегабайта; существует Times New Roman размером 120 мегабайт, он содержит количество символов, близкое к 65536.
-
↑ Даже для самого современного и дорогого мобильного телефона затруднительно выделить 120 Мбайт памяти для полного Юникод-шрифта. На практике использование полных шрифтов требуется редко.
-
↑ 350 тыс. страниц «Юникод» против 31 тыс. страниц «Уникод».
Ссылки
-
Официальный сайт Консорциума Юникода (англ.)
-
Unicode в каталоге ссылок Open Directory Project (dmoz). (англ.)
-
Что такое Unicode? (рус.)
-
Последняя версия [1] стандарта Юникод (англ.)
-
Таблица символов Юникода с названиями и описаниями (рус.) (англ.) (нем.)
-
Связь Юникода и ISO/IEC 10646 (файл PDF) (англ.)
-
FAQ по UTF-8 и Unicode (англ.)
-
Кириллица в Юникоде: [2], [3], [4], [5] (файлы PDF) (англ.)
-
DecodeUnicode — Unicode WIKI (50 000 изображений символов) (англ.)
-
Включение поддержки дополнительных символов Юникода в Windows (англ.)
-
Поиск по символам Юникода (англ.)