Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Programming_Windows_95_Part_I.pdf
Скачиваний:
96
Добавлен:
05.06.2014
Размер:
4.61 Mб
Скачать

199

умолчанию им является SYSTEM_FONT или "системный шрифт" (system font), в котором используется набор символов ANSI. Если вы хотите выводить на экран символы из набора OEM, то вы можете выбрать OEM_FIXED_FONT (также называемый "терминальный шрифт" (terminal font) в контекст устройства, используя следующий оператор:

SelectObject(hdc, GetStockObject(OEM_FIXED_FONT));

Международные интересы

Здесь рассказывается о том, почему в середине главы, посвященной клавиатуре, нам приходится говорить о шрифтах. Мы установили, что когда пользователь Windows набирает на неамериканской клавиатуре символ с диакритическим знаком, то параметром wParam сообщения WM_CHAR является код этого символа из набора символов ANSI.

Поэтому, если вам необходимо получить на экране отображение этого символа, то вам было бы лучше пользоваться шрифтом из набора символов ANSI (таким как SYSTEM_FONT или SYSTEM_FIXED_FONT). Если вы вместо этого используете OEM_FIXED_FONT, то символ, который вы выводите на экран, окажется неправильным, и пользователь будет неприятно удивлен. Несколько других простых правил позволят сохранить логику работы с клавиатурой в вашей программе для Windows при адаптации к рынкам Европы.

Работа с набором символов

Если вы получаете сообщение WM_CHAR, то запомните, что значение параметра wParam вполне реально может оказаться больше, чем 128. И это не ошибка. Не думайте, что все, что больше 127 — это неправильные символы.

Вам может понадобиться преобразовать регистр символа, т. е. сделать из строчной буквы — прописную. Не используйте ваш собственный алгоритм:

if(ch >= 'a'

&& ch <= 'z')

// ОШИБКА!!!

ch -=

32;

Это плохой стиль даже для программ, написанных не для Windows. Но однако нельзя пользоваться и стандартной функцией С:

ch = toupper(ch);

// ОШИБКА!!!

Обе эти функции работают только с нижней половиной набора символов ANSI. Они не преобразуют 0xE0 в 0xC0.

Вместо них вам следует пользоваться функциями CharUpper и CharLower Windows. Если pString — это оканчивающаяся нулевым символом строка, то вы можете преобразовать ее в верхний регистр с помощью функции CharUpper:

CharUpper(pString);

Для строки, которая не оканчивается нулевым символом, нужно использовать функцию CharUpperBuff:

CharUpperBuff(pString, nLength);

Для преобразования одного символа также можно пользоваться функцией CharUpper, но требуется некоторая поправка, поскольку старшее слово параметра должно быть равно 0:

ch = CharUpper((PSTR)(LONG)(BYTE)ch);

Если ch определяется как беззнаковый символ, то преобразование типа BYTE не требуется. Кроме вышеперечисленных, в Windows используются функции CharLower и CharLowerBuff для преобразования прописных букв в строчные.

Если вы действительно серьезно намерены писать программы для Windows, которые можно было бы приспосабливать к иностранным языкам, вы должны также изучить функции CharNext и CharPrev. Эти функции облегчают работу с многобайтными наборами символов, часто используемых в странах Дальнего Востока. Для этих наборов символов требуется больше 256 символов, некоторые из которых задаются двумя байтами. Если вы используете обычную арифметику указателей С для просмотра строки (например, при поиске символа обратной косой черты в строке пути, содержащем каталоги), то можете решить, что нашли нужный символ, хотя фактически вы нашли второй байт двухбайтного символьного кода. Функциям CharNext и CharPrev передается дальний указатель на символьную строку и они возвращают дальний указатель, который необходимым образом увеличен или уменьшен с учетом последних двухбайтных символьных кодов.

Связь с MS-DOS

Если бы Windows была только одной операционной оболочкой, работающей на машине, то вы могли бы забыть о наборе символов OEM и работать только с набором символов ANSI. Однако пользователи могут создавать файлы в

200

среде MS-DOS, а использовать их в Windows; они также могут создавать файлы в Windows, а использовать в MSDOS. К сожалению, в MS-DOS используется набор символов OEM.

Вот пример одной из проблем, которые могут встретиться. Предположим, что говорящий на немецком языке пользователь персонального компьютера создает в MS-DOS файл ÜBUNGEN.TXT "практические упражнения" в программе EDLIN. Для IBM PC буква Ü — это часть набора символов IBM (т. е. OEM) и ее код 154 или 0х9А. (При использовании MS-DOS с американской клавиатурой на IBM PC, вы можете набрать эту букву, напечатав <Alt>+154 на числовой клавиатуре.) MS-DOS использует этот код символа в записи каталога, соответствующей этому файлу.

Если программа для Windows использует вызовы функций MS-DOS для получения каталога файлов и вывода их имен затем прямо на экран с использованием шрифта, содержащего символы из набора символов ANSI, то первая буква ÜBUNGEN.TXT будет изображена в виде закрашенного прямоугольника, поскольку код 154 — это один из неопределенных символов набора символов ANSI. Программе для Windows необходимо преобразовать код 154 (или 0х9А) из расширенного набора символов IBM в код символа 220 (или 0хDС) из набора символов ANSI, который представляет из себя букву Ü. Эти задачи для вас решает функция Windows OemToChar. Она получает в качестве параметров два дальних указателя на строки. Символы OEM в первой строке преобразуются в символы ANSI и сохраняются во второй строке:

OemToChar(lpszOemStr, lpszAnsiStr);

Теперь рассмотрим противоположный пример. Пользователь, говорящий по-немецки, хочет воспользоваться вашей программой, написанной для Windows, для создания файла ÜBUNGEN.TXT. В имени файла, введенном пользователем, первая буква имеет код 220 (или 0хDС). Если вы используете для открытия этого файла вызов функции MS-DOS, то MS-DOS использует этот символ в имени файла. Если потом пользователь, находясь в MSDOS, посмотрит на этот файл, то первый символ будет выглядеть как прямоугольник. Перед тем как использовать вызов функции MS-DOS, вы должны преобразовать имя файла в набор символов OEM:

CharToOem(lpszAnsiStr, lpszOemStr);

Этот вызов преобразует код 220 (или 0хDС) в код 154 (или 0х9А). Windows также содержит две функции CharToOemBuff и OemToCharBuff, для которых символ ноль в конце строки не требуется.

Кроме этих функций для подобных преобразований в Windows имеется функция OpenFile. Если вы используете эту функцию, то вам не нужно преобразование с помощью функции CharToOem. Если вы используете вызовы функций MS-DOS для получения списка имен файлов (как это делает в Windows программа File Manager), то эти имена файлов, перед их выводом на экран, следует передать в функцию OemToChar.

Преобразование содержимого файлов является еще одной проблемой, возникающей, когда файлы используются и в Windows и в MS-DOS. Если в вашей программе для Windows используются файлы, которые, как вы уверены, были созданы в программе для MS-DOS, тогда вам может понадобиться обработать текстовое содержимое этих файлов с помощью функции OemToChar. Аналогично, если в программе для Windows подготовлен файл для использования в программе MS-DOS, то для преобразования текста вам может понадобиться функция CharToOem.

Функции OemToChar и CharToOem реализованы в драйвере клавиатуры. В них включены очень простые таблицы. Программа функции OemToChar преобразует код OEM от 0х80 до 0xFF в код символа из набора ANSI, который больше всего похож на соответствующий символ OEM. В некоторых случаях, это преобразование является лишь очень грубым приближением. Например, большинство символов псевдографики в наборе символов IBM преобразуется в знаки плюсов, тире и вертикальных линий. Большинство кодов OEM от 0х00 до 0x1F не преобразуются в коды ANSI.

Функция CharToOem преобразует коды ANSI от 0хА0 до 0xFF в коды из набора символов OEM. Символы со знаками типа ударения в наборе символов ANSI, которых нет в наборе символов OEM, преобразуются в коды обычных, не имеющих диакритических знаков, символов ASCII.

Использование цифровой клавиатуры

Как вы, вероятно, знаете, клавиатура IBM PC и BIOS позволяет вам вводить коды расширенного набора символов IBM посредством нажатия клавиши <Alt> и набора десятичного кода из трех цифр, представляющего собой код символа OEM, на цифровой клавиатуре. Эта возможность воспроизводится в Windows двумя способами.

Во-первых, когда вы вводите <Alt>-[код OEM] на цифровой клавиатуре, то Windows выдает вам код того символа ANSI (в параметре wParam сообщения WM_CHAR), который имеет наибольшее сходство с соответствующим символом OEM, представленным кодом OEM. Вернее, Windows перед тем как выработать сообщение WM_CHAR, обрабатывает код с помощью функции OemToChar. Эта возможность очень удобна для пользователя: если у вас нет иноязычной клавиатуры, и вы привыкли печатать Ü с помощью <Alt>+154, то вы можете делать то же самое и в программе для Windows. Вам не нужно переучиваться на коды символов ANSI.

201

Во-вторых, если вам нужно генерировать коды расширенного набора символов ANSI с помощью американской клавиатуры, наберите <Alt>-0[код OEM] на числовой клавиатуре. Параметр wParam сообщения WM_CHAR получит этот код OEM. Таким образом, <Alt>-0220 тоже соответствует Ü. Вы можете попытаться проделать это в программах KEYLOOK или TYPER.

Решение проблемы с использованием системы UNICODE в Windows NT

Производители программ, создающие приложения для международного рынка, вынуждены были иметь дело с нестандартными решениями проблемы 7-разрядного кода ASCII, такими как кодовые страницы и наборы двухбайтных символов. Лучшее решение необходимо, и им может стать Unicode.

Unicode — это кодирование символа, которое использует единообразный 16-разрядный код для каждого символа. Это позволяет получать коды любого символа, написанного на любом языке мира, из тех, которые вероятнее всего будут использоваться в сфере компьютерных коммуникаций, включая иероглифы Китая, Японии и Кореи. Unicode разрабатывался консорциумом компьютерных компаний (включая самые крупные), и документирован в книге Unicode Standart, опубликованной издательством Addison-Wesley.

К сожалению, в Windows 95 имеются только некоторые элементы поддержки системы Unicode, и Windows 95 не обеспечивает работы с символами Unicode с помощью драйвера клавиатуры, в отличие от Windows NT, в которой изначально была заложена поддержка Unicode.

Очевидно, что адаптация программ (и умов программистов) к идее 16-разрядных символов — это непростая работа, но она окупится сторицей, если у нас появится возможность выводить на экраны и принтеры персональных компьютеров информацию на всех языках мира. Если вы интересуетесь концепцией и механикой системы кодирования Unicode, реализованной в Windows NT, то вы можете открыть рубрику "Enviroments" в PC Magazine за 1993 год, статьи за 26 октября, 9 ноября, 23 ноября и 7 декабря (где они были случайно не указаны в содержании, но тем не менее напечатаны, начиная со страницы 426).

Соседние файлы в предмете Операционные системы