Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Lektsii_po_informatike_Balafanov.doc
Скачиваний:
23
Добавлен:
06.11.2018
Размер:
1.34 Mб
Скачать

30.5. Кодировка

    Использование альтернативной кодировки в пределах канонического набора символов с системами MS-DOS и Windows в нашей компьютерной практике стало стандартом дефакто. В сети RELCOM стандартным кодом является код KOI8-R, в котором символы кириллицы не совпадают с их представлениями в альтернативной кодировке. Поэтому при передаче в эту сеть письма, созданные в системе MS-DOS или Windows, автоматически перекодируются из альтернативного кода в KOISR и наоборот.

30.6. Код Воляпюк

    В некоторых случаях используется возможность передачи за рубеж и русскоязычного текста, который из-за отсутствия у получателя средств интерпретации кириллицы преобразуется в так называемый код Волапюк, позволяющий заменить каждую русскую букву одной или двумя латинскими (сравните, скажем, Волапюк и Volapjuk). Такое преобразование в сети будет правильно выполнено лишь для стандартных кодировок кириллицы (альтернативного кода - для пользователей MS-DOS и Windows, KOI8-R - для пользователей Unix). Код Волапюк применяется, например, некоторыми диспетчерскими службами, ведущими переписку на русском языке с аналогичными службами за рубежом.

30.7. Уплотнение и архивирование файлов

    Пользователи, имеющие дело с небольшими объемами информации, могут относительно долго пребывать в уверенности, что оплата услуг в сети электронной почты - необременительна. Но при больших объемах информации ситуация существенно меняется. При передаче по сети документов большого объема, плохой линии связи угрожает превратиться в безнадежную, заметно вырастает и сумма оплаты. Для разрешения отмеченных трудностей существуют специальные программы, называемые упаковщиками.     В MS-DOS традиционно используются программы-архиваторы, совмещающие функции архивирования и упаковки файлов, например, arj, pkzip (pkunzip), zip (unzip). Следует иметь в виду, что текстовые файлы, включенные в архивный файл, уже не будут автоматически преобразовываться в другой код при передаче по сети.

30.8. Кодирование двоичных файлов

    Большинство существующих сетей не позволяет помещать содержимое двоичных файлов непосредственно в тело письма (стандартно гарантируется только передача 7-битного кода). Поэтому, чтобы переслать такой файл (например, полученный в результате архивации и упаковки) по почте, его приходится сначала перекодировать, например, с помощью программы ullencode, а получателю потом раскодировать программой ulldecode. Результат работы программы tmencode, если пытаться просматривать его на экране как обычный текст, имеет определенные текстовые ярлыки в начале (begin X filename) и в конце (end) сообщения. А все то, что расположено между этими ярлыками - невообразимая путаница различных символов. Тем не менее это текстовый файл: он разбит на строки определенной длины, каждая из которых имеет “конец строки” и может обрабатываться текстовыми редакторами. Операцию преобразования двоичного файла в текстовый принято называть кодированием, а обратную операцию - раскодированием. Кодирование осуществляется таким образом, чтобы полученный файл можно было послать в любую сеть мира. В связи с тем, что ряд зарубежных сетей использует не восьмибитное (байтовое) представление, а семибитное, кодирование осуществляется в семибитное представление. Это, в частности, приводит к тому, что результат (по сравнению с исходным двоичным файлом) имеет несколько больший размер: для uuencode - примерно на 30%.     Письма, представленные стандартным набором символов без использования кириллицы, автоматически оказываются представленными в семибитной кодировке и, таким образом, их не требуется кодировать. К таким же относятся и письма, представленные в коде Волапюк.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]