Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
50-53(без разницы).docx
Скачиваний:
2
Добавлен:
04.09.2019
Размер:
31.87 Кб
Скачать

51.Кодировки и форматы данных, используемые в Интернет. 8-ми и 16-ти битные кодировки. Форматы данных, используемые в Интернет. Основные и вспомогательные форматы.

Файл – это хранилище стабильных и мобильных данных. Обычно файл имеет имя, атрибуты, время модификации и время создания.ОС первых больших ЭВМ предст-ли файл, как хранилище для БД и файл яв-лся набором записей. В ОС UNIX под файлом понималась последов-сть байтов, не надо было запоминать размер записи. Другие ОС поддерж-ют идею UNIX о том, что файл – последов-сть байтов. Файл – это поименованная послед-ость байтов.

Файловая стр-ра пред-ет собой систему хранения файлов на запом-щем устройстве. Файлы орган-ны в каталоги. Любой каталог может содержать произвольное число подкаталогов, в каждом из которых могут храниться файлы и другие каталоги. Способ, кот орган-ны данные, наз-ся форматом файла. Все файлы условно можно разделить на две категории – текстовые и двоичные.

Текстовые файлы - наиболее распр-ный тип данных. Для хранения каждого символа отводится один байт, а кодир-е текстовых файлов вып-ют с помощью спец таблиц, в кот каждому символу соотв-ет опр-ое число, не превышающее 255. Файл, для кодировки кот ис-ется только 127 первых чисел, наз-ся ASCII-файлом, но в таком файле не представлены буквы, отличные от латиницы. Большинство нац алфавитов можно закод-ть с помощью восьмибитной таблицы. Для русского популярны на три кодировки: Koi8-R, Windows-1251 и альтернативная (alt) кодировка. В стандарте Unicode (UTF-8) кодир-я символов ис-ся диапазон чисел от 0 до 65 535.

Двоичные файлы не предназначены непосредственно для чтения человеком. Примерами двоичных файлов являются исполняемые программы и файлы с графическими изображ-ми.

В России первой возникла кодировка KOI8 (код обмена информации восьмибитный). Яв-ся основным стандартом для серверов, работающих на базе платформы и ис-ся в качестве формата по умолчанию электр почты на русском языке. Microsoft, создавая ПО для работы в Интернет, предложила стандарт Microsoft code page1251 (Windows 1251).

Кодировка ISO-8859-5 была разработана ISO и применяется в основном в UNIX-совместимых ОС, ISO не получила широкого распр-ия, но все же достаточно часто встречается в Интернет и активно поддерж-ся рядом русскояз-х серверов.

Универ-й междунар стандарт Unicode был создан с благородной целью объед-ть все сущ-щие нац-ные кодировки в одну. Для отображения одного символа в Unicode отводится два байта, данная код-ка включает в себя 65 536 знаков. В это число входят не только буквы всех алфав-ов мира как сущ-щих ныне и созданных искус-но, так и уже практически вымерших, но и множество спец символов – матем-их, музыкальных, физич-х.

Большинство серверных программ обладают встроенной ф-цией автом-го опр-ния кодировки, ис-емой клиентским ПО, и перевода текста в необходимый стандарт. Когда необх-мо перевести текст из одной кодировки в другую, обычно применяют одну из многочисл-х программ-перекодир-ов.

Форматы данных, используемые в Интернет.

HTML. Страницы, содержащие инструкции HTML, первый и самый распр-ый формат файлов в Интернете. HTM – абс-ный синоним HTML (ис-лся когда расширение файла не могло превышать трех символов). SHTML - HTML-файл, кот перед отправкой на клиент (в браузер) обрабатывается сервером на предмет SSI (Server Side Includes) инструкций. Сервер может вставить в HTML текст какие-то данные: Содержимое другого файла, текущее время и др.

DHTML*- Динамичный HTML. Не формат а понятие, означающее что в HTML док-те есть вставки скриптовых языков (JavaScript, VBScript, PerlScript, PHP Script). Скрипты вып-ся на клиенте. Файлы, содер-щие такие скрипты могут иметь расширения: ,html, .htm, .shtml или же генерироваться PHP, ASP и CGI скриптами.

XHTML*- расширенный HTML. XML жестко и четко стандартиз-ный язык разметки, ис-ся также как dhtml.

Два способа кодир-я граф-ой инф-и: векторный и растровый. При векторном, рисунок предст-ется в виде комбинации простых геометр-их фигур. Растровый формат - все изобр-е по вертикали и горизонтали разбивается на мелкие прямоуг-ки пикселы.

JPEG – эф-ный метод хранения изобр-й с большой глубиной цвета. Расширение: .jpg . В JPEG ис-ся алгоритм сжатия с потерями. Сжатие необратимо искажает изобр-е. Зато размер файла получается от 10 до 500 раз меньше, чем BMP.

GIF - предназначен для хранения растровых изобр-й с сжатием. В одном файле этого формата может храниться несколько изобр-й (анимированные изобр-я). GIF-формат позволяет записывать изображение "через строчку", имея только часть файла, можно увидеть изобр-е целиком, но с меньшим разрешением. Эта широко применяется в Интернет.

Word - формат фирмы Майкрософт,тексты – от простых писем вплоть до дипломных работ с графиками, формулами и таблицами.

Excel- формат предназачен для таблиц, математ-их калькуляций и их граф-го изобр-я.

PDF – стандарт для обмена и распростр-я различного рода материалов и док-ции. Для просмотра PDF-файлов существует бесплатное ПО, доступное для всех платформ; компактность файлов, криптозащита и контроль доступа; полная независимость от кодировок и от наличия шрифтов на конкретном компе.

PostScript - формат описаний страниц. Это язык програм-ния, содержащий команды принтеру.

DjVu - технология сжатия изобр-й для распрост-я сканир-ых док-ов.

CHM – формат HTMLHelp файлов контекстной справки.

WAV –Музыкальный формат, хорошее качество музыки. MP3 - Музыкальный формат, качество хуже. AVI и MPEG - видео-формат. Для архив-ния файлов ис-ся спец программы – архиваторы, для упаковки файлов путем сжатия хранимой в них инф-и. WinRar, WinAce, 7Zip и WinZip.