Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Информатика5.docx
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
485 Кб
Скачать

Билет № 12 Понятие о типах данных

Несмотря на то, что минимальной единицей кодирования информации является 1 бит, данные для своего представления будут требовать значительно большего объема, они будут занимать группы байт, а адресом их нахождения будет самого 1 байта этой группы.

От сюда следует, что произвольно взятый из памяти байт не предоставляет нам никаких сведений о том, частью какого информационного объекта он является(целого числа, частью управляющей команды и т.д.) Следовательно кроме задачи представления данных в двоичном коде решается параллельная задача интерпретации этих двоичных кодов, т.е. каким образом из этих кодов восстановить первоначальные данные, поэтому для представления основных видов информации целые числа, числа с плавающей запятой, символы, звук, графика, видео и т.д. В системах программирования и ОС используют специальные виды абстракций, которые называют типы данных, каждый тип данных определяет логическую структуру представления и интерпретации для соответствующих типов данных, а каждому типу данных определены инструкции их обработки и допустимые операции над ними.

Билет № 13 Представление символьных и тестовых данных в двоичном коде. Символы и кодировки. Текстовые строки. Текстовые документы.

Для представления символов в числовой форме был предложен метод кодирования. Кодом называется уникальное беззнаковое число, поставленное в соответствии некоторому символу. Под алфавитом вычислительной машины понимают совокупность вводимых и отображаемых символов. Алфавит вычислительной машины включает в состав: арабские цифры, буквы латинского алфавита, знаки препинания спец. символы, а так же специальные знаки, символы псевдографики и буквы национального алфавита. Изначально для хранения кода одного символа отвели 1 байт (8 разрядов), что позволило закодировать алфавит ЭВМ в кол-ве 256 различных символов. Система в которой каждому символу поставлен в соответствии конкретный код называется кодовой таблицей. Поскольку каждому символу можно поставить в соответствии любой код, что делалось совершенно произвольным образом, возникла проблема несовместимости механизмов интерпретации кодов на различных ЭВМ. Что привело к решению обеспечить жесткое установление методики интерпретации для всех ЭВМ путём структуризации. Такую систему придумали в Америке в 1981 году компания ANSI, предложив стандартную кодовую таблицу. ASCII ( American Standard of Information Interchange). Эту таблицу стали использовать программные продукты, работающие под управлением OC MS DOS(Microsoft) по заказу крупнейшего производителя компьютеров IBM. Кодовая таблица ASCII содержит 256 символов и их коды. И разделена на 2 части: основную и расширенную. Основная часть с кодами от 0 до 127 является базовой. Установлена данным стандартом, изменению не подлежит. Коды от 1 до 31 – управляющие символы, арабские цифры от 0 до 9, знаки препинания, специальные символы, заглавные и строчные буквы латинского алфавита от A до Z. Расширенная часть- коды от 128 до 255 – часть, которую отдали под национальный алфавит + символы псевдографики и некоторые доп. спец. символы. Эта часть устанавливается и изменятся в зависимости от нац. алфавита. Семейство Windows поддерживает большое количество расширений кодовой таблицы ASCII, в России получила распространение таблица Windows – 1251. В 1991 году производители оборудования и ПО совместно с организациями по стандартизации выработали новый единый стандарт кодирования символов – Unicode. Он построен на 16 битной системе и способен интерпретировать 65536 символов, которых более чем достаточно для кодирования всех известных национальных алфавитов в одной таблице. Поскольку теперь каждый символ кодировался 2 байтами, все тексты, записанные в кодовой таблице Unicode стали длиннее в 2 раза.

Текстовая строка – конечная последовательность символов. Длина символьной строки – это кол-во в ней символов. Записывается в память символьная строка двумя способами:

  1. Либо числа, обозначающие длину строки текста, затем текстовая строка

  2. Либо строка, а затем разделитель строк

Текстовые документы.

Они используются для хранения и обмена большим кол-вом данных. Проблемой является восприятие человеком не структурированных текстов. Структурирование текста достигается форматированием. Специфическим расположением текста в текстовом документе.