Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
26
Добавлен:
02.05.2014
Размер:
98.82 Кб
Скачать

Лекция № 10

Тема: Организация данных

  1. Типы и структуры данных

Множество допустимых значений данных, объединенных общим содержанием и именем, а также совокупностью допустимых операций, которые можно выполнять над этими данными, включая способ их хранения в памяти ЭВМ. Над этими данными, включая способ их хранения в памяти ЭВМ. Понятие «тип данных» делает манипулирование данными с использованием средств вычислительной техники абстрактным процессом и скрывает лежащее в основе обращения с ними представление их в виде двоичного кода.

Виды типов данных:

  • Аналоговые данные [analog data] – данные, принимающие произвольные значения изщ заданного диапазона, и представляемые в виде непрерывно изменяющихся физических величин, например напряжения, длительности сигнала;

  • Дискретные (цифровые) данные [digital data], представленные в дискретном коде в определенной, например, двоичной системе счисления;

  • Аналого-цифровые данные [analog-digital data] –аналоговые данные, преобразуемые для обработки в цифровой код;

  • Двоичные данные [binary data], представленные в двоичном коде;

  • Десятичные данные [decimal data], представленные в десятичном коде;

  • Алфавитно-цифровые (текстовые) данные [alphanumeric data], значения которых составлены из любых знаков алфавита;

  • Числовые (арифметические) данные [arithmetic data], над которыми можно выполнять арифметические операции.

Структуры данных.

Работа с большими наборами данных автоматизируется проще, когда данные упорядо­чены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная. Их можно рассмотреть на примере обычной книги.

Если разобрать книгу на отдельные листы и перемешать их, книга потеряет свое назначение. Она по-прежнему будет представлять набор данных, но подобрать адекват­ный метод для получения из нее информации весьма непросто. (Еще хуже дело будет обстоять, если из книги вырезать каждую букву отдельно — в этом случае вряд ли вообще найдется адекватный метод для ее прочтения.)

Если же собрать все листы книги в правильной последовательности, мы получим простейшую структуру данных — линейную. Такую книгу уже можно читать, хотя для поиска нужных данных ее придется прочитать подряд, начиная с самого начала, что не всегда удобно.

Для быстрого поиска данных существует иерархическая структура. Так, например, книги разбивают на части, разделы, главы, параграфы и т. п. Элементы структуры более низкого уровня входят d элементы структуры более высокого уровня; разделы состоят из глав, главы из параграфов и т. д.

Для больших массивов поиск данных в иерархической структуре намного проще чем в линейной, однако и здесь необходима навигация, связанная с необходимостью просмотра. На практике задачу упрощают тем, что в большинстве книг есть вспо­могательная перекрестная таблица, связывающая элементы иерархической струк­туры с элементами линейной структуры, то есть связывающая разделы, главы и параграфы с номерами страниц. В книгах с простой иерархической структурой, рассчитанных на последовательное чтение, эту таблицу принято называть оглавле­нием, а в книгах со сложной структурой, допускающей выборочное чтение, ее назы­вают содержанием

  1. Организация данных на устройствах с прямым и последовательным доступом

Доступ — процедура установления связи с памятью и размещенным в ней файлом для записи и чтения данных. ________________

Последовательный доступ – при каждом считывании информации во внешнюю среду предоставляется очередная запись таблицы или файла. Чтобы получить в распоряжение i-ю по счету запись таблицы, необходимо произвести считывание предыдущих (i-1) записей.

Прямой доступ – при каждом считывании информации сразу предоставляется запись, находящаяся в ячейке, адрес которой был указан.

  1. Файлы данных. Файловые структуры

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом, как мы уже знаем, образуется «паразитная нагрузка» в виде адресных данных. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл - это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относя­щиеся к одному типу. В этом случае тип данных определяет тип файла.

Проще всего представить себе файл в виде безразмерного канцелярского досье, в которое можно по желанию добавлять содержимое или извлекать его оттуда. Поскольку в определении файла нет ограничений на размер, можно представить себе файл, | имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.

B определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адреса­цией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информа­ции из файла.

Требование уникальности имени файла очевидно — без этого невозможно гаран­тировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически - создать файл с именем, тождественным уже имеющемуся, не может ни пользователь, ни авто­матика.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ «\»(обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

<имя носителя>\<имя каталога-1>\...\<имя каталога-М>\<собственное имя файла>

Вот пример записи двух файлов, имеющих одинаковое собственное имя и размещен­ных на одном носителе, но отличающихся путем доступа, то есть полным именем. Для наглядности имена каталогов (папок) напечатаны прописными буквами.

С:\АВТОМАТИЧЕСКИЕАППАРАТЫ\ВЕНЕРА\АТМОСФЕРА\Результаты исследований

С:\РАДИОЛОКАЦИЯ\ВЕНЕРА\РЕЛЬЕФ\Результаты исследований

  1. Носители информации и технические средства для хранения данных

4.1. Регистровая кэш-память

Регистровая КЭШ-память - высокоскоростная память сравнительно большой емкости, являющаяся буфером между ОП и МП и позволяющая увеличить скорость выполнения операций. Создавать ее целесообразно в ПК с тактовой частотой задающего генератора 40 МГц и более. Регистры КЭШ-памяти недоступны для пользователя, отсюда и название КЭШ (Cache), в переводе с английского означает "тайник".

В КЭШ-памяти хранятся данные, которые МП получил и будет использовать в ближайшие такты своей работы. Быстрый доступ к этим данным и позволяет сократить время выполнения очередных команд программы. При выполнении программы данные, считанные из ОП с небольшим опережением, записываются в КЭШ-память.

По принципу записи результатов различают два типа КЭШ-памяти:

КЭШ-памятъ "с обратной записью" — результаты операций прежде, чем их записать в ОП, фиксируются в КЭШ-памяти, а затем контроллер КЭШ-памяти самостоятельно перезаписывает эти данные в ОП;

КЭШ-память "со сквозной записью" — результаты операций одновременно, параллельно записываются и в КЭШ-память, и в ОП.

Микропроцессоры начиная от МП 80486 имеют свою встроенную КЭШ-память (или КЭШ-память 1-го уровня), чем, в частности, и обусловливается их высокая производительность. Микропроцессоры Pentium и Pentium Pro имеют КЭШ-память отдельно для данных и отдельно для команд, причем если у Pentium емкость этой памяти небольшая — по 8 Кбайт, то у Pentium Pro она достигает 256 - 512 Кбайт.

Следует иметь в виду, что для всех МП может использоваться дополнительная КЭШ-память (КЭШ-память 2-го уровня), размещаемая на материнской плате вне МП, емкость которой может достигать нескольких мегабайтов.

Примечание. Оперативная память может строиться на микросхемах динамического (Dinamic Random Access Memory — DRAM) или статического (Static Random Access Memory — SRAM) типа. Статический тип памяти обладает существенно более высоким быстродействием, но значительно дороже динамического. Для регистровой памяти (МПП и КЭШ-память) используются SRAM, а ОЗУ основной памяти строится на базе DRAM-микросхем.

4.2. Основная память

4.2.1. Физическая структура

Основная память содержит оперативное (RAM — Random Access Memory — память с произвольным доступом) и постоянное (ROM — Read-Only Memory) запоминающие устройства.

Оперативное запоминающее устройство предназначено для хранения информации (программ и данных), непосредственно участвующей в вычислительном процессе на текущем этапе функционирования ПК.

ОЗУ — энергозависимая память: при отключении напряжения питания информация, хранящаяся в ней, теряется. Основу ОЗУ составляют большие интегральные схемы, содержащие матрицы полупроводниковых запоминающих элементов (триггеров). Запоминающие элементы расположены на пересечении вертикальных и горизонтальных шин матрицы; запись и считывание информации осуществляются подачей электрических импульсов по тем шинам матрицы, которые соединены с элементами, принадлежащими выбранной ячейке памяти.

Постоянное запоминающее устройство также строится на основе установленных на материнской плате модулей (кассет) и используется для хранения неизменяемой информации: загрузочных программ операционной системы, программ тестирования устройств компьютера и некоторых драйверов базовой системы ввода-вывода (BIOS — Base Input-Output System) и др. Из ПЗУ можно только считывать информацию, запись информации в ПЗУ выполняется вне ЭВМ в лабораторных условиях. Модули и кассеты ПЗУ имеют емкость, как правило, не превышающую нескольких сот килобайт. ПЗУ — энергонезависимое запоминающее устройство.

Примечание, В последние годы в некоторых ПК стали использоваться полупостоянные, перепрограммируемые запоминающие устройства— FLASH-nамять. Модули или карты FLASH-памяти , могут устанавливаться прямое разъемы материнской платы и имеют следующие параметры: емкость от 32 Кбайт до 4 Мбайт, время доступа по считыванию 0,06 мкс, время записи одного байта примерно 10 мкс; FLASH-память — энергонезависимое запоминающее устройство.

Структурно основная память состоит из миллионов отдельных ячеек памяти емкостью 1 байт каждая. (Общая емкость основной памяти современных ПК обычно лежит в пределах от 1 до 32 Мбайт. Емкость ОЗУ на один-два порядка превышает емкость ПЗУ: ПЗУ занимает 128 (реже 256) Кбайт, остальной объем— это ОЗУ.)

Соседние файлы в папке Лекция 10