Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
AlgStr / Лекции.doc
Скачиваний:
44
Добавлен:
23.03.2015
Размер:
741.89 Кб
Скачать

Понятие о данных

Данными называют изображение информации, т.е. описание состояния носителя. С каждым источником информации обязательно связан язык интерпретации - язык преобразования информации в данные и наоборот. Информация всегда активна, а данные - пассивны. Говорят, что данные - это застывшая информация.

Язык интерпретации имеет алфавит: α1, α 2, ..., α m. С помощью символов этого языка сообщение изображается в виде строки символов S = s1, s2, ..., sN, где si - это некоторые αi. Строка символов разбивается на "слова" (фрагменты). При этом каждое слово изображает атрибут. Именно такое слово называется элементом данных. Элемент данных - это простейшая неделимая конструкция данных как и атрибут - неделимый элемент информации. Строка S называется логическим уровнем представления данных. Если мы будем изображать каждый символ si в виде определенного состояния (δj) некоторой физической среды, то (si) можно рассматривать как коды.

Рассмотрим среду, в которой каждый элемент может находится в kустойчивых состояниях. Выберем среду, в которойmтаких элементов.

Числа, которые могут быть отображены в такой среде, находятся в интервале от 0 до N-1, где. ЗафиксируемNи попытаемся найти такоеm, чтобы представить числа от 0 доN-1. Такое (наименьшее целое, которое больше либо равно выражению в скобках). Тогда число устойчивых состояний среду для заданного NравноQ(k)=m*k=k*.

Найдем такое k, при котором число необходимых состояний среды было бы минимальным. Для этого

Поэтому наиболее экономная среда хранения – среда с тремя устойчивыми состояниями. В компьютере используется среда с двумя устойчивыми состояниями. Число состояний можно понимать как число каких-то деталей(например зубчиков), которые нужно изготовить, чтобы представить число. Понятно, что среда тем надежнее, чем меньше количество деталей (меньшая вероятность сбоя, повреждения детали).

Пример.Сколько нужно зубчиков, чтобы представить числа от 0 до 999 приk=10,2,3

Решение.

Q(10) = 3*10=30 зубчиков.

Q(2): (1000<1024=) =>Q(2)=2*10=20 зубчиков

Q(3): (1000<2187=) =>Q(3)=3*7=21 зубчиков, но диапазон представления чисел – в 2 раза больше чем приk=2

Системы кодирования с фиксированным числом разрядов

- телеграфный код М2 – 6 двоичных разрядов (64 значений )

- КОИ7 - 7 двоичных разрядов (128 значений )

- ДКОИ - 8 двоичных разрядов (хватало 128 значений )

- ASCII- 8 двоичных разрядов (256 значений )

- UNICODE– в основном 16 двоичных разрядов (значений ), но есть разновидности:

- UCS- Стандарт состоит из двух основных разделов: универсальный набор символов (англ.UCS, universal character set) и семейство кодировок (англ. UTF, Unicode transformation format). Универсальный набор символов задаёт однозначное соответствие символовкодам— элементам кодового пространства, представляющим неотрицательные целые числа. Семейство кодировок определяет машинное представление последовательности кодов UCS

- USC2 - 16 двоичных разрядов

- USC4 -32двоичных разрядов

UTF-8(отангл.Unicode Transformation Format, 8-bit— «формат преобразования Юникода, 8-битный») — распространённаякодировка символовЮникода, совместимая сASCIIи имеющая официальный статус. Нашла широкое применение в операционных системах и веб-пространстве[1].

UTF-16(англ.Unicode Transformation Format) винформатике— один изспособов кодированиясимволов изUnicodeв виде последовательности 16-битныхслов. Данная кодировка позволяет записывать символы Юникода в диапазонах U+0000..U+D7FF и U+E000..U+10FFFF (всего 1 112 064 штук). При этом каждый символ записывается одним или двумя словами (суррогатная пара).

Системы кодирования с переменным числом разрядов

Код Хофмана – система с переменным числом, при которой ни у каких двух кодов нет общего начала. Символы кодируются в зависимости от частоты их в исходной строке.

Например. Закодировать строку

enndeddeqe

  1. Сортируем символы по частоте: e,d,n,q

  2. Строим бинарное дерево, как показано на рисунке

Тогда:

e

n

n

d

e

d

d

e

q

e

1

001

001

01

1

01

01

1

000

1

Лекція 3. Поняття про структури даних.

Данные, являясь отображением информации, описывают элементы реального мира и участвует в обработке информационных моделей. Алгоритм обработки атрибутов определяется информационной моделью и сводится к реализации некоторого вычислительного процесса, в ко­тором участвуют значения атрибутов, т.е. элементы данных. При обра­ботке различной информации можно выделить тождественные, или экви­валентные, алгоритмы обработки совокупности (наборов) данных. Такие алгоритмы составляет существенную долю при создании информационных систем, особенно возросла их роль в связи с использованием и разра­боткой систем управления, базами данных.

Каждый элемент данных имеет набор характеристик (тип данного, форма представления, значение, длина поля и т.д.), которые опреде­ляют процедуру обработки этого элемента. Особой характеристикой записи данных является ключ, который позволяет идентифицировать выделить, (определить) единственный элемент множества. Обычно в качестве ключа выступает один или несколько элементов данных за­писи. В первом случае говорят о простом ключе, во втором случае ключ является составным. Для составного ключа важен не только набор элементарных данных, но и их порядок. Ключевые поля вводят определенные отношения между множеством записей.

Обработка множества проводится по определенному, задаваемому алгоритмом, логическому порядку элементов, который определяет целесообразный метод доступак элементам множества. Наиболее распространенными является две организации доступа: прямой доступ и последовательный доступ. Прямой доступ предполагает выделение элемента множества по его ключу или по другой аналогичной информации, независимо от обработки предыдущего элемента. Последовательный доступ предполагает выполнение обработки данного элемента после предыдущего элемента.

Второй характеристикой множества является стратегия взаимного расположения элементов данных в области памяти - стратегия адресации.

Организованную совокупность данных обычно называют структу­рой данных. Структура содержит информации о связях между элементами, общие характеристики множества и позволяет выполнять операции адресации и поиска.

Информационная модель может описывать несколько групп однотипных объектов, которые объединяются в группы по некоторому характеристическому свойству. Отвлекаясь от природы объектов можно отметить, что информационное обеспечение состоит из совокупности (группы) множеств элементов данных.

Специфичность элементов множества требует расширения набора операций над множествами. Hаряду с традиционными операциями для множеств, такими как пересечение, объединение, разность, принадлежность, рассматриваются и операции поиска, добавления, исключения и т.д.

Элементы множеств могут быть связаны между собой отношениями. Пусть заданы множества А1, А2, ..., Аn. Определим C= А1 x А2 x ... x Аn как множество всевозможных комбинаций элементов а12,...,аn, где аi є Аi. С называется декартовым произведением множеств А1, А2, ..., Аn.

Отношением B называется некоторое подмножество C, выделяемое некоторым

оператором, условием или функцией B=F(А1, А2, ..., Аn).

Если n=1, то отношение называется унарным.

Если n=2, то отношение называется бинарным. Изображением бинарных отношения является граф. Частными случаями бинарного отношения, например, являются отношение сравнения, порядка, иерархии.

Свойства отношений.

Определение. Бинарное отношение AρBназывается рефлексивным, если ему всегда принадлежит элементaρa.

Определение. Бинарное отношение AρBназывается симметричным, еслиaρbвсегда следует иbρa.

Определение. Бинарное отношение AρBназывается транзитивным, еслиaρb&bρcвсегда следует иaρc.

Каждый элемент данных может быть связан любым количеством связей с другими элементами. Элементы данных могут естественным образом группироваться между собой. При анализе разных по природе предметных областей часто проявляется много общих черт в их структуре и функционировании.

Например, проявляются взаимосвязи:

А) целое – часть;

Б) причина – следствие;

В) подчиненность – упорядочение;

Г) выбор элемента с помощью некоторого критерия и т.д.

Отображением этих устойчивых, общих и информационных характеристик являются абстрактные структуры данных.

Соседние файлы в папке AlgStr