Информация и данные.
Понятие об информации. Измерение информации
Информацию нужно накапливать, хранить, извлекать.
Передатчик канал связи Приемник
Технические характеристики канала связи определяются объемом информации в секунду.
Байт - наименьшая адресуемая единица емкости памяти.
[ log 2 N ] + 1 - объем памяти, в которую можно записать данное число, где N - количество вариантов исхода
16-UNICODE - можно закодировать любые символы любых алфавитов
Количество информации - мера снижения неопреде-ленности.
Энтропия - мера неопределенности сообщения:
H ( C ) = P1 log2 P1 + P2 log2 P2 + ... + PN log2 PN
Pi < 1, то все логарифмы отрицательны и тогда энтропия всегда отрицательна.
P1 - вероятность события С1
P2 - вероятность события С2
C = { C1, C2, ..., CN }
Способы кодирования информации
Кодирование информации - это запись информации определенным способом.
Источник Кодиро-
информации сообщение на входе вание сигналы на входе
Передатчик Приемник
канал связи сигнал на входе
Декодиро- Потребитель осмысление
вание сообщение на выходе информации на выходе
Теорема
Количество информации будет максимальным в том случае, если все исходы будут равновероятны.
Понятие о данных
Данные - это изображение информации. Информация активна, данные пассивны. С каждым языком данных связан язык интерпретации данных, позволяющий извлекать из данных информацию.
Язык интерпретации имеет алфавит: m
Информация поступает в виде сообщения: S = S1 S2 ...Sn, где Sii
Сообщение разбивается на слова, при этом каждое слово изображает атрибут информации или является наименьшим неделимым элементом информации.
Строку S называют логическим уровнем представления данных.
Элемент данных - это наименьшая неделимая конструкция данных.
Атрибут - наименьший неделимый элемент информации.
Физический уровень представления данных - это изображение данных в виде устойчивого состояния конкретной среды ( носителя ).
1. объект 2. атрибут 3. 4.
о о логическая физическая
о о о о запись запись
о о о о
Материальный Информационная Область Область
мир модель предмет- логических физических
ной области данных данных
-
Объекты обладают свойствами (бесконечными). Нас могут интересовать конкретные свойства. По свойствам объекта прогно-зируется его дальнейшее поведение.
Предметная область - группа объектов с набором определенных свойств, при этом определены законы их взаимодействия с точки зрения решения какой-либо задачи.
-
Каждый объект представляется экземпляром модели . Каждое свойство преобразуется в атрибут информационной модели - неделимый элемент информации. Определяется связь атрибутов друг с другом и представляется она, как правило, в виде записи на языке математики.
3. Определяется представление атрибутов:
экземпляр модели логическая запись
атрибут элемент логических данных
логические записи логические файлы
4. Логическая запись физическая запись
логический набор данных физический набор данных
данные база данных
С точки зрения воздействия внешней среды все объекты делятся на виды:
-
входные атрибуты X : с их помощью среда воздействует на объект и он выдает выходные атрибуты;
-
-
выходные атрибуты Y;
-
-
внутренние атрибуты C .
Ключевой атрибут - атрибут однозначно идентифицирующий объект в совокупности.
Операции информационной модели :
-
объединение;
-
разность;
-
вхождение.
Элементы множества могут вступать друг с другом в отношения.
А1 А2 А3 ... Аn - определяет множество всевозможных атрибутов