Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции 151000.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.32 Mб
Скачать

3.2 Объемный (символьный) метод определения количества информации

Объемный (символьный) метод определения количества информации представляет собой определение количества символов, содержащихся в конкретном сообщении.

Например, одно и тоже число можно записать разными способами:

  • первый способ – 20;

  • второй способ – “двадцать”;

  • третий способ – ХХ;

  • четвертый способ – 011 000.

Любой из этих способов чувствителен к форме представления (записи) числа.

Символьный метод не связывает количество информации в сообщении с его содержанием.

Алфавит – все множество символов данного языка, включая цифры, знаки препинания и даже пробел.

Полное количество символов – мощность алфавита N. В русском языке N=54 (все буквы + пробел + цифры + знаки препинания). При этом (принимаем, что появление символов равновероятно)

I54 = log254 = 5,755.

Если количество символов в тексте равно М, то текст несет объем информации I54×М или 5,755 М (при любом содержании!)

Количество информации – функция от мощности алфавита и объема текста.

Книга толще – при прочих равных условиях – объем информации больше (если язык один и тот же!)

Одна страница текста на разных языках – разные объемы информации.

Мощность алфавита может быть любой.

Достаточный алфавит содержит 256 символов – русский и латинский алфавиты, цифры, знаки препинания и др. символы, включая элементы псевдографики.

Бит слишком мелкая единица измерения. На практике чаще применяется более крупная единица – байт, равная восьми битам.

Именно восемь бит требуется для того, чтобы закодировать любой из 256 символов. Считая появление различных символов равновероятным, находим, что энтропия достаточного алфавита составляет

I256 = log2 256 = 8 бит = 1 байт.

Значит, любая книга, набранная на компьютере, имеет объем информации 8S байт, где S – число символов. При 40 строках по 60 символов 1 страница содержит 2400 байт информации.

При строгом подходе для определения объема информации на одной странице надо брать формулу Шеннона.

Широко используются также еще более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 210 байт,

1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,

1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт,

1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,

1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

Скорость передачи информации измеряется в Кбайт/с, бит/с, байт/с.

3.3 Алгоритмический метод определения количества информации

Алгоритмический метод определения количества информации характеризуется сложностью (размером) программы, которая позволяет ее произвести.

Так например, компьютерная программы, печатающее слово из одних 0 достаточна проста, а программа, печатающее слово из 0 и 1 уже более сложная. При разных машинах и разных языках программирования (алгоритмах) это все разное. Поэтому задаются некоторой вычислительной машиной (чаще всего машиной Тьюринга), а предлагаемая количественная оценка информации определяется сложностью слова, как минимальное число внутренних состояний машины, требуемой для его воспроизведения.

4 Классификация информационных объектов.

Объект - любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств.

Классификация объектов - это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

Реквизиты представляются: либо числовыми данными (вес, стоимость, год), либо признаками (цвет, марка машины, фамилия).

Классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов. При любой классификации желательно, чтобы соблюдались следующие требования:

  • полнота охвата объектов рассматриваемой области;

  • однозначность реквизитов;

  • возможность включения новых объектов.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

Разработаны три метода классификации объектов:

  • иерархический,

  • фасетный,

  • дескрипторный.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]