Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
AlgStr / Лекции.doc
Скачиваний:
44
Добавлен:
23.03.2015
Размер:
741.89 Кб
Скачать

Лекція 1. Поняття про інформацію.

Вообще существует несколько взглядов на то, что принято считать информацией. Один взгляд, и его, по-видимому, придерживается большая часть специалистов и неспециалистов сводится к тому, что существует как бы два сорта информации:

1).Информация техническая, которая передаётся по телеграфным линиям и отображается на экранах радиолокаторов. Количество такой информации может быть точно вычислено, и процессы, происходящие с такой информацией, подчиняются физическим законам.

2). Информация семантическая, то есть смысловая. Это та самая информация, которая содержится, к примеру, в литературном произведении. Для такой информации предлагаются различные количественные оценки и даже строятся математические теории. Но общее мнение скорее сводится к тому, что оценки здесь весьма условны и приблизительны и алгеброй гармонию всё-таки не проверишь.

Второй взгляд состоит в том, что информация - это физическая величина, такая же, как, например, энергия или скорость. Определённым образом и в определённых условиях информация равным образом описывает как процессы, происходящие в естественных физических системах, так и процессы в системах, искусственно созданных.

Как всегда, при наличии двух резко противоположных мнений существует и третье, примиряющее. Сторонники третьего подхода считают, что информация едина, но вот количественные оценки должны быть разными. Отдельно нужно измерять количество информации, причём количество информации - строгая оценка, относительно которой можно развивать строгую единую теорию. Кроме количества информации, следует измерять ещё и ценность. А вот с ценностью информации происходит то же самое, что и с понятием семантической информации. С одной стороны, вроде её можно вычислить, а с другой стороны, все эти вычисления справедливы лишь в ограниченном числе случаев. И вообще, кто может точно вычислить, скажем, ценность крупного научного открытия?

Бурное развитие науки и промышленности в XX веке, неудержимый рост объёмов поступающей информации привели к тому, что человек оказался не в состоянии воспринимать и перерабатывать всё ему предназначенное. Возникла необходимость классифицировать поступления по темам, организовывать их хранение, доступ к ним, понять закономерности движения информации в различных изданиях и т.д. Исследования, позволяющие разрешить возникшие проблемы, стали называть информатикой.

Понятие "информация" (от лат. informatio - сведения, разъяснения, изложение) многозначно и поэтому строго определено быть не может. В широком смысле информация - это отражение реального (материального, предметного) мира, выражаемое в виде сигналов и знаков. То есть это сведения об окружающем мире, которые могут воспринимать устройства. Информация характеризуется такими свойствами как достоверность, полнота, актуальность, полезность, понятность.

Люди всегда изыскивали возможность сделать хранилища информации более компактными, что позволяло делать необходимую информацию транспортабельной, более удобной для хранения, а также ограничивало доступ к ней нежелательных лиц. Поэтому и появились глиняные таблички, бумага … и магнитные носители, а вместе с ними и книгопечатание, почта … и устройства переработки информации (компьютер).

Современные средства передачи информации используют классическую схему Шеннона:

Количество информации

  Информация - произвольная последовательность символов, т.е. любое слово, каждый новый символ увеличивает количество информации. Как же измерить количество информации? Для этого, как впрочем, и для измерения длины, массы и т.д. нужен эталон. Какое же слово взять в качестве эталона информации? Прежде, чем выбрать это слово необходимо выбрать алфавит - материал, из которого будет сделано это слово. Обычно алфавит берут двухсимвольным. Например, он может состоять из цифр 1 и 0. Эталоном считается слово, состоящее из одного символа такого алфавита. Количество информации, содержащееся в этом слове, принимают за единицу, названную 1 битом 0. Имея эталон количества информации можно сравнить любое слово с эталоном. Проще сравнивать те слова, которые записаны в том же двухсимвольном алфавите.

Итак, получаем, что количество информации – это мера уменьшения неопределенности некоторой ситуации.

За объем информации принимается сообщение минимальной длины.

Если N=2n, то для его записи необходимоn+1 бит (иначе [log2N]+1). Минимальное число бит для записи любого числа из диапазона0 – N.

Определение: измерение информации, основанное на подсчете числа символов в сообщении, называется объёмом информации.

Кодирование информации:

Определение: кодирование – это запись информации по определенным правилам.

Параметры информации:

  1. объём;

  2. время передачи;

  3. надежность;

  4. защита от помех;

  5. технические удобства;

  6. защита от несанкционированного доступа.

Объем информации измеряется в единицах информации. Наиболее надежной является BIT(BinarydIgiT), это связано с каналом связи. Информация передается от источника к приемнику в виде сообщения. Чем более маловероятным является событие, тем большее количество информации это сообщение несет. То естьколичествоинформацииэто мера уменьшения неопределенности множества событий. Сообщение информативно, если оно уменьшает неопределенность. Наименее информативное сообщение 0/1. Пусть С={С1, С2, С3, …, Сn} множество вариантов исхода некоторого события, тогда информативное сообщение это один изnвариантов исхода.Log2Nслужит для измерения количества информации. ЕслиNстепень двойки, то для определения исхода достаточно задатьLog2Nдвоичных вопросов, иначе [Log2N]+1.

Пример:

1)Минимальное количество двоичных цифр, необходимое для того, чтобы закодировать любое число из диапазона 0, 1, …, N, равняется [Log2N]+1.

2)Пусть дано С={С1, С2, С3, С4}. События из этого множества имеют разную вероятность:

p1=1/2,p2=1/4,p3=1/8,p4=1/8

1. Произошло ли С1? 0/1 - С1

2. Произошло ли с2? 00/01 - С2

3. Произошло ли С3? 000/001 - С34- 000)

или: С1=00, С2=01, С3=10, С4=11

В первом случае длина 200 сообщений = 100*1+50*2+25*3+25*3=350, то есть средняя длинна сообщения 1,75. Во втором случае это 2.

Мера неопределенности множества событий С={С1, С2, С3, …, Сn} называетсяэнтропиейи вычисляется по формуле:

По смыслу количество информации противоположно энтропии: I(C)=-H(C), H(C)<0

Пример:

В первом случае ,

Во втором:

ТеоремаВеличина I(C) максимальна в случае, когда события равновероятны, и равна Log2N, если N степень двойки, и равна[Log2N]+1 в противном случае.

Лекція 2. Поняття про дані

Информационная модель предметной области

При разработке программ для решения сложных задач всегда можно выделить некоторый объект, являющийся главным элементом исследо­вания. Таким объектом может быть номенклатура изделий некоторого завода, календарный план работы цеха, студенческая группа. Объект характеризуется свойствами, для исследования взаимосвязей которых и решается задача. Одним из возможных методов решения задачи яв­ляется моделирование объекта с помощью компьютера. Для этой цели строится информационная модель, в которую включается информация только о существенных для данной задачи свойствах (характеристиках, сторо­нах) объекта. Другая задача, касающаяся этого же объекта, потребует знания информации о других его свойствах - строится другая информа­ционная модель. Объединение различных информационных моделей объек­та составит его комплексную модель, предназначенную для решения выделенной совокупности задач.

Очень часто поведение системы зависит от предыстории и воздействия внешней среды. Это значит, что необходимо хранить информацию на определенных носителях. Модель строится для набора однородных (с одинаковым вектором свойств) объектов и является изображением, описанием объекта при решении задачи.

Моделирование задач на эвм

ИМЕЕМ: объект исследования.

ОСHОВHАЯ ЦЕЛЬ: научиться предсказывать поведение объекта, т.е. как изменение одних свойств влияет на другие.

ОДИH ИЗ СПОСОБОВ РЕШЕHИЯ: моделирование на ЭВМ.

ОСHОВHАЯ ЗАДАЧА: научиться делать это оптимально.

У исследуемого объекта выделяем свойства объекта, т. е. те его стороны, для исследования взаимосвязи которых и решается задача. Все объекты, участвующие в решении задачи обладают набором существенных с точки зрения решаемой задачи свойств и составляют предметную область задачи.

Предметная область – это выделение из окружающего мира объектов и их свойств, важных для решения данной задачи. Предметная область описывается на языке предметной области. Наиболее эффективным языком предметной области есть язык математики.

Затем описываем изучаемый объект с информационной стороны, т.е. строим информационную модель объекта. Сюда включается информация только о существенных для данной задачи свойствах. Информационная модель строится из набора одинаковых объектов и является изображением (описанием) объекта при решении задачи. В информационной модели каждому свойству соответствует атрибут. Каждому атрибуту соответст­вует множество допустимых значений.

Информационная модель предметной области – это изображение предметной области с точки зрения решаемой задачи.

База данных – описание предметной области с точки зрения решения нескольких задач.

При переходе к предметной области свойства объектов представляются в виде атрибутов.

Атрибутом является логически неделимый элемент информации об объекте, который может быть связан с другими элементами. Связи между атрибутами определяются связями между свойствами, присущими объектам предметной области. Атрибуты могут меняться с течением времени. По отношению к внешней среде объекта все атрибуты можно разделить на входные, внутренние и выходные.

Вектор (X) входных атрибутов включает те атрибуты, через которые внешняя среда влияет на объект. Вектор (С) внутренних, собственных атрибутов определяет конфигура­цию объекта в текущей момент времени. Вектор (У) выходных атрибу­тов определяет те атрибуты, через которые объект воздействует на внешнюю среду. Алгоритмом решения задачи является некоторый опера­тор А, преобразующий входные и внутренние атрибуты в выходные.

Классы атрибутов:

  1. Входные атрибуты X: с их помощью среда воздействует на объект, и он выдает выходные атрибуты;

  2. Выходные атрибуты Y;

  3. Внутренние атрибуты C .

Ключевой атрибут- атрибут, однозначно идентифицирующий объект в совокупности.

Вектор Вектор выходных

входных атрибутов (Y)

атрибутов (Х)

Вектор внутренних атрибутов

(С) – состояние объекта в определенный момент времени.

Соседние файлы в папке AlgStr