Добавил:

Yanus Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский Государственный Технический Университет

Предмет:

Информатика

Файл:

Elementy_informatiki_i_teorii_informatsii.doc

Скачиваний:

Добавлен:

15.06.2014

Размер:

1.5 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1713 14 15 16 17 > Следующая >>>

Вопросы для повторения и закрепления материала

1. Возможна ли идентификация сообщений с неравным вероятностями их появления с помощью информации Хартли?

2. Какова зависимость между вероятностью отдельного сообщения, его неожиданностью, длинной программы и информацией для его идентификации? Какие из этих величин могут быть только целыми числами?

Напишите выражения для энтропии, количества информации и средней длины программы, необходимой для идентификации сообщения; дайте качественное толкование этих величин.
Возможна ли с помощью «информации Хартли» идентификация сообщений с такими вероятностям их появления, которые не допускают разбиений на равновероятные подмножества? Ответьте на этот вопрос в том числе путём вывода выражения для энтропии.
Почему энтропия и количество информации, идентифицирующей сообщение, величины взаимно обратные?
Какова разница между «количеством информации по Шеннону» и информацией для идентификации отдельного сообщения?
Опишите свойства энтропии.

2.4. Подсчёт числа информации, трактуемых как преобразования в процессе управления

2.4.1. Полезная, избыточная и паразитная информации в процессе управления

В раздел 1.5 и 1.6 мы определили информацию и её различные виды как преобразования, связывающие сообщения в поперечных множествах сообщений цепи управления. Число этих информации – преобразований, содержащихся в информационных цепях, т.е. в цепях оригиналов, образов и промежуточных сообщений, можно подсчитывать. Рассмотрим, что может дать такой подсчёт и как будут согласовываться полученные выражения для учёта числа информации с общепринятыми формулами (2.2) и (2.11) статистической теории информации. Для ответа на эти вопросы необходимо рассмотреть следующие понятия.

Полезная информация – это информация, относящаяся к группе, состоящей из наименьшего количества информации данной информационной цепи, необходимых для данного процесса управления

Избыточная информация – это такая информация, которая получена из других информаций данной информационной цепи.

Паразитарная информация – это информация, возникающая вне данного процесса управления.

К избыточной информации относится повторная и обратная информации, дополнительные операционные информации, помимо той, которая необходима для данного процесса управления, а также симуляционная псевдоинформация.

К паразитной информации относятся симуляционная дезинформация и симуляционная парадезинформация.

В дальнейшем при подсчете информации будем учитывать только полезную информацию.

Среди полезных информаций будем различать описательные информации и идентифицирующие информации.

2.4.2. Описательные информации и подсчет их числа в информационной цепи

Описательная информация – это такая информация, которая относится к наименьшему возможному числу информации, необходимых для описания некоторого определённого сообщение в информационной цепи.

Исходная (реперная) информация – это описательная информация, необходимая для определения первого сообщения в информационной цепи.

Исходное сообщение – это сообщение, которое следует преобразовать с помощью исходной информации для получения первого сообщения в информационной цепи.

Для описания последнего сообщения в информационной цепи необходимо знать информацию, которая преобразует предпоследнее сообщение в последнее, а для описания предпоследнего сообщения, в свою очередь, необходима информация, которая преобразует предыдущее сообщение, и т.д. – любое последующее сообщение описывается на основе предыдущего. Для определения же самого первого сообщения информационной цепи необходима исходная информация, которой должно быть подвергнуто некоторое исходное сообщение, не принадлежащее к данной информационной цепи.

Так как исходное сообщение не играет роли в процессе управления, то его можно выбрать произвольным образом, но в соответствии с ним должна быть выбрана исходная информация. Например, для определения значений температуры в качестве исходной температуры берётся температура таяния льда, температура абсолютного нуля. В качестве исходной информации можно взять операционную информацию вида t₀ + Δt₀₁ = t₁, где Δt₀₁ = (t₁- t₀)параметр операции. За исходную высоту местности принимается уровень моря; за исходный электрический потенциал берётся потенциал земли и т.п.

Наиболее удобно выбирать исходное сообщение, совпадающим с первым сообщением информационной цепи, так как исходная информация при этой будет тривиальной. К такому случаю относятся формулировки: «дана точка на плоскости, относительно которой…», «дано начальное состояние системы, относительного которого…».

Выясним от чего зависит число описательных информаций [2].

Теорема 2.1. Число информации D , описывающих одно сообщение в информационной цепи, состоящей из n различных сообщений, равно числу этих сообщений.

Доказательство этой теоремы основано на том обстоятельстве, что для полного описания любого j-го сообщения информационной цепи, состоящей из n сообщений, необходимо связать это сообщение со всеми (n - 1) остальными сообщениями этой цепи с помощью такого же числа описательных информации и ещё одна – исходная информация – требуется для связи данного сообщения с исходным сообщением. Таким образом, D_j = n. Но те же утверждения справедливы для любого сообщения информационной цепи, поэтому

D₁ =D₂ = . . . =D_j= . . . = D_n = D = n. (2.15)

Из теоремы 2.1 следует, что при полном описании одного из сообщений информационной цепи одновременно оказываются описаны и все остальные сообщения данной цепи. Так бывает, например, когда имеется система из n уравнений с n переменными, (n - 1) из которых заданы, и требуется определить оставшуюся.

Здесь важно уяснить, что описать сообщение – это значит указать его связи со всеми другими сообщениями данной информационной цепи, а также с исходным сообщением с помощью преобразований (описательных информации). Так невозможно описать, например, красный цвет не соотнося его с другими цветами (желтым, зелёным, синим и т.д.) спектра видимого излучения.

Теорема 2.2. Для описания одного сообщения информационной цепи, содержащей основную информацию и состоящей из произвольного числа n сообщений достаточно двух описательных информации, т.е.

D₁ =D₂ = . . . =D_j= . . . = D_n = D = 2 (2.16)

Данная теорема доказывается тем, что для определения любого сообщения из n сообщений требуется (n - 1) – кратное применение одной и той же основной информации J и применения одной исходной информации J₀₁ (см. разд. 1.5).

Для дальнейших рассуждений необходимо определить следующие понятия.

Полная описательная информация – это информация, которая представлена наименьшим множеством описательных информации, необходимых для описания определённого сообщения в информационной цепи, т.е. полная информация содержится в наименьшем множестве преобразований, связывающих данное сообщение с исходным и всеми другими сообщениями информационной цепи.

Описательная информация множества сообщений информационной цепи – это информация, которая представлена наименьшим множеством полных описательных информации, необходимых для описания каждого из сообщений информационной цепи.

Редкость сообщения или описательной информации – это величина обратная частоте (в пределе – вероятности) встречаемости сообщения данного класса или описательной информации данного типа среди множества всех рассматриваемых сообщений или информации. Следовательно, чем меньше вероятность появления некоторого объекта, тем реже он встречается и наоборот.

Редкость будем обозначать в виде или, гдеn_j – число одинаковых сообщений, составляющих j-й класс, n – общее число сообщений; иP_j – соответственно частота (относительное число) и вероятность одинаковых сообщений j-го класса.

Теорема 2.3. Если в информационной цепи, состоящей из n сообщений, имеется m классов, состоящих соответственно из n_а,, n_b, …, n_m одинаковых сообщений, то среднее число описательных информации можно определить следующим выражением

Докажем теорему. Считается данным, что в информационной цепи имеется:

n_a сообщений a₁ = a₂ = a₃ = … = a,

n_b сообщений b₁ = b₂ = b₃ = … = b,

…………………………………

n_m сообщений m₁= m₂= m₃= … = m,

причём n_a + n_b + …+ n_m = n .

В соответствии с теоремой 2.1 число информаций, описывающих сообщение a₁, равно D_a₁=n. Точно также для числа информаций, описывающих остальные сообщения этого же класса, имеем D_a₂= n, D_a₃= n и т.д. Вследствие одинаковости сообщений а₁ = а₂ = а₃ = … = а полные информации, описывающие каждое из этих сообщений, также одинаковы, поэтому для полной информации, описывающей одно из этих сообщений, информации, описывающие остальные сообщения этого класса, являются избыточными и должны быть исключены. При этом среднее число описательных информации, приходящееся на каждое из этих сообщений будет меньше общего числа сообщений данной информационной цепи во столько раз, сколько имеется одинаковых сообщений в данном классе, т.е. D_а=n/n_a. Так же определяются средние числа описательных информации, приходящихся на каждый из остальных классов, т.е.

, , …,. (2.17)

Среднее число описательных информации одного сообщения информационной цепи можно определить как среднее геометрическое средних чисел информации, описывающих сообщения для всех классов

(2.18)

или с учетом (2.17), получим

, (2.19)

или то же в компактном виде

, (2.20)

где j – номер класса, m – число классов.

Преобразуем уравнение (2.20) к виду

. (2.21)

Обозначив

(3.22)

где n_q – среднее (геометрическое) число сообщений одного класса, и подставляя эту величину в знаменатель выражения (2.21), получим

. (2.23)

В частном случае, когда все сообщения информационной цепи различны, т.е. когда каждый класс представлен всего одним сообщением и

m = n, из (2. 20) имеем D = n, что совпадает с утверждением теоремы 2.1.

Заметим, что по определению величина D_а = n/n_a оценивает редкость встречаемости одинаковых сообщений класса «а» и среди всего множества n сообщений, составляющих информационную цепь. Если рассмотреть любую из полных описательных информации сообщений этого класса, то станет видно, что эта же величина, является редкостью тривиальных информации среди всего множества n информации, описывающих отдельное сообщение класса «а», а также, что она представляет, кроме того, редкость одинаковых полных информации, описывающих сообщения класса «а», среди множества n полных информации, описывающих все сообщения информационной цепи. Таким образом, величина D_j = n/n_j представляет одновременно редкости встречаемости следующих объектов: одинаковых сообщений j-го класса, тривиальных описательных информации, входящих в состав полной описательной информации отдельного сообщения j-го класса, одинаковых полных описательных информации сообщений j-го класса, образующих вместе с другими описательную информацию множества всех сообщений информационной цепи.

С учётом данных замечаний среднее число описательных информации D, определённое в виде (2.18 – 2.21) и (2.23), позволяет также оценить средние редкости одинаковых сообщений или тривиальных описательных информации, или одинаковых полных информации, описывающих сообщения одного класса.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1713 14 15 16 17 > Следующая >>>

Соседние файлы в предмете Информатика

#
15.06.201489.74 Кб22jI2ieFJxzw.jpg
#
15.06.201422.8 Mб57Access.doc
#
15.06.201491.48 Кб3c5tK-b0GRX8.jpg
#
15.06.201421.3 Кб11D035_Otvety_Informatika_Tatsy.docx
#
15.06.201414.82 Кб13Dokument_Microsoft_Word_2.docx
#
15.06.20141.5 Mб27Elementy_informatiki_i_teorii_informatsii.doc
#
15.06.201489.61 Кб2GO_gEn0Eq2o.jpg
#
15.06.201423.72 Кб10informatika.docx
#
15.06.201417.73 Кб10informatika_2012.docx
#
15.06.201423.78 Кб21Informatika_Ekzamen.docx
#
15.06.2014143.65 Кб36Informatika_Otvety.docx