Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский государственный университет им. М.В. Ломоносова

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекция 3.doc

Скачиваний:

Добавлен:

07.11.2018

Размер:

123.39 Кб

Скачать

☆

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

3.3. Двоичные данные

По каналам связи данные передаются, как правило, в двоичном виде. Поэтому потрачены значительные интеллектуальные усилия для разработки эффективных методов контроля двоичных данных.

При вводе данных в ЭВМ и передаче их по линиям связи возможны ошибки, приводящие к потере информации. Для предотвращения подобных потерь вводится специальное кодирование, основанное на добавлении некоторой избыточной информации во вводимые или передаваемые данные. Объем данных увеличивается, что позволяет контролировать правильность этих данных. Таким образом, данные, генерируемые некоторым источником, подвергаются сжатию, а затем вводится дополнительная контролируемая информация. Данные, полученные в результате двукратного кодирования, вводятся или передаются, причем возможно обнаружение или даже исправление наиболее частых ошибок.

Будем рассматривать в качестве данных двоичные последовательности. Основная идея кодирования проста. Разобьем исходную последовательность на блоки длиной k, символы которых назовем информационными, и припишем к ним r проверочных символов, получив расширенный блок из n = k + r символов, готовый для ввода или передачи. Указанный код называется блоковый и имеет тип [n, k].

Если будет искажена часть символов блока, то проверочные символы могут дать достаточную информацию, чтобы обнаружить или даже исправить ошибку. Если проверочные символы определены как линейные комбинации информационных символов, кодирование называется линейным.

Способ построения расширенных блоков может быть различным. Можно выбрать тот или иной способ такого построения, т.е. кодирования, исходя из поставленных целей.

Существует 2ⁿ различных блоков длиной n, но только 2^k из них являются кодословами и совокупность их образует код.

В результате передачи данных по каналу связи или другой операции над кодословом может быть получена любая последовательность из n знаков. По полученным n символам необходимо определить, какое из 2^k возможных кодослов на самом деле было передано. Это задача декодирования. В результате декодирования можно:

обнаружить и исправить ошибку, если она есть, или правомерно определить её отсутствие;

обнаружить ошибку, но не иметь достаточной информации, чтобы её исправить;

не обнаружить сделанную ошибку или неправильно декодировать принятое слово.

Вероятность появления не обнаруживаемой ошибки одна их количественных характеристик кода. Другая характеристика - скорость передачи данных, которая для блоковых кодов равна k/n.

Перечислим некоторые популярные в практике методы кодирования.

Коды с повторением. Если нам необходимо передать символ 0 или 1, мы передаём его несколько раз подряд (n раз). При декодировании принятые данные разбиваются на блоки длиной n и, если в данном блоке единиц больше, чем нулей, то блок заменяется 1, а, если единиц меньше, то блок заменяется 0. В том случае, если число единиц и нулей в принятом блоке совпадают, декодирование невозможно (отказ от декодирования).

Для кодов с повторением k = 1, а n произвольно. Значение каждого проверочного символа совпадает со значением информационного символа. Если n достаточно велико, вероятность ошибки декодирования мала. Однако трудоёмкость метода слишком велика, она возрастает в n раз.

Коды с проверкой на чётность. Другим примером простых кодов являются коды с проверкой на четность, содержащие только один проверочный символ. Число единиц в кодослове (x₁, ... ,x_n, x_n₊₁) всегда четно, поскольку проверочный символ определяется формулой х_n₊₁= (x₁ + ... + x_n) mod 2.

При использовании этого метода ошибки обнаруживаются, если их чётное число и, в частности, обнаруживаются одиночные ошибки. Трудоёмкость этого метода невелика, и он используется для контроля правильности преобразования данных в компьютере. Обнаруживаемая при использовании этого метода ошибка называется «ошибка чётности».

Конечные поля. Для изложения теории линейных кодов и далее при изучении методов шифрации нам понадобятся элементы теории конечных полей.

Рассмотрим конечное множество М = {e₀,e₁,...,e_m_-1}. Определим на M операции сложения и умножения его элементов, полагая

Эти операции удовлетворяют условиям коммутативности, ассоциативности и дистрибутивности, точно также как это имеет место для сложения и умножения обычных действительных чисел.

Имеется нулевой элемент, а именно e₀, для которого e₀ + e_i = е₀, и единичный элемент e₁, для которого e₁*e_i = е_i, для любых i =0, ..., m - 1.

Для сложения имеется обратная операция - вычитание: е_i - e_j= е_i+ (- e_j), где --e_j элемент обратный к e_j, т.е. такой, что e_j + (-е_j) = е₀. Легко проверить, что обратные элементы можно вычислить по формуле –е₀ = е₀, -е_i = е_m_-_i при i > 0.

Деление существует не всегда. В частности, деление существует, если порядок m множествам простое число: 2,3,5,7,11 и т.д. В этом случае множество М называется полем характеристики m

Пример. Пусть М = {0,1}. В соответствии с определением

0+0=0; 0+1=1; 1+0=1; 1+1=0;

0*0=0;0*1=0;1*0=0; 1*1 =1.

Кроме того, -0 = 0, -1 = 1. Поэтому при операциях с двоичными данными минус перед константой или переменной можно отбросить.

Линейные коды. Коды Хэмминга. В кодах, содержащих несколько информационных и несколько контрольных символов, каждый контрольный символ функция от информационных символов. В простейшем случае эти функции линейные, т.е. в двоичном случае это суммы некоторого подмножества информационных символов, взятые по модулю два. Поэтому можно считать, что линейные коды - это обобщение кода контроля по чётности.

Построим код с блоковой длиной n = 6, имеющий k = 3 информационных символов, т.е. код типа [6,3], определив его уравнениями:

X₁=Z₁;

X₂=Z₂;

Х₃ = Z₃;

Х₄= Z₁ + Z₂;

X₅ = Z₁ + Z₃;

X₆= Z₂+Z₃,

где Z₁, Z₂, Z₃ - передаваемые разряды, X₁, X₂, Х₃ - информационные разряды, Х₄, Х₅, Х₆ - контрольные разряды. Все операции здесь и далее производятся над двоичными Данными как элементами поля характеристики 2.

Пример. Пусть необходимо передать блок z = (1,1,1). Тогда получим блок для передачи по каналу связи: (1,1,1,0,0,0).

Кодослово (х₁,...,x₆) удовлетворяет проверочным уравнениям

x₁ + x₂ + x₄ =0;

x₁ + x₃ + x₅ =0;

x₂ + x₃ + x₆ =0

или в матричной записи

Hx^T = 0,

где х^T - вектор-столбец;

0= (0,0,0);

Н - проверочная матрица,

Н =

Любое кодослово, т.е. слово, передаваемое по каналу связи, удовлетворяет этому условию. Следовательно, решая указанную систему линейных уравнений, найдём все кодослова, т.е. построим код. В нашем случае число решений будет равно 2³=8, тогда как общее число слов длины 6 составляет 2⁶=64. Перечислим все 8 кодослов: 000000, 001011, 010101, 011110, 100110, 101101, 110011, 111000. Именно с этими словами совершают операции ввода или пересылки. Если принятое слово не совпадает ни с одним из перечисленных кодослов, то имеет место ошибка.

Введём вектор ошибок (е_i = 1,...,6), где e_i = 1, если при передаче i-гo символа возникла ошибка, в противном случае положим е_i = 0. Обозначим принятое слово (y₁,...,y₆). Тогда у_i= (х_i + e_i), i = 1,...,6.

Вектор-столбец s, определенный уравнением s = Ну^T , называется синдромом.

Поскольку Ну^T = Нx^T + Не^T = Не^T, синдром ошибки е и синдром переданного слова у одинаковы и равны s.

В классе всех решений уравнения Не^T = s, где s синдром полученного слова выбираем вектор е с минимальным число единиц и считаем, что это - вектор ошибок.

Рассмотрим условия, при которых вектор е, следовательно, и передаваемый вектор, восстанавливаются однозначно.

Допустим, что ошибки единичные, т.е. в векторе е только одна компонента 1, а остальные 0, и обозначим (h₁,...,h₆) столбцы матрицы Н₆.

Тогда

He^T = (h^l,..,h⁶)(e^l,..,e⁶)^T = e¹h¹ + ... + е⁶h⁶.

Если вектор е имеет 1 на i-ом месте, то Не^T = hⁱ т.е. для того, чтобы локализовать единичную ошибку, необходимо и достаточно, чтобы все вектора h_i были различными и ненулевыми. Всего имеется 23 - 1 = 7 различных ненулевых векторов. Следовательно, в данном случае построение проверочной матрицы, обнаруживающей место, на котором случилась единичная ошибка, возможно.

Если синдром совпадает с одним из столбцов матрицы Н, то номер этого столбца есть номер ошибочной компоненты в полученном векторе, в противном случае отказываемся от декодирования, т.е. не пытаемся определить переданное слово, а лишь фиксируем факт ошибки в канале.

Все рассуждения справедливы в случае любого линейного кода [n, k]. Для обнаружения единичных ошибок необходимо и достаточно, чтобы 2r-1n, где r - число проверочных условий или, что тоже, контрольных разрядов, r=n-k.

Потребуем, чтобы линейные коды, обнаруживающие единичные ошибки, имели максимальную кодовую длины n при фиксированном числе контрольных разрядов r, Из предыдущего неравенства следует n = 2r-1.

Подобный код называется кодом Хэмминга. Код позволяет исправить одиночную ошибку в любой из n позиций, причем никогда не происходит отказа от декодирования.

Код Хэмминга с блоковой длиной n = 2r-1 обеспечивает при больших n скорость передачи данных, близкую к максимальной. Эти коды относят к категории высокоскоростных кодов.

Коды Хэмминга исправляют все единичные ошибки. Но если к проверочной матрице Хэмминга присоединить в качестве первой строку, сплошь состоящую из единиц, то получим проверочную матрицу обобщенного кода Хэмминга. Этот код позволяет исправлять все единичные ошибки и обнаруживать двойные.

<<< < Предыдущая 1 23 / 43 4 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.2025955.52 Кб0Лекция 3.2. Накопитель на жестких магнитных дис...docx
#
01.07.2025121.86 Кб0Лекция 3.4.5.doc
#
01.07.2025183.81 Кб0Лекция 3.doc
#
01.07.202581.92 Кб0Лекция 3.doc
#
01.05.20251.83 Mб0Лекция 3.doc
#
07.11.2018123.39 Кб16Лекция 3.doc
#
25.08.2019202.75 Кб19лекция 3.doc
#
23.11.201945.59 Кб8лекция 3.docx
#
01.07.202562.98 Кб0лекция 30 свертывание крови.doc
#
01.07.2025100.35 Кб0лекция 35 жирораств вит.doc
#
15.08.201987.04 Кб1Лекция 38,39 кровь.doc