Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Пособие_ТКИ

.pdf
Скачиваний:
1
Добавлен:
07.06.2025
Размер:
1.71 Mб
Скачать

структуры декодера с жестким решением. На Рисунке 4.13 показана упрощенная блок-схема процесса декодирования. Так как обсуждается жесткое решение, то решения демодулятора поступают на вход декодера, рассчитанного на работу с ДСК.

Рис.4.13 Общая структура жесткого декодера для линейных блоковых кодов для ДСК.

Обозначим v є С переданное кодовое слово. На вход декодера подается принятое искаженное слово r=v+е. Процедура декодирования состоит из следующих шагов:

• Вычисляется синдром s=rНT. Согласно свойству линейного кода синдром является линейным преобразованием вектора ошибок, возникшего в канале,

s=eHT

(4.5.1)

• Для вычисленного синдрома s найти наиболее вероятный вектор ошибок е и вычесть его (по модулю два в двоичном случае) из принятого вектора.

Несмотря на то, что большинство практических декодеров не реализуют процедуру декодирования так, как она сформулирована выше, имеет смысл рассматривать процедуру жесткого декодирования как метод решения уравнения (4.5.1). Заметим, что любой метод решения этого уравнения является методом декодирования. Например, можно попытаться решать это (ключевое) уравнение с помощью псевдообратной матрицы (НТ)+ матрицы НТ такой, что НТ(НТ)+ = In

81

и для которой результат декодирования

e = s(HT)+

(4.5.2)

имеет наименьший вес Хемминга. Как легко бы это не казалось, задача эта очень сложна. Мы вернемся к этому соображению при обсуждении методов декодирования кодов БЧХ и Рида-Соломона.

82

Глава 5. Технологии кодирования информации на бинарных полях.

5.1. Введение.

Разработка методологии построение оптимальных моделей активной виртуальной памяти в технологиях виртуализации каналов передачи и хранения информации является новым направлением создания информационных систем другого поколения, используя средства и способы интеллектуализации таких систем: виртуализация и когнитивные возможности. Интеллектуализация таких систем во многом предопределяет как динамику, надежность и независимость информации в каналах передачи и хранения, так и когнитивные возможности (представления и интерпретации логических построений, сложных явлений и процессов обмена информацией в каналах таких систем). Интеллектуализация информационных систем в прикладном аспекте – это и актуальность и жизненная необходимость, а модели активной памяти являются одним из эффективных и возможных способов практической реализации технологических цепочек таких систем в каналах передачи и хранения. В рамках рассматриваемой методологии информационные объекты компьютерных систем и сетей, например, файловые структуры любой природы и более сложные системные и программные объекты, рассматриваются и описываются посредством виртуальных моделей активной памяти на бинарных информационных множествах физической памяти, на которых определяются информационные пространства различной природы. Тогда любой носитель информации таких систем можно рассматривать двояко, с одной стороны, это физическая среда памяти реальных компьютерных систем и сетей, а с другой – это система виртуальной реальности, в которой протекают процессы виртуализации на разных уровнях иерархии памяти и каналов передачи, а также реализуется независимая виртуализация физического пространства памяти каналов

83

хранения и передачи. Интеллектуализация реальных компьютерных систем и сетей в этом случае будет проявляться в том, что логическая организация, хранение и динамика информации в каналах хранения и передачи определяются процессами виртуализации, а аппаратные и программные средства являются физической средой протекания таких процессов.

5.2. Постановка задачи и способы ее решения.

В классической чисто дедуктивной математической постановке выше обозначенная задача для информационных каналов передачи и хранения в узком смысле может рассматриваться, как задача построения кодера и декодера. Но в практической реализации и разработке моделей алгоритмов и процедур программных компонент информационных технологий для каналов передачи и хранения дедуктивный подход мало применим и неэффективен. Здесь необходимо использовать другие подходы, учитывать процессы виртуализации и динамику информации на логическом уровне. В связи с этим предлагается индуктивный подход как в формулировке, так и в способах решения исходной задачи, который можно описать в виде следующей логической схемы.

Любой информационный объект (IO) (файлы и логические структуры) определить, как бинарное множество. Задать схему и алгоритм построения “оптимального” информационного пространства на этом множестве. Определить модель и логическую схему организации заголовков для загрузки исходного IO в информационную “тару” (логические и физические элементы) памяти каналов передачи и хранения. Рассмотрим следующие конфигурации информационных пространств для обозначенной задачи.

Первая определяется в виде кортежа <X,N>, где X множество цепочек символов алфавита N, а N в свою очередь представляет конечное множество цепочек переменной или фиксированной длины символов булевой логики, т.е. нулей и единиц. Для описания и представления исходного IO в таких

84

пространствах используются таблицы его информационной насыщенности на конечных топологиях информационных бинарных множеств, которым является любой IO системы или сети. Такие таблицы в первом приближении представляют собой дискретные распределения вероятностей букв алфавитов N информационных пространств для конкретного IO и являются основой для разработки и реализации способов (логических и алгоритмических) представления одного объекта в различных виртуальных информационных пространствах. Они, с одной стороны, отражают степень насыщения IO (файл или любая другая логическая структура) элементами алфавита N в информационном пространстве <X,N>. А с другой - позволяют построить отображение φ (прототип модели кодера) исходного IO, определенного в <X,N>, в любое другое информационное пространство <X1 ,N1>, где N1 также представляет собой множество бинарных цепочек постоянной или переменной длины. Тогда обратное отображение φ-1 (прототип модели декодера) позволяет восстановить IO. В зависимости от целевой установки такие отображения исходного IO позволяют изменять его "физические размеры" в каналах хранения и увеличивать скорость его транспортировки в канала передачи, а также повышать физическую помехозащищенность и сохранять конфиденциальную защищенность как на уровне восприятия, так и перехвата информации. Совокупность алфавитов N и N1, представленных в виде матрицы A(2,L), , где L – размерность алфавитов, образуют формальный словарь. Отображение φ является формальной математической моделью построения алфавита N1 на основе исходного IO и алфавита N, а способы ее реализации могут быть различными (например, для технологий сжатия – метод Хаффмена и др.). Элементы алфавитов формального словаря являются бинарными векторами и могут быть как фиксированной, так и переменной длины. В практической реализации для программных продуктов такие словари могут иметь следующие конструкции. Во-первых, элементы алфавитов N и N1 являются бинарными векторами фиксированной и одинаковой длины. Такие конструкции используются в классиче-

85

ских схемах построения технологий криптографической защиты информации и других преобразований. Во-вторых, бинарные цепочки, как “физические” прототипы элементов алфавитов N и N1 , имеют фиксированные длины l и l1 при условии, что l1 >l. Структуры такого типа используются для разработки технологий физической помехозащищенности IO для любого формата данных в каналах хранения и передачи. В-третьих, элементы алфавита N являются бинарными векторами фиксированной длины, а элементы алфавита N1 - переменной. Эти конструкции находят свое отражение в разработке технологий сжатия информации без потерь на основе методов как энтропийного и арифметического кодирования, так и других префиксных способов. В-четвертых, элементы алфавитов N и N1 – это бинарные цепочки переменной длины. Следует отметить, что последние конструкции мало исследованы и детально не изучены как в чисто математическом аспекте (теория кодирования информации), так и в прикладном – разработка и реализация компьютерных технологий и программных продуктов для передачи, хранения и защиты информации в каналах информационных систем на основе различных моделей кодеров и декодеров, а также способов сортировки и технологий виртуализации информации в каналах хранения и передачи. Тем не менее построение как математической теории исследования таких структур словарей для моделей алгоритмов и процедур кодеров и декодеров, так и разработка общей методологии создания технологий хранения, передачи и защиты IO в информационных каналах компьютерных систем и сетей на основе моделей активной памяти на бинарных полях и технологий виртуализации с использованием указанных конструкций словарей представляется актуальным и перспективным направлением. Последняя конструкция словаря автором исследовалась в рамках следующей схемы, когда элементы алфавитов словаря представлялись не как строки матрицы A(2,L), а определялись в виде подграфа на графе-шаблоне с динамически формируемой топологией связей. Вершины графа-шаблона однозначно соответствуют бинарным цепочкам переменной дли-

86

ны, а вершины соответствующие цепочкам одинаковой длины образуют подграф на графе-шаблоне, который в этом случае представляет структуру логически объединенных подграфов с заданной топологией связей как между вершинами подграфа, так и между подграфами. В этом случае граф в памяти определяется в виде матрицы, элементами которой являются структурные объекты-числа. Модель такой матрицы "прописывается" в алгоритмах кодера и декодера. Тогда словарь однозначно задается и определяется на графе-шаблоне и описывается алгоритмической моделью матрицы структурных чисел. В рамках такой логической конструкции словаря в технологиях сжатия IO, даже на основе методов префиксного кодирования, эффективность такой процедуры повышается за счет уменьшения физического объема словаря, когда формально он увеличивается, т.е. здесь имеет место виртуализация исходного IO в физической памяти. В моделях алгоритмов и процедур программных компонент технологий сжатия IO на основе словарных методов используются логические структуры, которые описывают область памяти, где будет размещаться формальный словарь. Такие структуры (назовем их заголовками) описывают поля памяти, в которых будет располагаться как служебная информация, так и сам формальный словарь с кодируемым или декодируемым IO, т.е. они определяют замкнутую структурированную динамически изменяемую область памяти. Поля таких областей будут как постоянной и переменной длины, так и с динамически изменяемой структурой [2]. В информационных технологиях такие структурированные поля памяти (заголовки) представляют собой информационный объект, связанный с некоторым исходным IO. Тогда заголовок можно определить как виртуальный объект в реальной физической памяти, имеющей виртуальную организацию. Виртуальная организация "размещения" заголовка в информационном пространстве физической памяти каналов хранения и передачи компьютерных систем и сетей, с одной стороны, заключается в том, что она (физическая память), представляемая в виде бинарного информационного пространства, логически разби-

87

вается на виртуальные ячейки следующих типов. Первый тип – это пассивные ячейки, размерность которых фиксирована и информация в них (бинарная цепочка) не изменяется. Второй тип – это пассивно-активные ячейки, размерность которых фиксирована, но информация в них изменяется. Третий тип – это активные ячейки, размерность которых и информация в них изменяются. Четвертый тип – это активнопассивные ячейки, размерность которых изменяется, но смысловая информация не изменяется. А с другой – представляет собой способ структурирования и "размещения" виртуальных ячеек, на которые заголовок логически разбивается или сегментируется, в физической среде реальной памяти с жесткой адресной и логической организацией. В этом случае заголовок можно определить, с одной стороны, как образ представленный в виде комбинации логически связанных виртуальных ячеек разных типов c учетом содержащейся в них информации, а типы ячеек и информация в них образуют систему непроизводных элементов образа, а с другой – как модель виртуальной памяти на бинарном поле. Для более компактного представления (сжатие) образа исходного IO и его описания используются схемы кодирования, квантования и другие типы как аналитических, так и дискретных аппроксимаций. Тогда исходную задачу кодирования и декодирования можно описывать и решать, используя аппарат теории образов, т.е. рассматривать ее (задачу), как задачу синтеза и распознавания образа исходного IO на бинарных полях, а методы решения таких задач определяются в рамках синтаксического (структурного) подхода.

Вторая конфигурация информационных пространств определяется в виде кортежа <X,N,G>, где G – алгебраическая или логическая структура, заданная на <X,N>. Как частный случай таких структур автором исследуются грамматики образов. Это обусловлено тем, что образное представление информации является более содержательным, позволяет использовать технологии систем научной визуализации и когнитивной компьютерной графики для выявления скрытых закономерностей в информационной и смысловой структуре

88

исходного IO, а также является фактором влияющим на когнитивные функции восприятия, анализа и формирования новых знаний.

При разработке и реализации технологий безопасной и компактной “транспортировки”, а также виртуализации заголовков и исходных IO различной природы в каналах передачи и хранения реальных компьютерных систем и сетей форматы файловых и других логических структур выступают в виде образов “тары” с заданными параметрами в конкретной физической среде памяти информационной транспортной системы, в которой размещается и “упаковывается” как заголовок, так и исходный IO. В такой информационной среде систем виртуальной реальности заголовок и исходный IO представляются как неидентифицированный и неинициализированный информационный бинарный поток в каналах передачи и хранения компьютерных систем и сетей. Это означает, что они "физически" не привязаны к каким-либо форматам файлов, типам данных и логическим структурам, которые могут выступать в функциональной схеме технологий виртуализации каналов либо как атрибуты управления, либо как логически структурированные потоки информации. Такой подход создания технологий передачи, хранения и защиты информации определяет остов и методологию их разработки и реализации в каналах систем виртуальной реальности, когда с любым IO работаем на «физическом» уровне. Последнее означает, что он (IO) изначально задается как бинарное множество, на котором определяются различные логические структуры, используя при этом формализм модели активной памяти на бинарных полях и ее виртуализацию. Эти способы позволяют изначально как в рамках одной модели памяти IO и технологий виртуализации его на бинарных полях, так и в рамках класса моделей проанализировать IO на физическом уровне. А результаты анализа позволят выбрать наиболее оптимальную модель памяти и технологий преобразования в каналах хранения и передачи, но уже в рамках новой парадигмы – виртуализация информационного объекта на бинарном поле с заданной моделью памяти, сортировка и

89

размещение его в информационной “таре” каналов хранения и передачи конкретной информационно-транспортной системы. Поскольку исходный IO является бинарным информационным множеством, на котором определена одна из конструкций информационного пространства и формальный словарь, тогда IO можно описать в <X,N> двумя способами, а именно: определить X , во-первых, как множество статистически независимых символьных цепочек алфавита N, вовторых, как множество статистически зависимых символьных цепочек. Следует заметить, что в существующих технологиях сжатия информации без потерь на основе как традиционных методов префиксного и арифметического кодирования, так и комбинаторного подхода [3] используется первый способ представления файловых структур – как множество статистически независимых элементов заданного формата (например, типа JPEG, TXT, DOC, BMP, MP3 и др.). Второй способ не применялся и, по-видимому (по общедоступным источникам), не исследовался как на предмет его практического применения для разработки технологий кодирования, так и на выявление его возможностей в методологии разработки технологий передачи, хранения и защиты информации. Разработка технологий кодирования IO на основе второго способа в классическом варианте предполагает использование как метода L – грамм, так и других аналогичных способов. В логических схемах и моделях алгоритмов компьютерных технологий сжатия информации этот метод не нашел своего применения, т.к. в рамках парадигмы применения традиционных методов для разработки таких технологий этот метод на первый взгляд, по-видимому, представляется трудоемким, ресурсоемким и неэффективным. Проведенные автором исследования этого метода на предмет его применения для разработки компьютерных технологий передачи, хранения и защиты информации показали иные результаты следующего характера. Во-первых, этот метод можно использовать для разработки программных продуктов технологий сжатия, защиты и восстановления информации, учитывая корреляционные и статистические связи символьных цепочек

90