Добавил:

nikinator25 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Московский технический университет связи и информатики

Предмет:

Теория информации

Файл:

3 курс (заочка) / (Пособие) ТИ.docx

Скачиваний:

Добавлен:

15.02.2021

Размер:

25.95 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1413 14 > Следующая >>>

9.2.3 Кодирование в биологических структурах

Исследования показали, что и внутри всех биологических организмов тоже существует информационный обмен. Примером этого является информационный обмен осуществляемые на уровне клеток. В середине прошлого столетия был открыт генетический код. Оказалось, что все существа на планете Земля состоят из клеток, основой которых являются белки, а белки образуются из аминокислот. Каждая аминокислота образуется из так называемых нуклеотидов или триплетных комбинаций, азотистых оснований мРНК, а именно цитозина, аденина и гуанина.

При этом каждой аминокислоте соответствует свой триплет, свой набор нуклеотидов, фактически своя кодовая комбинация. Биологи называют эти комбинации кодонами, а мы в нашем курсе теории информации употребляли термин кодовая комбинация.

Таблица 7

2-е положение

1-е положение

UUU

Phe

UCU

Ser

UAU

Tyr

UGU

Cys

3-е положение

UUC

Phe

UCC

Ser

UAC

Tyr

UGC

Cys

UUA

Leu

UCA

Ser

UAA

ochre

UGA

opal

UUG

Leu

UCG

Ser

UAG

amber

UGG

Try

CUU

Leu

CCU

Pro

CAU

His

CGU

Arg

CUC

Leu

CCC

Pro

CAC

His

CGC

Arg

CUA

Leu

CCA

Pro

CAA

Gln

CGA

Arg

CUG

Leu

CCG

Pro

CAG

Gln

CGG

Arg

AUU

Ile

ACU

Thr

AAU

Asn

AGU

Ser

AUC

Ile

ACC

Thr

AAC

Asn

AGC

Ser

AUA

Ile

ACA

Thr

AAA

Lys

AGA

Arg

AUG*

Met

ACG

Thr

AAG

Lys

AGG

Arg

GUU

Val

GCU

Ala

GAU

Asp

GGU

Gly

GUC

Val

GCC

Ala

GAC

Asp

GGC

Gly

GUA

Val

GCA

Ala

GAA

Glu

GGA

Gly

GUG*

Val

GCG

Ala

GAG

Glu

GGG

Gly

Триплетные комбинации азотистых оснований мРНК: тимин, цитозин, аденин, гуанин (U, C, A, G) определяют следующие аминокислоты: Phe – фениланин, Leu – лейцин, Ile – изолейцин, Met – метионин, Val – валин, Ser – серин, Pro – пролин, Thr – треонин, Ala – аланин, Tyr – тирозин, His – гистидин, Gln – глутамин, Asn – аспарагин, Lys – лизин, Asp – аспарагиновая кислота, Glu – глутаминовая кислота, Cys – цистеин, Try – триптофан, Arg – аргинин, Gly –глицин.

Звездочкой обозначены стартовые кодоны, а триплеты ochre, amber, opal действуют как стоп кодоны.

Природа так распорядилась, что одной и той же аминокислоте соответствует разные кодоны, разные кодовые комбинации из приведенной таблицы 7. Это легко заметить, причём некоторым аминокислотам соответствует одно количество триплетных кодовых комбинаций, а другим аминокислотам другое количество. Почему так, к сожалению, на сегодняшний день не знает никто, но, наверное, у природы были основания для такого решения. Возможно в будущем нам удастся открыть эти секреты.

Используемый код не является префиксным, поэтому для обеспечения синхронизации, ровно также как в простом телеграфном аппарате, в генетическом коде предусмотрены стартовые кодоны и стоповые кодоны. Генетический код - это старт-стопный код. Подобная информация ещё раз доказывает универсальность теории информации и значимость для самых разных областей её применения.

Обратимся еще к одному очень интересному применению. Рассмотрим такие объекты как человек - обезьяна и далее по ниспадающей, доходя до достаточно примитивных биологических существ, таких как червячок и т.д.

Если человека закодировать как число 16, а рядом стоящую по степени развития обезьянку числом 15 и т.д., то червячок получит число 1. Если теперь мы постараемся измерить отличия между человеком и обезьяной, измеряя это различием между десятичными числами, то эти отличия между человеком и обезьянкой будут меньше по сравнению с отличием между человеком и червяком.

Теперь десятичные числа 16, 15, 14 и т.д. мы представим в двоичной системе счисления. Тогда человеку будет поставлена в соответствие кодовая комбинация 10000, обезьяне 01111, а червяку- комбинация 00001 (рис.23).

Теперь мы попробуем также сравнить разницу между числами, но выяснится, что между человеком и червячком несовпадение будет в 2-х позициях, тогда как несовпадение между человеком и обезьяной будет в 5-ти событиях. Ситуация абсолютно диаметрально противоположна, по сравнению с предыдущей.

Рисунок 23 – Примеры сравнения

Это говорит о том, что, осуществляя сравнение различных объектов между собой, надо очень точно и правильно определить метрику того пространства в котором осуществляются эти сравнения, иначе в десятичных числах между человеком и обезьяной будет минимальное различие, тогда как при сравнение двоичных чисел, наоборот, максимальное.

Это был один из способов кодирования. Можно было бы поменять местами эти двоичные числа, с точки зрения скорости кодирования ничего не изменится, и в первом, и во втором случае будет затрачено одно и тоже количество символов для кодирования сообщений. Стало быть, энтропия в данном случае будет одинакова для этих источников. Но тогда как быть с тем, что количество вариантов перестановок при кодировании определяется по формуле , где основание кода - это количество символов в кодовой комбинации (рис.23).

Однако природа остановилась на каком-то одном варианте, опять же мы не знаем причин всего этого и надеемся на то, что в будущем появятся какие-то вразумительный ответы на эти вопросы. Но в данном случае это является примером того, что при анализе систем связи, основой которых является теории информации, нам следует расширить блок-схему, придуманную предложенную Клодом Шенноном.

Рассмотрим рисунок 24.

Рисунок 24 – Блок-схема СПИ с оценкой в различных метрических пространствах.

В данной схеме, в отличие от той схемы, которая была нами рассмотрена (ее в свое время предложил Клод Шеннон) между источником сообщений и передатчиком появился ещё один блок - источник сигнала. На приёме между приемником и получателем сообщение появился получатель сигналов. Это сделано для того, чтобы мы могли оценить те особенности, которые включает в себя аналого-цифровое преобразование. А в общем случае при преобразовании сообщений в сигналы в разных метрических пространствах.

На сегодняшний день наибольшей эффективностью обладают цифровые системы передачи, где по каналу связи передается последовательность единиц и нулей с помощью определенных методов. Тогда между передатчиком и приемником мы можем определить так называемый синхронный цифровой тракт, где на входе передатчика цифровая последовательность нулей и единиц, а на выходе приемника соответственно последовательность также нулей и единиц, но уже прошедших через канал, передатчик, приемник и, возможно, подвергшийся влиянию помех.

Поскольку здесь мы имеем дело с двоичным сигналом, то оценивать качество передачи или качество приёма мы можем в пространстве Хемминга, сравнивая последовательности между собой и выявляя различия. Там, где должен был быть 0, может появится 1 и наоборот. Хорошей оценкой для этого является количество таких несовпадений, которые измеряются с помощью показателя верности передачи или вероятности ошибки.

Вероятность ошибки в данном случае равняется количеству неверно принятых двоичных символов, отнесенных к общему количеству принимаемых двоичных символов. Однако эти двоичные сигналы далее преобразуется в сообщения, а уже сообщения сравниваются между собой в совершенно ином пространстве. Примеры этого мы видели, поэтому, говоря о сравнении принятого сообщения из синхронного цифрового тракта с переданным, мы должны говорить о сравнении в том пространстве, в той метрике, которая адекватна этим сообщениям. Если при сравнение цифровых сигналов (двоичных сигналов) мы использовали пространство Хемминга, то здесь нужно использовать что-то другое, в зависимости от того, каким является сообщение, в какой метрике, в каком пространстве это сообщение представимо.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1413 14 > Следующая >>>

Соседние файлы в папке 3 курс (заочка)

#
15.02.202125.95 Mб92(Пособие) ТИ.docx
#
15.02.20213.1 Mб74(Презентация) ТИ.pptx
#
15.02.20218.19 Кб105(Решалка) 4 задание.xls
#
15.02.2021337.48 Кб24Квадрат Виженера.jpg
#
15.02.2021432.61 Кб62Курсовая работа.docx