Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Astashkin.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
352.84 Кб
Скачать

Evolution Origin of modern genome

Sergey Nicolaevich Astashkin

Abstract

Author supports the theory of RNA Origin of Life on the Earth, in earlier work the assessment of emergence of Life on RNA origin model – 50 million years enough for emergence of intelligent "edition" of microRNA was made. In this work the analysis of sequence of process of growth of polymeric structures of pro-DNK-RNK is carried out. The conclusion about its primary organization - as binary system is as a result made.

Accepting the general idea of IP (Information Perfection), the author considers further questions of optimum coding in a genome. In work compliance of the offered model on examples of all genomes and the organization of codons of aminoacids for all Life Kingdom is shown.

Key words: Genome Origin, Binary Life, Information Perfection, multiplets, optimization coding,

1.Общая часть

1.1. Происхождение бинарности

На начальной стадии развития живой материи на Земле происходил рост полимерных структур из смеси мономеров пронуклеотидов. Естественно принять, что синтез последовательностей из нуклеиновых оснований на этой стадии описывался обычным кинетическим уравнением. Закон этого роста можно описать с помощью гипотетического уравнения (1) полимеризации:

(1) a*A + b*B + c*C = AaBbCc ...

Тогда скорость полимеризации представится следующим образом:

(2) V = K*[A]a * [B]b * [C]c ...

Где: V – скорость роста полимерной цепи из мономеров видов - A, B, C..;

K – коэффициент;

[A], [B], [C]...- соответствующие концентрации;

a, b, c... - коэффициенты.

Ясно, что нас интересует разница в скоростях роста в естественных условиях, когда концентрации оснований произвольны. Для того чтобы исследовать поведение реакции полимеризации, примем следующие допущения:

[A] = [B] = [C] .. = [S] и

a = b = c .. = i/N = A

тогда:

(3) V(N) = K*[S]i;

Где:

[S] = гипотетическая средняя концентрация мономеров;

N = число видов нуклеиновых оснований;

i = длина про-ДНК-РНК полимера;

Тогда для i и для i-1 с одной минорной концентрацией (S> Sm) получим:

(4) [S] N*A / ([S] (N-1)*A * [Sm] A) > 1

то есть, при реальных концентрациях [S] много меньше 1, преимущество получает более простая система, с большей концентрацией.. Пример: Когда одна из концентраций будет меньше других (например, примем – 0.5 * S), тогда получим для : N(2)=2 и N(4)=4 , когда [S] = 1 при длине ДНК-РНК = 100 оснований. Если одна концентрация будет : [C]=[0,5*S] , получим:

R2/4= V(2)/V(4)= K*[S]100/ ( [S]75 * [0,5*S]25 } = 1 / 0,525

Где:

R2/4- отношение скоростей полимеризации: для N(2)=2 и N(4)=4 .

Тогда:

R2/4 = 1 / 0,525 ~ 3,3 * 107

Если данная концентрация будет меньше других (например 50% [0.5*S] от других), то отношение скоростей полимеризации, при прочих равных условиях будет ~ 3.3 * 107 как было бы, например, при вариантах ` `A`+` T ` и `A`+` T ` + ` C `+` G ` или на семь порядков меньше. Таким образом, практически, не были бы воспроизведены пары, как в нашем случае `C` +`G`. Принимая во внимание трудности связанные с естественным синтезом и стабильностью `C`, сделанное предположение является правдоподобным, в предположении естественного происхождения `C`. Таким образом, ясно, что скорость полимеризации в случае первичной модели будет на 7 порядков больше, так что необходимо принять, что первичные (архаичные) полимерные проДНК-РНК структуры - будут бинарными комплементарными системами. Здесь возникает одно ` НО ` - мера архаичности? Автор не считает, что простейшие (микробы) обязательно архаичны, более того, большинство из них новейшие простейшие. Статистический анализ было бы логично делать не на основе отношений `A`+`T`/`C`+`G`, а по длине мультиплетов (A..),(T..),(C..),(G..)(A/T..),(C/G..) - например: АААААА. - А(6) – мультиплет.

Так что, там, где статистический смысл последовательностей начинает исчезать и возможно с высокой вероятностью считать рудиментами платформ. С другой стороны, в результате полиморфизма изофункциональных кластеров ДНК, структура также несёт в себе её историю происхождения и глубину эволюции кластеров, геномов. Ясно, что эволюционно, последующее появление еще одной пары: `C`-`G`, позволило увеличить информационную емкость проДНК-РНК при той же термодинамической устойчивой длине. С точки зрения последующей трансформации РНК, необходимо признать, что эволюция нашла еще один способ `уплотнить ` ДНК информацию. B отдельных геномах до 2-4 размера мультиплетов будет `чувствоваться` старая ДНК (как `платформы`), на которой шли активные мутационные процессы. Но это стало возможным с появлением `собственного производства` - `C` и `G`.

1.2. Сравнение мультиплетов геномов разных организмов

Таким образом, предлагается модель развития первичных живых матриц PAM (Primary Alive Matrix) где: `AT `-матрица была основной и древнейшей. Сохранены и биохимические: START -`AUU` и STOP -`UAA` кодоны. Матрица `CG` - появляется позже, когда появляется биохимический синтез этих нуклеиновых оснований. Очевидно, что когда этот синтез появился, `C` и `G ` – начали замещать `A и T `- генетический материал. `CG` - матрица входила в древний геном сначала как несущественная ошибка. И наиболее древние копировали ее чисто механически. Но, когда источник – биохимические циклы синтеза `C` и `G` появились, их присутствие уже не лимитировало (как другие ошибки) развитие и самовоспроизведения. И новая пара нуклеиновых оснований нашла свое место в эволюции. Ясно, что мы находимся далеко от этой удивительной эпохи – БИНАРНОЙ ЖИЗНИ. С другой стороны, мы можем наблюдать сложные эволюционные процессы:

1. Распад `AT` платформ.

2. Замещение `AT ` платформ - `CG` платформами.

3. Вырождение `AT` - платформ.

4. Вырождение `CG` - платформ.

Распад матриц мы можем определить из следующих соображений:

Примем: Скорость распада мультиплета размера (N) - зависит от его связанности с геномом:

(4) dN / dt = F(N)

Где: N – размер мультиплета.

F(N) - функция зависящая от `N`- размера мультиплета и его `связанности` с геномом.

t - `нормализованное` время.

Скорость распада мультиплетов (n) пропорциональна их количеству:

(5) dn(N) / dt = Kn * n(N)

Где: n(N) – количество мультиплетов с `N` – размерами

Kn – коэффициент.

Используя уравнения (5) и (6) получаем:

(6) dN = F(N) * dn/(( Kn )* n(N) )

Функция F(N) – зависит от степени участия мультиплетов в жизненно-важных кластерах: как `ключей`, `инициирующих последовательностей` и других знаков в `грамматике` генома. Можно ожидать три простейших случая:

(7) а) F(N) = KN* N - когда мультиплеты размера -`N` не связаны своим размером с функциями генома;

Где: KN – Коэффициент характеризующий связь мультиплетов `N` размера с геномом (связь слабая);

б) F(N) = KN – когда мультиплеты `N` размера связаны своими кодирующими свойствами с геномом;

в) F(N) = KN /N - когда мультиплеты размера `N` сильно связаны своим размером с функциями генома и их оптимальная для генома мутация пропорциональна их размеру;

Соответственно получаем основные зависимости `N` от` n(N)`:

(8) для 7 а Ln ( Ni/Nk ) = K1 * Ln ( n(Ni) / n(Nk) )

(9) для 7 б Ni -Nk = K1 * Ln (n(Ni) / n(Nk) )

(10) для 7 в Ni2 -Nk2 = K1 * Ln (n(Ni) / n(Nk) )

Где: К1 = KN / Kn

Можно ожидать, что разные размеры и виды мультиплетов будут находиться в различной зависимости от генома и, соответственно, описываться различными уравнениями. Эти зависимости позволяют измерять `дискретное` значение скорости мутаций в отдельных участках кластеров геномов. Ясно, что эти значения носят вероятностный характер и требуют дополнительных подтверждений. Обычно функция F(N) - имеет отрицательное значение, при ее положительном значении мы будем иметь рост размеров мультиплетов.

Таким образом, появляется идея об информационном совершенстве геномов. Так, как мы, по сути, видим одну из сторон эволюции генома, которая определяет в нём основной вектор мутаций. Степень `информационного` совершенства: это приближение отношения CG/AT к `1`, для этого удобно сравнивать суммы логарифмов произведений размеров мультиплетов `CG и AT` на их количество `n`.

N=1 N=1

(11) Q1 = ∑ N*Ln [n(CG )] / ∑ N*Ln [n(AT )]

N=max N=max

Где: Q1 – `Первый` уровень эволюции.

nAT ,nCG - количество мультиплетов размером `N` для: - (nAT) и - nCG.

Так как этот критерий содержит в себе и `рудиментарные ` признаки – большие платформы, которые в существенной степени определяют уровень эволюции генома.

1.3. Статистика

Проведен статистический анализ геномов из различных классов живых организмов на присутствие мультиплетов из `A`, `T`, `A`+`T`, `C`+`G`,`AT`, `CG`. Статистический анализ проводился подсчетом мультиплетов (например: `А` – сумм ААА, `A`+`T` и `C`+`G` - простой суммой соответствующих размеров мультиплетов `A` и `T`, `C` и `G`- соответственно . `AT` и `CG` - заменой `T` на `A`, и `G` на `C` соответственно в исследуемом геноме. Таким образом был показан заместительный принцип роста содержания `C` + `G` во всех исследованных организмах:

Граф.1 СОВРЕМЕННыЙ (геном) A- E.Coli genome 0157-H7, B - Encephalitozoon cuniculi Chr 4, C – Giardia lamblia Chr 1.

Граф.2 НОВыЙ тип I, A- Condida Chr J, B- Saccharomyces cerevisiae Chr 2, C-Yarrowia lipolica Chr f.

Граф.3 НОВыЙ тип I, B- Trypanosoma brucei Chr 2, C- Plasmodium falciparum Chr 6.

Граф.4 НОВыЙ тип I, A- Caenorhabditis Elegans Chr IV,B- Drosophila melanogaster Chr 3L, C- Arabidopsis thaliana Chr 1, FIG 5 – Fugu cluster.

Граф.5 НОВыЙ тип I, B- Homo Sapiens Chr 7, C- Mouse Chr 4.

Граф.6 Drosophila melanogaster – Chr 2L, 2R, 3L, 3L, X, 4.

Граф.7 – Примеры апроксимации распада мультиплетов.

Граф.8 – СОВРЕМЕННыЙ –S - Leishmania major (а), Leishmania nfant (б), Tularemia ©.

Таблица 1 – Рассчитанные коэффициенты 'K1' – для различных участков графиков геномов. Вычисления производились по формуле : Ni –Nk = K1 * Ln (n(Ni) / n(Nk) ).

1.4. Поведение AT и CG матриц

В соответствии с результатами статистической проверки предложенной `AT`- модели, были обнаружены `AT`- матрицы. Наблюдается тенденция `сжатия` пространства между `AT` и `CG` матрицами. Проявляется также тенденция к расщеплению мультиплетов. Соответственно, мы можем наблюдать этот процесс в развитии для различных геномов. Отмеченный процесс развития геномов дает векторы их развития, которые позволяют делать вывод об относительном эволюционном уровне генома. Модель позволяет сделать генетическое сравнение развития организмов из различных классов Царств Животных и Растений. Становится возможным установить их иерархию. Скорости распада и замещений отдельных групп дают возможность рассчитать региональные скорости мутаций и их векторы. Хромосомные геномы показывают коллинеарное поведение хромосом. Мы наблюдаем `дирижируемое` поведение мутаций в хромосомах одного генома. На Граф.8 показана хромосома Leishmania major (а) и Leishmania infanta (б). Это представители новейшего типа генома, который явно образовался путем `варки` в бульоне из разрушенных ядер из представителей современных (modern) гномов, `вивисекцией` существенных кластеров, и то `АТ` содержащих: например с помощью тепловой обработки. Причем Leishmania явно показывает тот же принцип сжатия AT – CG пространства, но уже с `другой` стороны -`CG`. В таблице 1 приведены коэффициенты -`К1` ,для различных размеров -`N`, для различных геномов. Наблюдается существенно более высокая подвижность `C`, `G` и `CG` - мультиплетов по сравнению с `A`, `T` и `AT`.

Отличие мутационной подвижности в различных частях кластеров может достигать десяти порядков!! Это косвенно указывает на общую нестабильность геномов и их высокую пластичность [1].

Вычислены значения `Q1` для различных геномов. В одних и тех же классах живых организмов наблюдается широкий разброс уровня информационного эволюционного развития геномов. Человеческий геном оказался чуть лучше Caenorhabditis Elegans, но существенно уступает геному Fugu. Дрожжи тоже показывают достаточно высокий уровень `Q1`. Естественно, что геномы: E. Coli , Giardia lamblia, Encephalitozoon cuniculi - показали высокие `Q1`.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]