Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МЕДИЦИНСКАЯ ГЕНЕТИКА

.pdf
Скачиваний:
234
Добавлен:
29.02.2016
Размер:
1.79 Mб
Скачать

определена полностью. Поэтому работу по расшифровке генома нематоды следует признать весьма успешной.

Еще больший успех связан с расшифровкой генома дрозофилы, лишь в

2 раза уступающего по размеру ДНК человека и в 20 раз превосходящего ДНК нематоды. Несмотря на высокую степень генетической изученности дрозофилы, около 10% ее генов были до этого момента неизвестны. Но самым парадоксальным является тот факт, что у гораздо более высоко организованной по сравнению с нематодой дрозофилы количество генов оказалось меньше, чем у микроскопического круглого червя! С современных биологических позиций это трудно объяснить. Больше генов, чем у дрозофилы, присутствует и в расшифрованном геноме растения из семейства крестоцветных - арабидопсиса, широко используемого генетиками в качестве классического экспериментального объекта.

Разработка геномных проектов сопровождалась интенсивным развитием многих областей науки и техники. Так, мощный импульс для своего развития получила биоинформатика. Был создан новый математический аппарат для хранения и обработки огромных массивов информации; сконструированы системы суперкомпьютеров, обладающие невиданной мощностью; написаны тысячи программ, позволяющих в считанные минуты проводить сопоставительный анализ различных блоков информации, ежедневно вводить в компьютерные базы новые данные,

получаемые в различных лабораториях мира, и адаптировать новую информацию к той, которая была накоплена ранее. Одновременно были разработаны системы для эффективной изоляции различных элементов генома и автоматического секвенирования, то есть определения нуклеотидных последовательностей ДНК. На этой базе были сконструированы мощные роботы, значительно ускоряющие секвенирование и делающие его менее дорогостоящим.

Развитие геномики, в свою очередь, привило к открытию огромного количества новых фактов. Значение многих из них еще предстоит оценить в

будущем. Но и сейчас очевидно, что эти открытия приведут к переосмыслению многих теоретических положений, касающихся возникновения и эволюции различных форм жизни на Земле. Они будут способствовать лучшему пониманию молекулярных механизмов, лежащих в основе работы отдельных клеток и их взаимодействий; детальной расшифровке многих до сих пор неизвестных биохимических циклов;

анализу их связи с фундаментальными физиологическими процессами.

Таким образом, происходит переход от структурной геномики к

функциональной, которая в свою очередь создает предпосылки для

исследования молекулярных основ работы клетки и организма в целом.

Накопленная уже сейчас информация будет предметом анализа в течение

нескольких ближайших десятилетий. Но каждый следующий шаг в

направлении расшифровки структуры геномов разных видов, порождает новые технологии, облегчающие процесс получения информации. Так,

использование данных о структуре и функции генов более низко организованных видов живых существ может значительно ускорить поиск

специфических генов высших. И уже сейчас

методы компьютерного

анализа, используемые для идентификации

новых генов,

зачастую

вытесняют достаточно трудоемкие молекулярные методы поиска генов.

Наиболее важным следствием расшифровки структуры генома определенного вида является возможность идентификации всех его генов и,

соответственно, идентификации и определения молекулярной природы транскрибируемых молекул РНК и всех его белков. По аналогии с геномом родились понятия транскриптома, объединяющего пул образовавшихся в результате транскрипции молекул РНК, и протеома, включающего множество кодируемых генами белков. Таким образом, геномика создает фундамент для интенсивного развития новых наук – протеомики и транскриптомики. Протеомика занимается изучением структуры и функции каждого белка; анализом белкового состава клетки; определением молекулярных основ функционирования отдельной клетки, являющегося

результатом координированной работы многих сотен белков, и

исследованием формирования фенотипического признака организма,

являющегося результатом координированной работы миллиардов клеток.

Очень важные биологические процессы происходят и на уровне РНК. Их анализ является предметом транскриптомики.

Наибольшие усилия ученых многих стран мира, работающих в области геномики, были направлены на решение международного проекта «Геном человека». Значительный прогресс в этой области связан с реализацией идеи,

предложенной Дж. С. Вентером, заняться поиском и анализом

экспрессирующихся последовательностей ДНК, которые в дальнейшем могут быть использованы в качестве своеобразных «ярлыков» или маркеров определенных участков генома. Другой независимый и не менее плодотворный подход, был использован в работе группы, возглавляемой Фр.

Коллинзом. Он основан на первоочередной идентификации генов наследственных болезней человека.

Расшифровка структуры генома человека привела к сенсационному открытию. Оказалось, что в геноме человека только 32 000 генов, что в несколько раз меньше количества белков. При этом белок-кодирующих генов только 24 000, продуктами остальных генов являются молекулы РНК.

Процент сходства по нуклеотидным последовательностям ДНК между разными индивидуумами, этническими группами и расами составляет 99,9%.

Это сходство и делает нас людьми – Homo sapiens! Вся наша изменчивость на нуклеотидном уровне укладывается в очень скромную цифру – 0,1%.

Таким образом, генетика не оставляет места для идей национального или расового превосходства.

Но, посмотрим друг на друга – мы все разные. Еще более заметны национальные, а тем более, расовые различия. Так какое же количество мутаций определяют изменчивость человека не в процентном, а в абсолютном выражении? Для того чтобы получить эту оценку, нужно вспомнить, каков размер генома. Длина молекулы ДНК человека составляет

3,2х109 пар оснований. 0,1% от этого – 3,2 миллиона нуклеотидов. Но вспомним, что кодирующая часть генома занимает менее 3% от общей длины молекулы ДНК, а мутации вне этой области, чаще всего, не оказывают никакого влияния на фенотипическую изменчивость. Таким образом, для получения интегральной оценки числа мутаций, оказывающих влияние на фенотип, нужно взять 3% от 3,2 миллионов нуклеотидов, что и даст нам цифру порядка 100 000. То есть, около 100 тысяч мутаций формируют нашу фенотипическую изменчивость. Если мы сопоставим эту цифру с общим числом генов, то получится, что в среднем на ген приходится 3-4 мутации.

Что это за мутации? Их подавляющее большинство (не менее 70%)

определяет нашу индивидуальную непатологическую изменчивость, то, что нас отличает, но не делает хуже по отношению друг к другу. Сюда входят такие признаки, как цвет глаз, волос, кожи, характер телосложения, рост, вес,

тип поведения, который тоже в значительной степени генетически детерминирован, и многое другое. Около 5% мутаций ассоциированы с моногенными заболевания. Около четверти оставшихся мутаций относятся к классу функциональных полиморфизмов. Они участвуют в формировании наследственной предрасположенности к широко распространенной мультифакториальной патологии. Конечно, эти оценки достаточно грубые,

но они позволяют судить о структуре наследственной изменчивости человека.

Глава 1.16. Молекулярно-генетические основы эволюции

Произошедшая на рубеже тысячелетий революция в области молекулярной биологии, завершившаяся расшифровкой структуры геномов многих сотен видов микроорганизмов, а также некоторых видов простейших,

дрожжей, растений, животных и человека, перевернула многие традиционные представления классической генетики и вплотную приблизила возможность исследования молекулярных механизмов эволюции и видообразования. Родилась новая наука - сравнительная геномика,

позволяющая регистрировать появление в различных филогенетических линиях эволюционно значимых событий, происходящих на уровне отдельных молекул. Оказалось, что в общем случае эволюционный прогресс ассоциируется не только, и не столько с увеличением числа, протяженности и даже сложности структурной организации генов, но в гораздо большей степени с изменением регуляции их работы, определяющей координацию и тканеспецифичность экспрессии десятков тысяч генов. Это, в конечном счете, и привело к появлению у высших организмов более сложных, высоко специфичных, многофункциональных комплексов взаимодействующих белков, способных выполнять принципиально новые задачи.

Рассмотрим характер изменений, происходящих в процессе эволюции на трех информационных уровнях: ДНК – РНК – белок или геном – транскриптом – протеом. В общем случае можно сказать, что по мере нарастания сложности организации жизни, происходит увеличение размера генома. Так, размер ДНК прокариот не превышает 8х106 п. о., он становится вдвое больше у дрожжей и простейших, в 10-15 раз больше у насекомых, а у млекопитающих увеличение достигает 3 порядков, то есть в тысячу раз (103).

Однако эта зависимость не носит линейный характер. Так в пределах млекопитающих мы уже не наблюдаем существенного увеличения размера генома. Кроме того, не всегда удается наблюдать зависимость между величиной генома и сложностью организации жизни. Так, у некоторых растений величина генома на порядок или даже на два порядка больше, чем у человека. Напомним, что увеличение размера генома эукариот по сравнению с прокариотами происходит, главным образом, за счет появления некодирующих последовательностей, то есть факультативных элементов. Мы уже говорили о том, что в геноме человека экзоны суммарно составляют не более 1-3%. А это значит, что количество генов у высших может быть лишь в несколько раз больше, чем у микроорганизмов.

Увеличение сложности организации эукариот частично объясняется возникновением дополнительной системы регуляции, необходимой для

обеспечения тканеспецифичности экспрессии генов. Одним из последствий возникшей у эукариот прерывистой организации генов явилось широкое распространение альтернативного сплайсинга и альтернативной транскрипции. Это привело к появлению нового свойства у огромного числа генов - способности кодировать множественные функционально различающиеся изоформы белков. Таким образом, общее количество белков,

то есть размер протеома, у высших может быть в несколько раз больше количества генов.

У прокариот допустима внутривидовая изменчивость по числу генов, и

подобные различия между разными штаммами многих микроорганизмов, в

том числе и патогенных, могут составлять десятки процентов. При этом сложность организации различных видов микроорганизмов прямо коррелирует с числом и протяженностью кодирующих последовательностей.

Таким образом, фенотипическая внутри- и межвидовая изменчивость находится в строгой ассоциации с очень близкими по своим значениям размерами транскриптома и протеома. У эукариот число генов является жестко детерминированным видовым признаком, и в основе увеличения эволюционной сложности лежит иной принцип – дифференциальное многоуровневое использование различных компонентов ограниченного и достаточно стабильного протеома.

Секвенирование геномов нематоды и дрозофилы показало, что размеры протеомов у этих столь разных видов очень близки и лишь вдвое больше, чем у дрожжей и некоторых видов бактерий. Эта закономерность – значительное нарастание сложности организации различных форм жизни при сохранении или относительно небольшом увеличении размеров протеома – характерна для всей последующей эволюции вплоть до человека. Так,

протеомы человека и мыши практически не различаются между собой и по своим размерам менее чем в 2 раза превосходят протеомы круглого микроскопического червя нематоды или плодовой мушки дрозофилы. Более того, идентичность нуклеотидных последовательностей ДНК человека и

больших африканских обезьян составляет 98,5%, а в кодирующих областях достигает 99%. Эти цифры мало отличаются от значения 99,9%,

определяющего внутривидовое сходство по нуклеотидным последовательностям ДНК между различными индивидуумами, народами и расами, населяющими нашу планету. Так какие же изменения, составляющие не более 1,5% от всего генома, являются ключевыми для формирования человека? Ответ на этот вопрос, по-видимому, следует искать не только на геномном и протеомном уровнях.

Действительно, наряду с относительной стабильностью протеома, в

процессе эволюции происходит резкое увеличение размеров и сложности организации транскриптома эукариот за счет появления в геноме огромного количества транскрибируемых и не кодирующих ДНК, а также значительного расширения класса РНК-кодирующих генов. РНК, не кодирующие белки, главным источником которых служат интроны,

составляют подавляющую часть транскриптома высших организмов,

достигая 97-98% всех транскрипционных единиц. В настоящее время интенсивно анализируются функции этих молекул.

Таким образом, ключевые эволюционные изменения происходят на фоне увеличения размера генома, достаточно стабильного протеома и резкого увеличения размера транскриптома – рис. 31.

Рисунок 31. Эволюционные изменения, происходящие на трех

информационных уровнях При этом переход от простых форм жизни к более сложным очевидно

коррелирует с возникновением и широким распространением в геноме двух фундаментальных и в некоторой степени взаимосвязанных эволюционных приобретений: некодирующих ДНК и повторяющихся элементов. Прямым следствием этих изменений, происходящих на геномном уровне, является появление в процессе эволюции огромного количества не кодирующих белки РНК.

Какова же структурная основа этих эволюционных преобразований?

Все крупные эволюционные переходы: от прокариот к эукариотам, от простейших к многоклеточным, от первых животных к билатеральным и от примитивных хордовых к позвоночным, сопровождались резким увеличением сложности генома. По-видимому, такие скачки в эволюции являются результатом редких случаев удачного слияния целых геномов различных видов, принадлежащих дивергировавшим на значительное расстояние друг от друга систематическим классам. Так, симбиоз Archaea и Bacteria положил начало переходу от прокариот к эукариотам. Очевидно, что митохондрии, хлоропласты и некоторые другие органеллы клеток также появились в результате эндосимбиоза. Фундаментальное свойство высших эукариот – диплоидия – возникла вследствие хорошо отрегулированной геномной дупликации, которая совершалась около 500 миллионов лет назад.

Геномные дупликации в пределах вида происходили достаточно часто, и

примерами тому служат многочисленные случаи полиплоидии у растений,

грибов и даже иногда у животных. Однако потенциальными механизмами,

ведущими к возникновению в процессе эволюции принципиально новых форм жизни, являются не аутополиплоидии, а гибридизация и горизонтальный перенос или слияние геномов. Примечательно, что наиболее значительные эволюционные преобразования, сопровождающиеся слиянием целых геномов, происходят в экстраординарных условиях, в периоды крупных геологических переходов, таких как изменение концентрации кислорода в атмосфере, оледенение Земли или Кембрийский взрыв.

В относительно спокойных геологических условиях более значимыми для эволюции оказываются дупликации отдельных генов или хромосомных сегментов с их последующей дивергенцией. Сравнение нуклеотидных последовательностей секвенированных геномов показывает, что частота дупликаций генов достаточно высока и, в среднем, составляет 0.01 на ген за миллион лет. Подавляющее большинство из них не проявляют себя на протяжении последующих нескольких миллионов лет, и лишь в редких

случаях дуплицированные гены могут приобрести новые адаптивные функции. Тем не менее, многочисленный класс «молчащих» дупликаций генов служит своеобразным резервным фондом для рождения новых генов и образования новых видов. В геноме человека присутствует от 10 до 20 тысяч копий процессированных генов, возникших путем ретропозиции мРНК.

Большинство из них относятся к классу псевдогенов, то есть они не экспрессируются либо из-за присутствия мутаций, либо из-за инсерции в транскрипционно неактивные районы генома. Однако часть таких генов активна, причем характер их экспрессии и даже функции могут быть иными,

чем у генов-основателей.

Особую роль в эволюции приматов и человека играют сегментные дупликации, относящиеся к классу низкокопийных повторов (LCR) и

возникшие менее 35 миллионов лет назад. Эти последовательности представляют собой высоко идентичные блоки ДНК, варьирующие по величине от одной до нескольких сотен килобаз. Чаще всего сегментные дупликации локализуются в перицентромерных или теломерных районах различных хромосом, и суммарно они занимают около 5% генома человека.

В других секвенированных геномах сегментные дупликации не обнаружены.

Минимальный модуль сегментной дупликации, получивший название дупликон, содержит фрагменты неродственных непроцессированных генов, и

это отличает его других известных типов повторяющихся последовательностей. При определенных условиях дупликоны могут служить источниками создания новых химерных транскрибируемых генов или семейств генов из различных комбинаций представленных в них кодирующих экзонов. По некоторым оценкам от 150 до 350 генов могут различать геномы шимпанзе и человека.

Не умаляя значения для видообразования фактов появления новых и исчезновения старых кодирующих последовательностей, следует подчеркнуть реальную возможность существования иных механизмов,

играющих определяющую роль в эволюции эукариот.

Одним из движущих механизмов эволюции являются мобильные элементы, найденные у всех исследованных в этом отношении видов.

Изменения генома, сопровождающие процесс видообразования, могут включать обширные реорганизации кариотипа, локальные хромосомные перестройки, дупликации семейств генов, модификации отдельных генов,

сопровождающиеся их рождением или утратой, а также различия в экспрессии генов, регулируемые как на уровне транскрипции, так и на уровнях сплайсинга или трансляции. Мобильные элементы имеют непосредственное отношение ко всем этим процессам.

В некоторых случаях мобильные элементы сами несут последовательности, кодирующие ферменты, присутствие которых необходимо для осуществления транспозиции ДНК или ретропозиции РНК.

Подобные последовательности присутствуют в геноме ретровирусов, LTR-

элементов и транспозонов. К числу ретротранспозонов относится и наиболее многочисленный класс мобильных элементов – Alu-повторы. Впервые Alu-

повторы появляются у приматов около 50-60 миллионов лет назад из небольшого РНК-кодирующего гена. В процессе дальнейшей эволюции происходит дивергенция и мощная амплификация этого семейства. Переход от приматов к человеку сопровождается взрывообразным нарастанием числа

Alu-повторов, количество копий которого по некоторым оценкам достигает

1,1 миллиона. Alu-повторы занимают около 10% генома человека, но их распределение неравномерно, так как они в большей степени ассоциированы с генами. Эти элементы редко присутствуют в кодирующих экзонах и достаточно часто обнаруживаются в интронах и в не кодирующих районах мРНК, оказывая влияние на стабильность этих молекул и/или эффективность трансляции. Присутствие Alu-последовательностей в интронных областях генов может сопровождаться изменением характера процессинга преРНК, так как эти последовательности содержат районы, гомологичные донорным и акцепторным сайтам сплайсинга. При инсерции Alu-элементов в регуляторные районы гена может нарушаться транскрипция, следствием чего