
- •Днк: умеренно повторяющиеся последовательности диспергированные (mer)
- •Функциональная значимость избыточной днк
- •Днк повторы и проект геном человека
- •Микро- и минисателлитные днк: общие сведения
- •Днк: кодирующие и некодирующие участки
- •Сателлитные днк (локализованные тандемные повторы)
- •Альфа-сателлитная днк: общие сведения
- •Разнообразие теломер
- •Теломеры: возможные варианты формирования
- •Теломеры: роль в клеточном старении
- •Старение клеток, теломеры и проблема концевой репликации
- •Теломерная гипотеза старения и иммортализации клеток
- •Потеря теломер или повреждение днк?
- •Каскадная модель клеточного старения (потеря теломер-повреждения днк)
- •Старение клетки и p53: значение для опухолевой трансформации
- •Ретротранспозиция (ретропозиция)
- •Рак груди: роль ошибок репликации
- •Повторы днк и мутации
- •Повторы в эукариотическом геноме
ПОВТОРЯЮЩИЕСЯ ПОСЛЕДОВАТЕЛЬНОСТИ (ПОВТОРЫ) ДНК
Повторы в эукариотическом геноме
Геном эукариот характеризуется двумя основными особенностями: 1) Повторенность последовательностей; 2) Разделением по составу на различные фрагменты, характеризуемые специфическим содержанием нуклеотидов;
Повторенная ДНК состоит из нуклеотидных последовательностей различной длины и состава, которые встречаются в геноме несколько раз либо в тандемно-повторенном, либо в диспергированном виде. Последовательности ДНК, которые не повторяются, называются уникальной ДНК (single-copy DNA). Размер части генома, занятой повторяющимися последовательностями, широко варьирует между таксонами. У дрожжей он достигает 20%, у млекопитающих до 60% всей ДНК повторяется. У растений процент повторенных последовательностей может превышать 80%.
По взаимной ориентации в структуре ДНК различаются прямые, инвертированные, симметричные повторы, палиндромы, комплементарные палиндромы и т.п. В очень широком диапазоне варьирует и длина (в числе оснований) элементарной повторяющейся единицы, и степень их повторяемости, и характер распределения в геноме (наиболее грубая классификация: тандемно и дисперсно распределенные повторы); наконец, периодичность повторений ДНК может иметь очень сложную структуру, когда короткие повторы включены в более протяженные или окаймляют их и т.д.
Ставшая классической работа Бриттена и Кона (Britten, Kohne, 1968) по кинетике ренатурации ДНК показала, что геномы высших эукариот можно грубо разделить на четыре фракции: самокомплементарная ДНК (foldback DNA), высоко повторенная ДНК (highly repetitive DNA), умеренно повторенная ДНК (middle repetitive DNA) и уникальные последовательности (single-copy DNA). Самокомплементарная ДНК состоит из палиндромных последовательностей, способных образовывать двуцепочечные шпильки, "замыкаясь" сами на себя. Фракция высоких повторов состоит из коротких последовательностей длиной от нескольких нуклеотидов до нескольких сотен н.п., которые имеют около 500,000 копий. В умеренные повторы входят более длинные последовательности от сотен до тысяч н.п., имеющие до 100 копий на геном.
Поиск, классификация и в дальнейшем выявление функции повторов- необходимый этап при анализе геномов. Повторы могут быть точными и неточными. Кроме того, для последовательностей ДНК можно рассматривать зеркальные и инвертированные повторы. С биологической точки зрения интересны также неточные повторы. Такие повторы иногда называются вырожденными.
Дупликации. Повторы в геномных последовательностях были обнаружены довольно давно. Подробную сводку ранних сведений можно найти в книге Газаряна и Тарантула. Повторы в геномах можно классифицировать по-разному:
(1) Некоторые геномы сами являются дупликациями.
(2) Сегментарные дупликации, особенно выраженные в геноме человека. Такие дупликации включают перенос 1-200 т.п.о. блоков геномных последовательностей в основном в прицентромерные и в меньшей степени в субтеломерные районы хромосом. Степень гомологии таких дупликаций выше 90%. Некоторые из этих дупликаций связаны с геномными болезнями.
Сегментарные дупликации занимают 3.3% генома человека ( IHGSC, 2001 , Venter et al., 2001 ).
(3) Дупликации генов и генные семейства.
(4) Множественные копии мобильных элементов.
(5) Простые повторы (короткие, от 1 до нескольких десятков нуклеотидов, в том числе микросателлиты и минисателлиты , которые по-видимому, не кодируют никаких продуктов.
(6) Палидромы.
(7) Блоки тандемно повторенных последовательностей, такие как последовательности в центромерах, теломерах, коротких плечах акроцентрических хромосом, кластеры рибосомальных генов.
(8) Инактивированные ретротранспозированные копии генов.
(9) Внутрибелковые повторы ( Heringa, 1998 ). По частоте встречаемости различают низкокопийные (примерно до 10 копий), умеренно повторяющиеся последовательности (от 10 до 104), часто повторяющиеся последовательности (более 105). По типу следования различают диспергированные и тандемные повторы.
Геном человека известен на 94% ( IHGSC, 2001 ). На основании этого материала можно сделать следующие выводы. Повторы занимают по крайней мере 50% генома. В геноме человека (и млекопитающих) встречаются мобильные элементы четырех типов.
Это long interspersed elements ( LINE , длина 6 т.п.о., число копий 8.5*105, число семейств 3, 21% генома);
short interspersed elements ( SINE , 100-400 п.о., 1.5*106, 3, 13% генома);
LTR retrotransposons (1.5-11 т.п.о., 4.5*105, ?100, 8%);
ВNA transposons (80-3000 п.о., 3*105, ?100, 3%). Несеквенированная пока часть генома относится в основном к центромерным областям хромосом и содержит тандемные кластеры альфа-сателлитных последовательностей, которые подробно рассмотрены ниже.
В геноме многоклеточных организмов имеется большое количество некодирующих повторяющихся последовательностей. Такие повторы представлены в гаплоидном геноме эукариот множественными копиями. В классификации повторов различают часто повторяющиеся последовательности , число которых превышает 105 на гаплоидный геном, и умеренно повторяющиеся , представленные 10-104 копиями. Хорошо изученным представителем первых является сателлитная ДНК , которая состоит из коротких тандемных повторов длиной 1-20 п.о., организованных в длинные блоки.
Повтор длины L с K различиями - это два участка последовательности, имеющих длину L нуклеотидов каждый и различающихся по K нуклеотидам. Примеры повторов приведены на рисунке. Нарушения комплементарности или гомологии отмечены знаком (*).
* * * *
------- >------->-------------->...TACTGGCA ... TACTGCCA... ...TACTGGCATACTGCCA... ...ATGACCGT ... ATGACGGT... ...ATGACCGTATGACGGT...
прямой повтор тандемный повтор
* *
------->------- >...TACTGGCA ... TGCCTGTA... ...TACTGGCATGCCTGTA... ...ATGACCGT ... ACGGACAT... ...ATGACCGTACGGACAT...
Днк: умеренно повторяющиеся последовательности диспергированные (mer)
Диспергированные повторяющиеся последовательности ДНК не организованы в крупные блоки, а рассеяны по геному. Повторы этого типа, называемые умеренно повторяющимися последовательностями ( MERs - medium reiterated frequency repeats ), разделяют на два класса: SINE (short interspersed elements) - короткие и LINE (long interspersed elements) - длинные диспергированные элементы.
Хорошо изученными повторами класса SINE в геноме человека и некоторых приматов являются так называемые Alu-повторы
Хотя LINE-последовательности заключают в себе гены обратных транскриптаз , что является признаком ретротранспозонов (мобильных генетических элементов животных, обладающих структурным сходством с геномом ретровирусов ), для них характерно отсутствие последовательностей длинных концевых повторов ( LTR - long terminal repeats ), типичных для ретротранспозонов. В качестве примера LINE-последовательности можно упомянуть LINE-1-повтор , широко распространенный в геноме животных.
Функциональная значимость избыточной днк
Помимо сателлитной ДНК , SINE- и LINE-повторов , геном человека содержит более 100 000 копий MaLR-повторов длиной в 2-3 т.п.о., содержащих LTR , и несколько тысяч последовательностей генома ретровирусов .
Несмотря на широкую распространенность повторяющихся и уникальных некодирующих последовательностей в геноме эукариот и их очевидную активность во время жизненного цикла организмов, биологическое значение этих и других некодирующих элементов генома остается непонятным. Вызывает сомнение правильность гипотезы об "эгоистичности" избыточной геномной ДНК, в соответствии с которой вся избыточная ДНК является геномным паразитом и распространяется в геноме в результате транспозиций точных копий немногочисленных исходных последовательностей. Действительно, слишком велики были бы энергетические затраты на биосинтез предшественников ДНК и самой ДНК в клетках, в которых содержание "паразитической" ДНК в геноме на 2-3 порядка превышает количество функционально значимой ДНК, заключающей в себе последовательности нуклеотидов генов. Клетки с геномом, "зараженным" эгоистической ДНК, не смогли бы выдерживать конкуренции с клетками, не содержащими "паразита", из-за значительного возрастания энергетических затрат на редупликацию генома. Кроме того, концепция эгоистической ДНК, в соответствии с которой предполагается отсутствие эволюционного давления отбора на "паразитические" последовательности нуклеотидов, не объясняет высокую консервативность мест локализации и размеров интронов в гомологичных генах филогенетически близких организмов, а также не указывает на механизм, поддерживающий число копий повторов на относительно постоянном уровне в ряду поколений организмов. Такого рода концепции не могут ответить на вопрос: где же предел, до которого может самопроизвольно увеличиваться размер генома клетки-хозяина в филогенезе?
Функциональную значимость избыточной ДНК лишь частично объясняют концепции, приписывающие ей структурную роль в пространственной организации генома и участие в конъюгации гомологичных хромосом в мейозе или репликации теломерных участков хромосом. Таким образом, основные положения парадокса C , указывающие на необъяснимое присутствие в геноме эукариотических организмов большого количества избыточной ДНК, по-прежнему остаются загадочными и парадоксальными.