с ДНК белков основан на влиянии связавшегося белка на миграцию молекул ДНК в электрическом поле.
Молекула ДНК обладает высоким отрицательным зарядом и, следовательно, в электрическом поле быстро движется к положительному электроду. При электрофорезе в полиакриламидном геле (см. разд. 8.4.3) молекулы ДНК разделяются по размеру, так как меньшие молекулы легче проходят через мелкую сетчатую структуру геля, чем большие. Молекулы белка, связавшись с ДНК, снижают ее подвижности в геле. В общем, чем больше связавшийся белок, тем медленнее движется связанная с ним молекула ДНК. Это явление лежит в основе метода сдвига электрофоретической подвижности в геле (gel-mobility shift assay). С помощью этого метода удается обнаружить даже следовые количества сайт-специфического ДНК-связывающего белка. В короткие фрагменты ДНК, длина и последовательность которых известна (полученные либо при клонировании ДНК, либо путем химического синтеза, обсуждаемого в главе 8), вводят радиоактивную метку и смешивают с экстрактом клеток, полученную смесь наносят на полиакриламидный гель и проводят электрофорез. Если фрагмент ДНК соответствует области хромосомы, с которой, например, связываются несколько сайт-специфических белков, то при радиоавтографии (см. разд. 9.1.17) видна серия полос ДНК, каждая из них отстает от исходной на разную величину и представляет определенный комплекс ДНК–белок. Белки, связанные с ДНК в каждой из полос, можно выделить последовательным фракционированием клеточного экстракта (рис. 7.27). После очистки сайт-специфического ДНК-связывающего белка можно использовать метод сдвига электрофоретической подвижности для изучения силы и специфичности его взаимодействия с различными последовательностями ДНК, продолжительности жизни комплексов ДНК–белок и других свойств, важных для функционирования белка в клетке.
После определения распознаваемой регуляторным белком последовательности ДНК можно использовать чрезвычайно действенный метод очистки белка,
называемый ДНК-аффинной хроматографией (DNA-affinity chromatography).
Химически синтезированный двухцепочечный олигонуклеотид соответствующей последовательности пришивают к нерастворимой пористой матрице, например агарозе, а затем этой модифицированной матрицей заполняют колонку, которая селективно связывает белки, узнающие определенные последовательности ДНК (рис. 7.28). Этот относительно нетрудоемкий метод позволяет добиться 10 000 кратной очистки.
Большинство регуляторных белков присутствует в клетке в очень маленьких концентрациях, но используя аффинную хроматографию, обычно можно выделить такие количества чистого белка, которых будет достаточно для того, чтобы определить масс-спектроскопией или другими методами (описаны в главе 8) его частичную аминокислотную последовательность. Если известна полная последовательность генома организма, то частичная аминокислотная последовательность может быть использована для идентификации гена. А ген предоставляет не только информацию о полной аминокислотной последовательности белка, но также и возможность его синтеза в неограниченных количествах методами генной инженерии, которые рассмотрены в главе 8.
Глава 7. Контроль генной экспрессии 659
Рис. 7.27. Метод сдвига электрофоретической подвижности. Принцип метода изображен на схе-
ме а. В этом примере экстракт, полученный из линии антител-продуцирующих клеток, смешивали
срадиоактивно-меченым фрагментом ДНК, содержащим около 160 нуклеотидов регуляторной последовательностигена,кодирующеголегкуюцепьиммуноглобулина,продуцируемогоэтойклеточной линией.Воздействиебелков,входящихвсоставэкстракта,наподвижностьфрагментаДНКопределяли методом электрофореза в полиакриламидном геле с последующей радиоавтографией. Свободные фрагменты ДНК быстро мигрируют к концу геля, тогда как те же фрагменты, связанные с белками, задерживаются. Обнаружение шести отстающих полос ДНК указывает на присутствие в экстракте шести различныхсайт-специфическихДНК-связывающихбелков(обозначенныхC1–C6),которыесвязываются
сэтимфрагментомДНК.(ДляпростотывсефрагментыДНК,скоторымисвязываютсяболееодногобелка, нарисункенепоказаны).Насхемебэкстрактыфракционировалипостандартнойметодикехроматографическогоразделениябелков(см.разд.8.2.3)(вверху),каждуюфракциюсмешивалисрадиоактивным фрагментом ДНК, наносили на одну дорожку полиакриламидного геля и анализировали далее, как указано на схеме а. (б — с модификациями из C. Scheidereit, A. Heguy and R.G. Roeder, Cell 51: 783–793, 1987.СразрешенияElsevier.)
7.2.16. Распознаваемую регуляторным белком последовательность ДНК можно установить экспериментально
Обнаружить регуляторные белки можно и до того, как станет известна последовательность ДНК, которую они распознают. Например, множество гомеодоменных белков дрозофилы открыли при селекции мутаций, влияющих на развитие мухи, что позволило определить гены, кодирующие эти белки, а затем получить необходимые количества этих белков сверхэкспрессией в культуре клеток и легко
660 Часть 2. Основные генетические механизмы
Рис. 7.28. ДНК-аффинная хроматография. На первом этапе все белки, способные связываться с ДНК, отделяютотостальныхклеточныхбелковнаколонке,содержащейбольшоеколичестворазличныхпо- следовательностейДНК.Большинствосайт-специфическихДНК-связывающихбелковобладаютслабым (неспецифическим)сродствомковсеймассеДНКипоэтомузадерживаютсянаколонке.Подобноесродствовомногомзависитотионногопритяжения,ибелкиможносмытьсколонкирастворомсосредней концентрациейсоли.Навторомэтапесмесьбелков,связывающихсясДНК,пропускаютчерезколонку, которая содержит только ДНК определенной последовательности. Как правило, все белки «сядут» наколонку—большинствоиз-занеспецифическихвзаимодействий.Исноваихсмываютсколонкирас- творами со средней концентрацией соли, и на колонке остаются только те белки (обычно только один илинесколько),которыесвязываютсяспецифически,аследовательно,оченьпрочноименносданной последовательностью ДНК. Эти оставшиеся на колонке белки элюируют растворами с очень высокой концентрациейсоли.
их очистить. Футпринтинг ДНК (DNA footprinting) — это один из методов определения последовательностей ДНК, распознаваемых регуляторным белком, выделенным в чистом виде. В этом методе необходим также очищенный фрагмент двойной спирали ДНК, содержащий в себе участок, узнаваемый этим белком. Короткие последовательности, распознаваемые белком, могут случайно попадаться на любом длинном фрагменте ДНК, однако часто необходимо использовать ДНК, соответствующую регуляторной области гена, про который известно, что он находится под контролем интересующего белка. Футпринтинг ДНК основан на использовании нуклеаз или химических соединений, которые в случайном порядке разрезают ДНК по любой фосфодиэфирной связи. Связавшийся регуляторный
Глава 7. Контроль генной экспрессии 661
белок препятствует действию нуклеаз на фосфодиэфирные связи, таким образом, точный участок узнавания белком выявляется в виде защищенной зоны, или футпринта — «отпечатка ноги» (рис. 7.29).
Для второго способа определения распознаваемой регуляторным белком последовательности ДНК не требуется предварительных данных о том, какие гены этот белок, быть может, регулирует. В данном случае очищенный белок используют для отбора из большого пула различных случайно созданных коротких фрагментов ДНК только тех, которые прочно с ним связываются. После нескольких циклов такого отбора определяют нуклеотидную последовательность прочно связавшихся с белком фрагментов ДНК, и тогда может быть сформулирована консенсусная последовательность ДНК, которую распознает данный регуляторный белок (рис. 7.30). Как только она становится известна, то при помощи автоматизированного поиска по геному можно определить вероятные гены, транскрипцию которых, возможно, контролирует интересующий регуляторный белок. Однако эту стратегию не стоит считать абсолютно надежной. Например, у многих организмов синтезируется ряд близкородственных регуляторных белков, которые распознают очень схожие последовательности ДНК, но данным методом их нельзя различить. В большинстве случаев полученные в ходе перебора геномных последовательностей предполагаемые участки действия регуляторных белков должны в конечном итоге проходить экспериментальную проверку.
7.2.17. Регуляторные последовательности ДНК определяют, используя сравнительную геномику, методом филогенетического футпринтинга
Широкая доступность полных последовательностей генома предоставляет удивительно простой метод определения важных регуляторных участков ДНК, даже если регуляторный белок, который с ними связывается, неизвестен. Этот метод заключается в сравнении геномов нескольких близкородственных видов. Если виды правильно подобраны, то кодирующие белки части генома будут очень схожими, но области между последовательностями, кодирующими белки или молекулы РНК, будут значительно различаться, так как большинство этих последовательностей не являются функционально важными и поэтому изменяются в ходе эволюции. Среди исключений находятся регуляторные последовательности, которые контролируют транскрипцию генов. Они выступают как консервативные островки в океане неконсервативных нуклеотидов (рис. 7.31). Хотя идентификацию регуляторных белков, распознающих консервативные последовательности ДНК, следует проводить другими способами, тем не менее филогенетический футпринтинг является мощным методом определения многих последовательностей ДНК, контролирующих экспрессию генов.
7.2.18. Методом иммунопреципитации хроматина определяют многие участки ДНК, занимаемые регуляторными белками
вживых клетках
Вопределенный момент времени регуляторный белок не будет занимать
вгеноме все возможные для него участки связывания на ДНК. При некоторых
обстоятельствах белок может быть не синтезирован и поэтому его не будет в клетке; он может быть в клетке, но у него не будет партнера для образования гетеродиме-
662 Часть 2. Основные генетические механизмы
Рис.7.29.МетодфутпринтингаДНК.а)Схемаметода.ВодинизконцовДНК-фрагментавводятрадио- активнуюметку32P(процедураописананарис.8.34)изатеммеченыйфрагментрасщепляютспомощью нуклеазыилихимическогосоединения,вводяслучайныеодноцепочечныеразрывы.Послепроведения денатурацииДНКиразделенияеенаотдельныецепифрагменты,которыеобразуютсяизмеченойцепи, разделяютнагелеидетектируютспомощьюрадиоавтографии(см.рис.8.33).Послеэтогосравнивают расположениеполосДНК,образуемыхвприсутствиииотсутствииДНК-связывающихбелков.Приналичии такогобелкаонприкрываетнуклеотидынаучасткесвязыванияизащищаетихфосфодиэфирныесвязи отрасщепления.Врезультатемеченыефрагменты,которыесодержатучастоксвязывания,отсутствуют, и на геле возникает пробел, именуемый футпринт. В приведенном примере ДНК-связывающий белок защищает семь фосфодиэфирных связей от действия расщепляющего агента. б) Реальный футпринт, использованный для определения участка связывания регуляторного белка человека. В качестве расщепляющегоагентаиспользовалинизкомолекулярноежелезосодержащееорганическоесоединение, которое в норме расщепляет любую из фосфодиэфирных связей с практически равной частотой. (б –
Рис. 7.30. Метод определения последовательности ДНК, распознаваемой регуляторным белком. Очищенный регуляторный белок смешивают с большим количеством коротких фрагментов ДНК с разными последовательностями нуклеотидов. Набор таких фрагментов ДНКможнополучитьпутемпрограмми- рованиясинтезатораДНК—аппарата,ко- торыйхимическисинтезируетДНКлюбой желаемой последовательности (описан вглаве8).Например,существует411,или приблизительно 4,2 миллиона, возможныхнуклеотидныхпоследовательностей для фрагмента ДНК из 11 нуклеотидов. Затем двухцепочечные фрагменты ДНК, которыепрочносвязываютсясрегуляторнымбелком,отделяютотнесвязавшихся с белком фрагментов ДНК. Один из методов,которыйможетбытьиспользован длятакогоразделения,—этометодсдви- га электрофоретической подвижности, какпоказанонарис.7.27.Послеотделения комплексов ДНК–белок от свободнойДНКсвязанныесбелкомфрагменты ДНК отделяют от белков и используют обычно еще в нескольких дополнительных циклах того же самого процесса отбора (не показано). Нуклеотидные последовательности тех фрагментов ДНК, которыеостаютсяпослемногочисленных цикловсвязыванияиразделения,можно определитьипостроитьраспознаваемую данным белком консенсусную последовательностьДНК.
ра; или он не сможет попасть в ядро, пока не поступит соответствующий сигнал из окружающей среды клетки. Даже если регуляторный белок присутствует в ядре и способен связываться с ДНК, компоненты хроматина или другие регуляторные белки, которые могут связываться с теми же последовательностями ДНК или последовательностями, перекрывающими их, могут закрывать многие из его возможных участков связывания на ДНК.
служит эмпирическим способом определения участков ДНК, которые при определенном наборе условий занимает заданный регуляторный белок (рис. 7.32). Метод заключается в следующем: в живых клетках белки ковалентно сшивают с ДНК, клетки разрушают, а ДНК механически дробят на мелкие фрагменты и затем используют антитела против заданного регуляторного белка — чтобы очистить ДНК, с которой ковалентно сшился этот белок в клетке. Если провести гибридизацию этой ДНК с микрочипами, содержащими весь геном, в виде серии отдельных фрагментов ДНК (см. рис. 8.73), то можно точно идентифицировать местоположение каж-
механизмы генетические Основные .2 Часть 664
Рис.7.31.Филогенетическийфутпринтинг.ВэтомпримересравниваютсяпоследовательностиДНК,расположенныеслеваотодногоитогожегена,принадлежащиепятиблизкородственнымвидамдрожжей;одинаковыенуклеотидывыделеныжелтымцветом.Филогенетическийфутпринтингвыявляет участки распознавания ДНК для регуляторных белков, так как эти участки являются более консервативными, чем окружающие их последовательности. Вэтомпримерепоказанатолькообласть,расположеннаялевееотдельногогена,ноэтотподходобычноиспользуютдляанализавсегогенома.Регуляторныебелки,связывающиесясучастком,обведеннымкрасным,показанынарис.7.21.Вданномпримеренекоторыеизболеекороткихфилогенетических футпринтов представляют собой участки связывания дополнительных регуляторных белков, не все из которых идентифицированы. (Из M. Kellis et al.,
Nature 423: 241–254, 2003, с разрешения Macmillan Publishers Ltd., и D. J. Galgoczy et al., Proc. Natl. Acad. Sci. USA 101: 18069–18074, 2004, с разрешения NationalAcademyofSciences.)
Глава 7. Контроль генной экспрессии 665
Рис. 7.32. Иммунопреципитация хроматина.
Этот метод позволяет определить в геноме все участки, занимаемые регуляторным белком in vivo. Амплификация ДНК методом цепной полимеразной реакции (ПЦР) представлена нарис.8.45.ОпределитьосажденныеамплифицированныефрагментыДНКможнопутемгибри- дизациисмесифрагментовсДНК-микрочипами, какописановглаве8.
дого «осажденного» фрагмента ДНК в составе генома.8 Таким образом все участки, занятые регуляторным белком в исходных клетках, могут быть отмечены на генетической карте генома клетки (рис. 7.33).9
Иммунопреципитацию хроматина также часто применяют для локализации в геноме тех участков, укладка которых производилась различными типами модифицированных гистонов (описано в главе 4). В данном случае применяются антитела, специфичные к определенной, интересующей модификации гистонов.
тельность, и при этом определяют, какой из тысячи генов в клетке бу- дет транскрибирован. Для широкого
круга организмов определены тыся- чи регуляторных белков. Каждый из этих белков обладает своими уни- кальными чертами, но большинство
связываются с ДНК в виде гомодимеров или гетеродимеров и распознают ДНК с помощью одного из небольшого числа структурных мотивов. Обычно встречаются мотивы спираль-поворот-спираль, гомеодомен, «лейциновая мол- ния», спираль-петля-спираль и нескольких видов «цинковых пальцев». Точная
9 Развитие в последние годы высокопроизводительного секвенирования следующего поколения — next generation sequencing — позволяет проводить прямое секвенирование фрагментов ДНК, связавшихся с исследуемым белком. Этот метод называется ChIP-seq. — Прим.ред.
666 Часть 2. Основные генетические механизмы
Рис.7.33.Регуляторнаясеть:полныйнаборгенов,контролируемыхтремяключевымирегуляторными белками у почкующихся дрожжей, как было установлено по участкам ДНК, с которыми эти белки связывались. Регуляторные белки, именуемые Mata1, Matα1, Matα2, характеризуют два различных гаплоидных типа спаривания (аналогичных мужским и женским гаметам) этого одноклеточного организма.Показаны16хромосомгеномадрожжей(серые)сцветнымиполосами,обозначающимиучастки, гдесвязываютсяразличныекомбинациитрехрегуляторныхбелков.Надкаждымучасткомсвязывания указаноназваниебелковогопродуктарегулируемогогена.Matα1,действующийвкомплексесдругим белком,Mcm1,активируетэкспрессиюгенов,отмеченныхкраснымцветом;Matα2,действующийвкомплексе с Mcm1, подавляет гены, отмеченные голубым цветом; Mata1 в комплексе с Matα2 подавляет гены, отмеченные зеленым цветом (см. рис. 7.21 и 7.65). Двойные стрелки обозначают дивергентно транскрибируемыегены,которыеконтролируютсяуказаннымирегуляторнымибелками.Этаполнаякарта связываниярегуляторныхбелковбылаполученаспомощьюсочетанияметодовиммунопреципитации хроматина (см. рис. 7.32) и филогенетического футпринтинга (см. рис. 7.29), проведенных в пределах генома. Подобное определение полных регуляторных сетей показывает, что эти сети не обязательно являютсякрайнесложными,хотяпервоначальномогутказатьсятаковыми.Подобныйтиписследований такжепомогаетвыявитьобщуюлогикутранскрипционныхсетей,используемуювсовременныхклетках. (Из .J. Galgoczy et al., Proc. Natl Acad. Sci. USA 101: 18069–18074, 2004. С разрешения National Academy ofSciences.)
Гетеродимеризация увеличивает диапазон распознаваемых последовательно- стей ДНК. В настоящее время доступны мощные методы для идентификации и выделения этих белков, генов, которые их кодируют, и распознаваемых ими последовательностей ДНК, а также для картирования всех генов, которые
эти белки регулируют в геноме.
7.3. Как работают генетические переключатели
В предыдущей части описаны основные компоненты генетических переключателей: регуляторные белки генов и специфические последовательности ДНК, кото-
Глава 7. Контроль генной экспрессии 667
рые эти белки распознают. Сейчас мы рассмотрим, как работают эти компоненты, включая и выключая гены в ответ на разнообразные сигналы.
В середине XX века идея о том, что гены можно включать и выключать, была революционной. Это представление стало главным прорывом в нашем понимании механизмов регуляции генов, а первоначально возникло при изучении адаптации бактерий E. coli к изменениям состава питательной среды. Параллельные исследования бактериофага лямбда привели ко множеству аналогичных выводов и помогли установить лежащий в основе этого механизм. Многие из этих же принципов применимы и к эукариотическим клеткам. Однако невероятная сложность регуляции генов у высших организмов, наряду с упаковкой их ДНК в хроматин создает определенные проблемы и предоставляет некоторые совершенно новые возможности для регуляции, как мы увидим далее. Начнем с простейшего примера: включение и выключение генов у бактерий в ответ на единственный сигнал.
7.3.1. Триптофановый репрессор является простым генетическим переключателем, включающим и выключающим гены бактерий
Хромосома бактерии E. coli — одноклеточного организма, состоит из единственной кольцевой молекулы ДНК, насчитывающей 4,6 × 106 нуклеотидных пар. Эта ДНК кодирует примерно 4 300 белков, однако в конкретный момент времени в клетке синтезируется лишь часть этих белков. Экспрессия многих генов регулируется в соответствии с доступностью питательных веществ в среде, что показано на примере пяти генов E. coli, кодирующих ферменты, необходимые для синтеза аминокислоты триптофана. Эти гены организованы в один оперон (operon), то есть расположены рядом друг с другом и транскрибируются с одного промотора (promoter) как одна длинная молекула РНК (рис. 7.34). Однако если в питательной среде присутствует триптофан и он поступает в клетку (например, если бактерия находится в кишечнике млекопитающего, которое только что съело белковую пищу), то клетке больше не требуются эти ферменты — и их синтез выключается.
Молекулярные механизмы, лежащие в основе такого переключения, достаточно хорошо изучены. Как описано в главе 6, промотор является специфической последовательностью ДНК, которая направляет действия РНК-полимеразы на связывание с ДНК, разворачивание двойной спирали и начало синтеза молекулы РНК. Промотор, который направляет транскрипцию генов биосинтеза триптофана, содержит регуляторный элемент, называемый оператором (operator; см. рис. 7.34).