компонентов. Приведенная здесь структура основана на той, что была найдена в контролирующей области гена, кодирующегосубъединицуT-клеточногорепрессора(опи- санвглаве25),ионаактивируеттранскрипциюсоседнего промотора.Толькоопределенныеклеткиразвивающейся иммуннойсистемы,которыевитогедадутначалозрелым
Обычно несколько относительно коротких участков нуклеотидной последовательности направляют сборку группы регуляторных белков на ДНК (см. рис. 7.51). Однако в некоторых крайних случаях, когда регуляция производится «комитетом» белков, образуется более изощренная структура белок–ДНК (рис. 7.52). Поскольку для окончательной сборки требуется наличие множества регуляторных белков, которые связываются с ДНК, то это является простым способом, гарантирующим, что ген экспрессируется только тогда, когда клетка содержит правильную комбинацию этих белков. Ранее мы наблюдали, как образование гетеродимеров в растворе обеспечивает механизм для комбинаторного контроля экспрессии генов. Сборка комплексов регуляторных белков на ДНК является вторым важным механизмом комбинаторного контроля, механизмом, открывающим гораздо большие возможности.
7.3.13. Сложные генетические переключатели, регулирующие развитие дрозофилы, построены из более мелких модулей
В условиях, когда регуляторные белки могут располагаться на множестве участков вдоль длинных отрезков ДНК и на каждом из них собираться в комплексы, когда эти комплексы оказывают влияние на структуру хроматина, так же как и на привлечение и сборку основного аппарата транскрипции на промоторе, казалось бы, должны существовать практически бесконечные возможности для развития контролирующих устройств, которые бы регулировали транскрипцию эукариотических генов.
Чрезвычайно поразительным примером сложного многокомпонентного генетического переключателя является механизм, контролирующий транскрипцию гена Even-skipped(Eve) дрозофилы, экспрессия которого играет важную роль в развитии зародыша дрозофилы. Если этот ген инактивируется мутацией, то многие части зародыша не формируются и зародыш рано погибает. В главе 22 описывается, что на той стадии эмбрионального развития, когда начинается экспрессия гена Eve, зародыш представляет собой единственную гигантскую клетку, содержащую множество ядер в общей цитоплазме. Эта цитоплазма, однако, не однообразна — она содержит смесь регуляторных белков, которые неравномерно распределены вдоль зародыша, отражая таким образом позиционную информацию, которая отличает одну часть эмбриона от другой (рис. 7.53). (Способ, который используют поначалу для установления этих различий, описан в главе 22.) Сначала ядра идентичны, но под действием различных регуляторных белков они начинают быстро экспрессировать разные гены. Например, ядра на переднем конце развивающегося эмбриона под-
вергаются действию набора регуляторных белков, отличающегося от того, который влияет на ядра в заднем конце эмбриона.
Регуляторные последовательности ДНК, контролирующие ген Eve, приспособлены к считыванию информации о концентрации регуляторных белков в каждой точке вдоль оси эмбриона и интерпретируют эту информацию таким образом, что ген Eve экспрессируется в виде семи регулярных полос. Ширина каждой полосы первоначально составляет от пяти до шести ядер, и расположены полосы точно вдоль переднезадней оси эмбриона (рис. 7.54). Как осуществляется этот выдающийся подвиг обработки информации? Еще не все молекулярные детали этого процесса поняты, но, исходя из исследований гена Eve и других генов дрозофилы, регулируемых сходным образом, уже сформулировано несколько основных принципов.
Рис. 7.54. Семь регулярных полос белка, кодируемого геном Even-skipped(Eve), в развивающемся эмбрионедрозофилы.Спустядвасполовинойчасапослеоплодотворенияяйцеклеткузафиксировали и окрасили антителами, которые распознают белок Eve (зеленый), и антителами, которые распознают белокGiant(красный).Окраскаимеетжелтыйцветвтехместах,гдесодержатсяобабелка.Наэтойстадии эмбриональногоразвитияяйцеклеткасодержитпримерно4 000ядер.ОбабелкаEveиGiantнаходятся в ядрах, и ширина полос белка Eve составляет примерно четыре ядра. На рис. 7.52/7.53 также показан профильокрашиваниябелкаGiant.(СлюбезногоразрешенияMichaelLevine.)
690 Часть 2. Основные генетические механизмы
Регуляторная область гена Eve очень большая (примерно 20 000 нуклеотидных пар) и образована из серии относительно простых регуляторных модулей, каждый из которых содержит множество регуляторных последовательностей и определяет местоположение конкретной полосы экспрессии гена Eve на оси эмбриона. Эту модульную организацию контролирующей области гена Eve выявляют в опытах, в ходе которых определенный регуляторный модуль (скажем, определяющий полосу 2) удаляют со своего нормального места слева от гена Eve и помещают перед репортерным геном (см. рис. 7.45), а затем вновь вводят в геном дрозофилы. При исследовании развивающихся эмбрионов, полученных от мух, несущих эту генетическую конструкцию, показано, что репортерный ген экспрессируется точно на месте полосы 2 (рис. 7.55). В ходе подобных экспериментов выявляют существование
Рис.7.55.Опыты,показывающиемодульнуюорганизациюрегуляторнойобластигенаEve.а)Фрагмент регуляторнойобластигенаEveразмером480нуклеотидныхпарудалилиивставилислеваотконтрольного промотора,которыйуправляетсинтезомферментаβ-галактозидазы(продуктгенаLacZE.coli).б)Когда искусственную конструкцию вновь ввели в геном эмбрионов дрозофилы, эмбрионы экспрессировали β-галактозидазу(определяютгистохимическимокрашиванием)точнонаместевторойизсемирегулярныхполосгенаEve(в).(бив—слюбезногоразрешенияStephenSmallиMichaelLevine.)
Глава 7. Контроль генной экспрессии 691
других регуляторных модулей, каждый из которых определяет или любую из шести других полос, или некоторую другую часть картины экспрессии гена Eve, в норме проявляющуюся на поздних стадиях развития (см. рис. 22.39).
7.3.14. Ген Eve дрозофилы регулируется механизмами комбинаторного контроля
Подробное изучение регуляторного модуля полосы 2 дало некоторое понимание того, как происходит считывание и интерпретация позиционной информации. Он содержит последовательности, распознаваемые двумя регуляторными белками (Bicoid и Hunchback), которые активируют транскрипцию Eve, и двумя белками (Krüppel и Giant), которые ее подавляют (рис. 7.56). (Регуляторные белки дрозофилы часто имеют колоритные имена, отражающие фенотип, получающийся в результате инактивации гена, кодирующего белок, из-за мутации.) Относительные концентрации этих четырех белков определяют, будут ли белковые комплексы, образующиеся в полосе 2, активировать транскрипцию гена Eve. На рис. 7.57 показано распределение четырех регуляторных белков вдоль области зародыша дрозофилы, где образуется полоса 2. Считается, что любой из двух репрессорных белков, если он связан с ДНК, будет выключать модуль полосы 2, тогда как для его максимальной активации должны связаться оба белка: Bicoid и Hunchback. Таким образом, эта простая регуляторная единица сочетает четыре позиционных сигнала так, что включает модуль полосы 2, а следовательно, и экспрессию гена
СегментконтролирующейобластигенаEve,идентифицированный,какпоказанонапредыдущемрисунке,содержитрегуляторныепоследовательности,каждаяизкоторыхсвязываеттотилиинойизчетырех регуляторных белков. Из генетических экспериментов стало известно, что эти четыре регуляторных белка отвечают за правильную экспрессию гена Eve в полосе 2. Например, дрозофилы, дефицитные по двум активаторам, Bicoid и Hunchback, не могут эффективно экспрессировать Eve в полосе 2. У мух с дефицитом по любому из двух репрессоров гена, Giant и Krüppel, полоса 2 расширяется и занимает аномально широкую область эмбриона. Участки связывания с ДНК для этих регуляторных белков идентифицированы следующим образом: клонировали гены, кодирующие эти белки, и проводили их сверхэкспрессию в клетках E. coli, затем белки очищали и проводили футпринтинг ДНК (см. рис. 7.29). На верхней диаграмме показано, что в некоторых случаях участки связывания регуляторных белков перекрываютсяибелкимогутконкурироватьзасвязываниесДНК.Например,считается,чтосвязывание KrüppelисвязываниеBicoidскрайнимправымучастком—взаимоисключающиепроцессы.
Сам ген Eve кодирует регуляторный белок, который, после того как профиль экспрессии из семи регулярныхполосустановится,регулируетэкспрессиюдругихгеновдрозофилы.Помереразвитияэмбрион, соответственно, подразделяется на все более и более тонкие сегменты, которые в итоге дадут начало различнымчастямвзрослойособи,какописановглаве22.
Этот пример с эмбрионами дрозофилы является необычным в том плане, что ядра непосредственно подвергаютсявоздействиюпозиционныхсигналовввидеконцентрацийрегуляторныхбелков.Вэмбрионахбольшинствадругихорганизмовотдельныеядранаходятсявразделенныхклеткахивнеклеточная позиционная информация, чтобы повлиять на геном, должна поступать или через плазматическую мембрану,или,чащевсего,создаватьсигналывцитозоле.
Eve, только в тех ядрах, которые расположены в местах, где наблюдаются высокие уровни белков Bicoid и Hunchback, а Krüppel и Giant отсутствуют. Такое сочетание активаторов и репрессоров встречается только в одной области раннего эмбриона, во всех других местах, следовательно, модуль полосы 2 неактивен.
Мы уже обсудили два механизма комбинаторного контроля экспрессии генов: гетеродимеризацию регуляторных белков в растворе (см. рис. 7.20) и сборку комбинаций регуляторных белков в небольшие комплексы на ДНК (см. рис. 7.51). Вероятно, что оба механизма принимают участие в сложной регуляции экспрессии гена Eve. Кроме того, только что описанная регуляция полосы 2 является примером третьего типа комбинаторного контроля. Поскольку отдельные регуляторные последовательности в модуле полосы 2 гена Eve растянуты вдоль ДНК, многие наборы регуляторных белков могут одновременно связываться на разных участках и воздействовать на промотор гена. Промотор объединяет транскрипционные сигналы, посылаемые всеми связанными белками (рис. 7.58).
циютранскрипциинапромоторе,многочисленныенаборырегуляторныхбелковмогутработатьсообща, как они это делают в модуле полосы 2 гена Eve, приведенном на рис. 7.56. Пока остается неясным то, как в клетке достигается интеграция множества входящих сигналов, но, скорее всего, конечная транскрипционнаяактивностьгенаявляетсярезультатомконкуренциимеждуактиваторамиирепрессорами, которыедействуютсогласномеханизмам,обобщеннымнарис.7.46и7.50.
Регуляция экспрессии гена Eve является ярким примером комбинаторного контроля. Семь комбинаций регуляторных белков (одна комбинация для каждой полосы) активируют экспрессию гена Eve, а множество других комбинаций (все они были обнаружены в областях между полосами) не дают проявляться элементам полос. Предполагается, что другие регуляторные модули полос построены схожим образом с описанными для полосы 2 и приспособлены для считывания позиционной информации, поступающей от других комбинаций регуляторных белков. Вся контролирующая область гена Eve, протянувшаяся на 20 000 нуклеотидных пар ДНК, связывает свыше 20 различных регуляторных белков. Большая и сложная контролирующая область, таким образом, построена из серии небольших модулей, каждый из которых состоит из уникальной композиции коротких последовательностей ДНК, распознаваемых специфическими регуляторными белками.
7.3.15. У млекопитающих сложные контролирующие области генов тоже построены из простых регуляторных модулей
Вероятно, 8 % кодирующей способности генома млекопитающих отдано синтезу белков, которые служат регуляторами транскрипции генов. Такое большое число генов отражает крайне сложную сеть контролирующих устройств, управляющих экспрессией генов млекопитающих. Каждый ген регулируется набором регуляторных белков, каждый из этих белков является продуктом гена, который, в свою очередь, регулируется целым набором других белков и т.д. Кроме того, молекулы регуляторных белков сами подвергаются воздействию сигналов, поступающих извне, которые могут активировать или инактивировать их множеством различных способов (рис. 7.59). Таким образом, профиль экспрессии генов в клетке можно рассматривать как результат сложных молекулярных вычислений, которые внутриклеточная сеть контроля генов производит в ответ на информацию, поступающую
а)Белоксинтезируетсялишьвслучаенеобходимостиибыстрораспадаетсяприпротеолизе—такчто его накопления не происходит. б) Активация при связывании с лигандом. в) Активация посредством ковалентной модификации. Здесь показано фосфорилирование, но возможно множество других модификаций (см. табл. 3.3, стр. 284). г) Образование комплекса между ДНК-связывающим белком и другим белком, несущим домен, активирующий транскрипцию. д) Демаскировка активирующего домена при фосфорилировании ингибирующего белка. е) Стимулирование транспорта в ядро при удалении ингибирующего белка, который, в противном случае, не дает регуляторному белку попасть в ядро. ж) Высвобождение регуляторного белка из мембранного бислоя при помощи регулируемого протеолиза.
из окружения клетки. Мы обсудим эти проблемы позднее в главах 15 и 22, которые посвящены клеточной сигнализации и развитию организма, но сложность проблемы уже заметна даже на уровне отдельного генетического переключателя, регулирующего активность одного гена. Например, вполне обычным считается обнаружение гена млекопитающего с контролирующей областью длиной в 100 000 нуклеотидных пар, в которой множество модулей (каждый модуль содержит ряд регуляторных последовательностей, связывающихся с регуляторными белками) перемежается длинными отрезками иной некодирующей ДНК.
Один из самых хорошо изученных примеров сложной регуляторной области млекопитающих обнаружен у человека в гене β-глобина, который экспрессируется исключительно в эритроцитах. Экспрессию этого гена контролирует сложный
Глава 7. Контроль генной экспрессии 695
набор регуляторных белков, одни из которых действуют как активаторы, другие как репрессоры (рис. 7.60). Концентрации (или активности) множества этих регуляторных белков изменяются в ходе развития организма, и только особая комбинация всех белков запускает транскрипцию гена. Ген β-глобина человека является частью кластера глобиновых генов (рис. 7.61, а), которые транскрибируются исключительно в клетках эритроидного ряда, то есть в клетках линии дифференцировки эритроцитов, но на различных стадиях развития млекопитающего (см. рис. 7.61, б). Ген ε-глобина экспрессируется на ранних стадиях эмбрионального развития, γ-глобин — в поздний эмбриональный период и у плода, а δ и β — преимущественно во взрослом организме. Продукты генов немного различаются по кислородсвязывающим свойствам, соответствующим разным условиям оксигенации в эмбрионе, плоде и взрослом организме. Каждый из глобиновых генов обладает своим набором регуляторных белков, необходимых для включения этого гена в нужное время.
Глобиновые гены считаются необычными по той причине, что в соответствующее время и соответствующем месте они транскрибируются с чрезвычайно высокой интенсивностью. В самом деле, эритроциты представляют собой нечто большее, чем просто мешки гемоглобина, синтезированные клетками-предшественниками. Для достижения такого невероятно высокого уровня транскрипции глобиновые гены, кроме того что имеют свои индивидуальные регуляторные последовательности, разделяют еще контролирующую область, называемую локус-контролирующей областью (LCR; locus control region), которая расположена намного левее кластера генов и необходима для правильной экспрессии каждого из них (см. рис. 7.61, а).
Рис.7.60.Модельконтролягенаβ-глобиначеловека.Надиаграммепоказанынекоторыеизрегулятор- ныхбелков,контролирующихэкспрессиюгенавходеразвитияэритроцитов(см.рис.7.61).Некоторые из показанных регуляторных белков, как CP1, обнаружены во многих видах клеток, тогда как другие, например,GATA1,присутствуюттольковнесколькихтипахклеток,включаяэритроциты,поэтомусчитается, что они вносят вклад в специфичную к типу клеток экспрессию гена β-глобина.Двойныестрелки обозначают, что несколько участков связывания GATA1 перекрывают участки связывания других регуляторныхбелков,ипредполагается,чтоприсоединениекэтимучасткамGATA1исключаетвозможность связыванияснимидругихбелков.ПослесвязываниясДНКрегуляторныебелкипривлекаюткпромотору комплексыперестройкихроматина,ферменты,модифицирующиегистоны,общиефакторытранскрип-
охватывающий100 000нуклеотидныхпар.Онсодержитпятьглобиновыхгеновилокус-контролирующую область (LCR). б) Изменение экспрессии β-подобных глобиновых генов на разных стадиях развития человека. Каждая из глобиновых цепей, кодируемых этими генами, для образования гемоглобина в эритроцитах соединяется с α-глобиновой цепью. (а — по F. Grosveld, G. B. van Assendelft, D. R. Greaves andG. Kollias,Cell51:975–985,1987.СразрешенияElsevier.)
Значимость LCR можно оценить на примере пациентов с определенной формой талассемии — тяжелой наследственной формы анемии. У этих пациентов происходит делеция в β-глобиновом локусе, в ходе которой удаляются вся или часть LCR. Сам ген β-глобина и его соседняя регуляторная область остаются неповрежденными, но ген транскрипционно неактивен, даже в эритроидных клетках.
Подробности способа функционирования LCR не выяснены, но известно, что регуляторные белки, которые связываются с LCR, взаимодействуют посредством петлеобразования ДНК с белками, связанными с контролирующими областями регулируемых ими глобиновых генов. Подобным образом белки, связанные на LCR, помогают привлекать комплексы перестройки хроматина, ферменты, модифицирующие гистоны, и компоненты аппарата транскрипции, которые действуют совместно со специфическими регуляторными областями каждого отдельного глобинового гена. Кроме того, LCR включает в себя барьерную последовательность (barrier sequence) (см. рис. 4.47), которая препятствует распространению соседнего гетерохроматина на β-глобиновый локус, как описано в главе 4. Эта двойная черта отличает глобиновый LCR от множества других регуляторных последовательностей в геноме человека; но глобиновые гены не единственные LCR-содержащие гены, так как локус-контролирующие области также есть у других интенсивно транскрибируемых клеточно-специфичных генов. Скорее, LCR следует рассматривать не как уникальные элементы ДНК со специализированными свойствами, а как чрезвычайно мощные комбинации более фундаментальных видов регуляторных последовательностей.
Глава 7. Контроль генной экспрессии 697
7.3.16. Инсуляторы — это последовательности ДНК, препятствующие влиянию эукариотических регуляторных белков на отдаленные гены
У всех генов есть контролирующие области, которые диктуют, в какое время, при каких условиях и в какой ткани будет экспрессироваться ген. Также мы уже выяснили, что регуляторные белки могут действовать через очень протяженные отрезки ДНК. Тогда возникает вопрос: как контролирующие области различных генов не мешают друг другу? Другими словами, что не позволяет регуляторному белку, связанному на контролирующей области одного гена, внести неурядицу в транскрипцию соседних генов?
Для того чтобы избежать такого взаимовлияния, функционируют несколько типов элементов ДНК, разграничивающих геном на отдельные регуляторные домены. В главе 4 были описаны барьерные последовательности, которые препятствуют распространению гетерохроматина на гены, которые нужно экспрессировать. Второй тип элементов ДНК, называемых «инсуляторами», не дает энхансерам выйти из-под контроля и активировать неверные гены (рис. 7.62). Инсулятор, очевидно, может блокировать связь между энхансером и промотором, но для этого он должен находиться между ними. Идентифицированы белки, которые связываются с инсуляторами, но то, как они направленно нейтрализуют действие энхансеров, до сих пор остается тайной.
Несмотря на отсутствие подробной информации о механизмах их действия, считается, что места расположения инсуляторов и барьерных последовательностей в геноме расчленяют его на независимые домены, регулирующие гены и обладающие определенной структурой хроматина (рис. 7.63). Характерные черты этой организации могут быть наглядно показаны при помощи окрашивания целых хромосом специализированными белками, связывающими эти элементы ДНК.
Хотя хромосомы организованы в упорядоченные домены, которые препятствуют неразборчивому действию энхансеров, обнаружено, что существуют особые условия, при которых энхансер, расположенный на одной хромосоме, активирует ген, расположенный на второй хромосоме. Поразительный пример — регуляция обонятельных рецепторов млекопитающих. Обонятельные рецепторы представляют собой белки, экспрессируемые чувствительными нейронами, которые позволяют
Рис. 7.62. Схематическая диаграмма, суммирующая свойства инсуляторов и барьерных последо-
вательностей. Инсуляторы направленно блокируют действие энхансеров (слева), барьерные последовательности препятствуют распространению гетерохроматина (справа). Таким образом, регуляция генаBпроисходитдолжнымобразом,причеминсуляторгенаВнедопускаеттранскрипциигенаAпод влиянием энхансера гена B. Вероятный механизм функционирования барьерной последовательности представленнарис.4.47.Досихпоростаетсянеизвестным,какинсуляторыреализуютсвоевоздействие. Один из возможных вариантов — служить «приманками», которые связывают аппарат транскрипции и не позволяют ему взаимодействовать с аутентичным энхансером. Другое предположение состоит в том, что инсуляторы «заякоривают» ДНК в ядерной оболочке, таким образом мешая образованию петельДНКмеждуэнхансероми«неего»промотором.