638 Часть 2. Основные генетические механизмы
Рис.7.3.РазличиявкартинахэкспрессиимРНКсредиразныхтиповраковыхклетокчеловека.Нарисунке обобщеноченьбольшойнаборизмерений,входекоторыхопределялисьуровнимРНК1800выбранных генов(располагаютсясверхувниз)у142различныхлинийраковыхклетокчеловека(располагаютсяслева направо),каждая—отразногопациента.Каждаянебольшаякраснаяполосаобозначает,чтоданныйген уданнойопухолитранскрибируетсянауровне,значительнопревышающемсреднийвовсехклеточных линиях.Каждаянебольшаязеленаяполосауказываетнауровеньэкспрессиинижесреднего,акаждая чернаяполосаотмечаетуровеньэкспрессии,близкийксреднемузначениюсредиразличныхопухолей. Метод,использованныйдляполученияэтихданных(выделениемРНКспоследующейгибридизациейс ДНК-чипами),описанвглаве8(разд.8.3.4).Обратитевнимание,чтоотносительныеуровниэкспрессии каждого из 1 800 проанализированных генов отличаются у разных опухолей (это видно, если проследить по рисунку за определенным геном слева направо). Этот анализ также показал, что каждый тип опухоли обладает своей характерной картиной экспрессии генов. Подобная информация может быть использована для «типирования» раковых клеток неизвестного происхождения путем сравнения их профилей экспрессии генов с профилями экспрессии уже известных опухолей. Например, на рисунке неизвестныйобразецбылидентифицированкакраклегких.(ЛюбезнопредоставленоPatrickO. Brown, DavidBotstein,andtheStanfordExpressionCollaboration.)
Глава 7. Контроль генной экспрессии 639
Рис. 7.4. Различия двух тканей человека по спектру экспрессируемых белков. На каждой из сторон ри-
сункабелкипредставленыввидерезультатовдвумерногоэлектрофорезавполиакриламидномгеле(см. стр. разд. 8.3.4). Белки разделены по молекулярной массе (сверху вниз) и по изоэлектрической точке — значениюpH,прикоторомбелокнезаряжен(справаналево).Белковыепятна,искусственноокрашенные красным,встречаютсяуобоихобразцов,голубыеявляютсяспецифичнымидляоднойиздвухтканей.Различиямеждудвумяобразцамитканейзначительно«перевешивают»ихсходство:дажебелки,общиедля обеихтканей,какправило,различаютсяпоотносительномусодержанию.Обратитевнимание,чтоданный методпозволяетразделитьбелкипоразмеруипозаряду,следовательно,белок,который,например,имеет несколькоразличныхфосфорилированныхформ,будетпредставленввидесериигоризонтальныхпятен (см. верхний правый участок правой половины). Показана только малая часть полного спектра белков для каждого из образцов. Хотя двумерный электрофорез в полиакриламидном геле является простым способом наглядной демонстрации различий между двумя образцами белков, методы, основанные на масс-спектроскопии(см.разд.8.3.3),даютнамногоболеедетальнуюинформациюипоэтомуиспользуются чаще.(СлюбезногоразрешенияTimMyersandLeighAnderson,LargeScaleBiologyCorporation.)
7.1.4. Экспрессия гена может регулироваться на множестве этапов пути от ДНК к РНК и белку
Если различия между клетками разных типов обусловлены тем, какие гены экспрессируются в них, тогда на каком уровне осуществляется контроль экспрессии генов? Согласно предыдущей главе существует множество этапов на пути, ведущем от ДНК к белку. Мы теперь знаем, что, в принципе, каждый из них может регулироваться. Таким образом, клетка может контролировать синтез своих белков путем: 1) контроля времени и частоты транскрипции данного гена (контроль на уровне транскрипции); 2) контроля сплайсинга и процессинга РНК-транскриптов (контроль на уровне про- цессинга РНК); 3) отбора зрелых мРНК, предназначенных для экспорта из ядра в цитозоль, и выбора места их размещения в цитозоле (контроль на уровне транспорта РНК и ее локализации); 4) отбора мРНК в цитоплазме для трансляции на рибосомах (контроль на уровне трансляции); 5) избирательной дестабилизации определенных молекул мРНК в цитоплазме (контроль на уровне деградации мРНК) или 6) селективной активации, инактивации, деградации или локализации специфических молекул белка после их синтеза (контроль на уровне активности белка) (рис. 7.5).
Для большинства генов наиболее важен контроль на уровне транскрипции. Это вполне логично, так как из всех возможных контрольных точек, представленных на рис. 7.5, только контроль на уровне транскрипции гарантирует, что клетка не будет синтезировать лишних промежуточных продуктов. В последующих разделах
640 Часть 2. Основные генетические механизмы
Рис. 7.5. Шесть уровней контроля экспрессии генов эукариот. Контроль, осуществляемый на уровнях 1–5,
рассматривается в данной главе. Шестой уровень — регуляция активности белка — по большей части осуществляетсяпутемковалентнойпосттрансляционноймодификации,включающейфосфорилирование,ацетилирование,атакжеубикитинирование(см.табл.3.3,стр.284),иобсуждаетсявомногихглавахэтойкниги.
рассматриваются компоненты ДНК и белков, которые выполняют эту функцию, регулируя инициацию транскрипции генов. В конце этой главы мы еще вернемся к множеству дополнительных способов регуляции генной экспрессии.
Заключение
ДНК генома клетки содержит в своей последовательности информацию, не- обходимую для создания тысяч различных молекул белков и РНК. В клетке обычно экспрессируется только часть генов, а возникновение в многоклеточном организме различных типов клеток обусловлено экспрессией разных наборов генов. Кроме того, клетки могут изменять картину экспрессируемых генов в ответ на из- менения в окружающей среде, например, в ответ на сигналы от других клеток. В принципе, все этапы экспрессии гена могут регулироваться, но для большинства генов самая важная точка контроля — это инициация транскрипции РНК.
7.2. ДНК-связывающие мотивы в белках, регулирующих экспрессию генов
Как клетка определяет, какой из тысячи ее генов транскрибировать? Как описано в главе 6, транскрипция каждого гена контролируется регуляторной областью ДНК, расположенной относительно недалеко от места, где начинается транскрипция. Некоторые регуляторные области достаточно просты и действуют как переключатели, запускаемые одним сигналом. Множество других имеют сложную структуру и похожи на крошечные микропроцессоры, отвечающие на разнообразные сигналы, которые они интерпретируют и обобщают для того, чтобы включить или выключить соседние гены. В независимости от того, сложная это или простая структура, эти переключающие устройства обнаружены во всех клетках и состоят из двух основных компонентов: 1) коротких участков ДНК определенной последовательности и 2) регуляторных белков (регулирующих экспрессию генов), которые распознают и связываются с этой ДНК.
Начнем наше обсуждение белков, регулирующих экспрессию генов, с описания того, как они были открыты.
Глава 7. Контроль генной экспрессии 641
7.2.1. Регуляторные белки были открыты при изучении генетики бактерий
Генетические исследования бактерий, проведенные в 1950-х годах, впервые доказали существование регуляторных белков (gene regulatory proteins; часто неточно называемых «факторами транскрипции»), которые включали или выключали специфические наборы генов. Один из этих регуляторов, репрессор лямбда, кодируется бактериальным вирусом — бактериофагом лямбда. Репрессор выключает вирусные гены, кодирующие белки, необходимые для новых вирусных частиц,
итаким образом позволяет вирусному геному оставаться молчаливым пассажиром бактериальной хромосомы, размножающимся вместе с бактерией при благоприятных условиях для ее роста (см. рис. 5.78). Репрессор фага лямбда был одним из первых описанных регуляторных белков и, как отмечается далее, остается одним из наиболее изученных. Другие регуляторные белки бактерий реагируют на условия питания, выключая гены, кодирующие специфический ряд ферментов метаболизма, когда они не нужны. Первым открытым бактериальным белком данного типа был lac-репрессор, который выключает синтез белков, ответственных за метаболизм лактозы, когда этого сахара нет в среде.
Первый шаг к пониманию регуляции генов состоял в выделении мутантных штаммов бактерий и бактериофага лямбда, не способных выключать специфические наборы генов. В то время предполагали, а позже доказали, что у большинства этих мутантов был дефицит белков, действующих как специфические репрессоры для этих наборов генов. Поскольку эти белки, как и большинство регуляторных белков, присутствуют в клетке в малых количествах, то их выделение было сложным итрудоемким делом. В конечном итоге эти белки были очищены путем фракционирования клеточных экстрактов. Было показано, что выделенные белки связываются со специфическими последовательностями ДНК, расположенными вблизи генов, которые они регулируют. Впоследствии при помощи сочетания классической генетики
иметодов изучения взаимодействий белок-ДНК, опи-
сываемых далее в этой главе, были определены точные последовательности ДНК, которые они распознают.
7.2.2. Белки могут считывать информацию с внешней стороны спирали ДНК
Как обсуждалось в главе 4, ДНК в хромосоме представляет собой очень длинную двойную спираль (рис. 7.6). Белки, регулирующие экспрессию генов, должны распознавать специфические нуклеотидные последовательности внутри этой структуры. Первоначально предполагалось, что этим белкам, возможно, потребуется прямой доступ к водородным связям между парами оснований внутри двойной спирали, чтобы отличить
Рис.7.6.ДвойнаяспиральДНК.ПространственнаямодельДНК,накоторойможновидетьбольшуюималуюбороздкинавнешнейстороне двойнойспирали.Цветаатомовследующие:углерод—синий,азот—го-
лубой,водород—белый,кислород—красный,фосфор—желтый.
642 Часть 2. Основные генетические механизмы
одну последовательность ДНК от другой. Однако сейчас уже ясно, что внешняя сторона двойной спирали сполна содержит информацию о последовательностях ДНК, которую могут узнавать регуляторные белки без необходимости раскрытия двойной спирали. Внешняя часть каждой пары оснований выставлена на поверхность двойной спирали, демонстрируя характерный рисунок доноров и акцепторов водородной связи и гидрофобных участков, который распознают белки в большой и малой бороздках (рис. 7.7). Однако только в большой бороздке эти комбинации заметно отличаются для каждого из четырех сочетаний нуклеотидных пар (рис. 7.8). По этой причине регуляторные белки, как будет видно далее, в основном образуют специфические контакты с большой бороздкой.
Рис. 7.7. Как различные пары оснований в ДНК могут быть распознаны по внешнему краю — без необходимости раскрытия двойной спирали. Представлены четыре возможные конфигурации пар оснований с потенциальными донорами водородной связи (обозначены голубым цветом), потенциальными акцепторами водородной связи (красные) и водородными связями собственно между парами оснований в виде серии коротких параллельных красных линий. Метильные группы, которые образуютгидрофобныевыступы,отмеченыжелтым,аатомыводорода,присоединенныекуглеродуи, следовательно,недоступныедляобразованияводородныхсвязей,—белым.(ИзC. BrandenandJ. Tooze, IntroductiontoProteinStructure,2nded.NewYork:GarlandPublishing,1999.)
Глава 7. Контроль генной экспрессии 643
Рис.7.8.КодраспознаванияДНК.Внешнийконтуркаждойпредставленнойздесьпарыоснований,если напрямую смотреть на большую или малую бороздку, содержит характерную комбинацию доноров иакцепторовводороднойсвязииметильныхгрупп.Вбольшойбороздкекаждоеизчетырехсочетаний нуклеотидныхпарсоздаетсвойуникальныйрисунокспецифическихчерт.Однаковмалойбороздкедля парG–CиC–Gрисунокодинаков,такжекакдляА–ТиТ–А.Цветовыеобозначениятеже,чтоинарис.7.7. (ИзC. BrandenandJ. Tooze,IntroductiontoProteinStructure,2nded.NewYork:GarlandPublishing,1999.)
7.2.3. Короткие последовательности ДНК являются основными компонентами генетических переключателей
Специфическая нуклеотидная последовательность может быть «прочитана»
вформе рисунка молекулярных особенностей на поверхности двойной спирали ДНК. Особые нуклеотидные последовательности, каждая обычно длиною меньше 20 нуклеотидных пар, действуют в качестве основных компонент генетических переключателей, будучи участками распознавания для связывания специфических регуляторных белков генов. Идентифицированы тысячи таких последовательностей ДНК, каждая узнается своим регуляторным белком (или набором родственных регуляторных белков). Некоторые из регуляторных белков, рассматриваемые
входе этой главы, перечислены в табл. 7.1 вместе с последовательностями ДНК, которые они распознают.
Теперь обратимся к самим регуляторным белкам, вторым главным компонентам генетических переключателей. Начнем со структурных особенностей, благодаря которым эти белки узнают короткие специфические последовательности, содержащиеся в намного более длинной двойной спирали ДНК.
7.2.4. Регуляторные белки генов содержат структурные мотивы, которые могут считывать последовательность ДНК
В биологии опознавание на молекулярном уровне главным образом основывается на точном соответствии между поверхностями двух молекул, и самые яркие примеры этого принципа обнаружены при исследовании регуляторных белков. Регуляторный белок узнает специфическую последовательность ДНК, так как поверхность белка обла-
644 Часть 2. Основные генетические механизмы
Таблица7.1.НекоторыерегуляторныебелкиираспознаваемыеимипоследовательностиДНК
|
НАЗВАНИЕ |
ПОСЛЕДОВАТЕЛЬНОСТЬ ДНК1 |
Бактерия |
Lac репрессор |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
CAP |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Лямбда репрессор |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дрожжи |
Gal4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Mata2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Gcn4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дрозофила |
Kruppel |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Bicoid |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Млекопитающие |
Sp1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Oct1 Pou домен |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
GATA1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
MyoD |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p53 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Примечание. Для удобства для каждого белка указана только одна последовательность распознавания, а не консенсусная последовательность (см. рис. 6.12).
дает значительной степенью комплементарности к специфическим чертам поверхности этой области двойной спирали. В большинстве случаев белок образует ряд контактов
сДНК, включая водородные и ионные связи, а также гидрофобные взаимодействия. Каждая отдельная связь сама по себе слаба, но вместе взятые примерно 20 связей, обычно образующихся в области контакта поверхностей белка и ДНК, обеспечивают высоко специфичное и весьма сильное взаимодействие (рис. 7.9). В действительности взаимодействия белок–ДНК включают в себя некоторые из самых прочных и наиболее специфических молекулярных взаимодействий, известных в биологии.
Каждый пример распознавания белком ДНК является уникальным по своим деталям, но рентгеноструктурный анализ и ЯМР-спектроскопия нескольких сотен регуляторных белков выявили, что многие из них содержат тот или иной мотив из небольшого набора структурных мотивов, связывающихся с ДНК. В таких мотивах в основном задействованы либо α-спирали, либо β-листы — для связывания
сбольшой бороздкой ДНК, которая, как отмечалось выше, содержит достаточно информации, чтобы отличить одну последовательность ДНК от любой другой. Соответствие между ДНК и регуляторными белками настолько точное, что даже
Глава 7. Контроль генной экспрессии 645
Рис. 7.9. Связывание регуляторного белка с большой бороздкой ДНК. Показан только один контакт.
ОбычнообластьвзаимодействияповерхностейбелкаиДНКсодержит10–20подобныхконтактов,вко- торых участвуют разные аминокислоты, каждая из которых вносит вклад в усиление взаимодействия белок–ДНК.
высказывалось предположение о том, что в ходе эволюции размеры основных структурных элементов нуклеиновых кислот и белков развивались вместе, чтобы эти молекулы могли взаимодействовать друг с другом по принципу «ключ-замок».
7.2.5. Мотив спираль-поворот-спираль — один из самых простых и самых распространенных ДНК-связывающих мотивов
Первым признанным ДНК-связывающим белковым мотивом стал мотив спираль-поворот-спираль (helix-turn-helix). Первоначально идентифицированный в бактериальных белках, этот мотив позже был обнаружен у многих сотен связывающихся с ДНК эукариотических и прокариотических белков. Он формируется из двух α-спиралей, связанных короткой выступающей цепочкой аминокислот, которая образует «поворот» (рис. 7.10). Две спирали находятся под фиксированным углом друг к другу, в основном благодаря взаимодействиям между ними. Спираль, расположенная ближе к карбоксильному концу, называется узнающей спиралью (recognition helix), потому что она соответствует по размерам и взаимодействует с большой бороздкой ДНК. Боковые цепи ее аминокислот, отличающиеся от белка к белку, играют важную роль в узнавании специфических последовательностей ДНК, с которыми связывается белок.
Вне области спираль-поворот-спираль структура разных белков, которые содержат этот мотив, может варьировать в широких пределах (рис. 7.11). Соответственно, каждый белок «представляет» мотив спираль-поворот-спираль молекуле ДНК своим уникальным способом, что, полагают, повышает универсальность мо-
646 Часть 2. Основные генетические механизмы
Рис. 7.10. Связывающийся с ДНК мотив спираль-поворот-спираль. Мотив изображен на (а), где каж-
дый белый кружок обозначает центральный углеродный атом в аминокислоте. C-концевая α-спираль (красная)называетсяузнающейспиралью,таккакучаствуетвсайт-специфическомраспознаванииДНК. Как показано на (б), спираль входит в большую бороздку ДНК, где она контактирует с внешней частью нуклеотидныхпароснований(см.такжерис.7.7).N-концеваяα-спираль(синяя)восновномвыполняет функциюструктурногокомпонента,которыйпомогаетправильнорасположитьузнающуюспираль.
Рис. 7.11. Некоторые ДНК-связывающие белки, содержащие мотив спираль-поворот-спираль. Все эти белки связываются с ДНК как димеры, в которых две копии узнающей спирали (красный цилиндр) отделеныдруготдругаровнонаодинвитокспиралиДНК(3,4нм).Другаяспиральмотиваспираль-виток- спираль выделена синим, как на рис. 7.10. Лямбда-репрессор и белок Cro контролируют экспрессию геновфагалямбда,атриптофановыйрепрессорибелок-активаторкатаболизма(CAP;cataboliteactivator protein)контролируютэкспрессиюрядагеновE.coli.
тива спираль-поворот-спираль благодаря возрастанию числа последовательностей ДНК, для распознавания которых можно использовать этот мотив. Кроме того, у большинства этих белков части полипептидной цепи, находящиеся вне домена спираль-поворот-спираль, также образуют немаловажные связи с ДНК, помогающие произвести тонкую настройку взаимодействия.
Группа белков, содержащих мотив спираль-поворот-спираль, представленная на рис. 7.11, демонстрирует характерную черту многих сайт-специфических белков, связывающихся с ДНК. Они связываются с последовательностями ДНК как
Глава 7. Контроль генной экспрессии 647
симметричные димеры, а сами последовательности ДНК состоят из двух очень схожих «полусайтов», которые также расположены симметрично (рис. 7.12). Такое расположение позволяет каждому белковому мономеру образовать практически идентичные наборы контактов и невероятно повысить связывающую способность: в первом приближении удвоение числа контактов удваивает свободную энергию взаимодействия и при этом возводит в квадрат константу сродства.
Рис. 7.12. Специфическая последовательность ДНК, узнаваемая белком Cro бактериофага лямбда.
Вэтойпоследовательностивыделенныезеленымнуклеотидырасположенысимметрично,чтопозволяет каждомумономерубелка,такжепоказанному зеленымцветом,распознавать каждую половину сайта ДНКодинаково.См.реальнуюструктурубелканарис.7.11.
7.2.6. Гомеодоменные белки составляют особый класс белков, содержащих мотив спираль-поворот-спираль
Вскоре после открытия первых регуляторных белков у бактерий генетические исследования плодовой мушки дрозофила привели к выделению и описанию важного класса генов, гомеозисных, или гомеотических, селекторных генов
(homeotic selector genes), которые, как дирижер в оркестре, играют ключевую роль в регулировании всеми звеньями развития мухи. Как обсуждается в главе 22, позже доказано их фундаментальное значение и в развитии высших животных. Мутации в этих генах могут вызывать превращение одной части тела мухи в другую, указывая на то, что белки, которые они кодируют, контролируют ключевые стадии развития организма.
Когда в 1980-х годах определили нуклеотидные последовательности нескольких гомеозисных селекторных генов, оказалось, что каждый из них кодирует практически идентичный участок из 60 аминокислот, который и характеризует этот класс белков и называется гомеодоменом (homeodomain). После определения трехмерной структуры гомеодомена обнаружили, что он содержит мотив спираль- поворот-спираль, родственный такому же мотиву у бактериальных регуляторных белков. Это явилось одним из первых признаков того, что принципы генной регуляции, установленные у бактерий, относятся также и к более высокоорганизованным организмам. Сейчас открыто свыше 60 гомеодоменных белков только у одной дрозофилы, и эти белки идентифицированы практически у всех изученных эукариотических организмов — от дрожжей до растений и человека.
Структура гомеодомена, связанного со специфической последовательностью ДНК, представлена на рис. 7.13. Мотив спираль-поворот-спираль регуляторных белков бактерий часто встроен в различные структурные контексты, тогда как тот же мотив в гомеодоменах всегда окружен одной и той же структурой (образующей остальную часть гомеодомена), что означает, что этот мотив всегда презентируется ДНК одним и тем же способом. Действительно, структурные исследования показали,