Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шмид Р. Наглядная биотехнология и генетическая инженерия..pdf
Скачиваний:
541
Добавлен:
30.05.2021
Размер:
9.07 Mб
Скачать

Тенденции развития

272

Протеомика

ВВЕДЕНИЕ. Термин «протеомика», предложенный

в1995 г., отражает неразрывную связь между геномом и белковым составом клетки. Считается, что у высших организмов из одного генного транскрипта

врезультате сплайсинга и посттрансляционных изменений образуется примерно 10 белков. Протеомика занимается изучением экспрессии, функции и взаимодействия генных продуктов на основе анализа генома (функциональная геномика).

МЕТОДЫ. Основным методом протеомики является выделение и анализ большого числа белков. Например, протеом Escherichia coli состоит из 4000 белков. Решающее значение имеет способ выделения белка: так, мембранные и растворимые белки выделяют по-разному. В случае эукариотических организмов обычно используют экстракты из клеток различных тканей: так доказывают связь белкового состава клетки с ее тканевой принадлежностью. Наибольшее распространение для изучения характера экспрессии белков получил метод двумерного электрофореза,

вкотором в одном направлении происходит разделение белков в соответствии с их изоэлектрической точкой, а во втором – в сооветствии с молекулярной массой. При правильно подобранном диапазоне рН разрешение метода может быть достаточно высоким. Полуколичественную оценку результатов разделения в двумерном электрофорезе на ПААГ получают после окрашивания белков и сканирования геля с помощью специальных компьютерных программ. Самая совершенная система позволяет анализировать несколько сотен гелей в неделю. Особенно сложные задачи протеомики: идентификация белков, образующихся в очень малых количествах (10–1000 копий на клетку), количественная оценка содержания таких белков, установление взаимосвязи между геном и белком, подвергнутым значительным модификациям. Один из путей количественной оценки содержания белка известной структуры – использование библиотек антител. Однако часто перед исследователем стоит задача идентификации белка с неизвестной структурой. Современные технологии позволяют определить N-концевую (неацилированную) последовательность белка, если в пробе содержится более 1 мг белка. На следующем этапе проводят сравнение полученной концевой последовательности аминокислот (а с учетом вырожденности генетического кода – и участка гена) с геномной библиотекой. Для анализа многих белков, экспрессирующихся в небольших количествах, лучше всего подходит метод масс-спек- трометрии. Масс-спектрометрия MALDI-TOF (matrixassisted laser-desorption-ionization-time-of-light) позволяет определить молекулярную массу исследуемого белка лишь приблизительно. Для более точной информации о размере белка пробу в двумерном

электирофорезе на ПААГ обрабатывают трипсином и определяют массы полученных фрагментов белка. Сравнение полученных таким образом результатов с компьютерными данными по «виртуальной» обработке трипсином белков из библиотеки позволяет сделать выводы о молекулярной массе исследуемого белка. Очевидно, что такой метод можно использовать только в том случае, если геном организма, из которого выделен белок, полностью секвенирован и протеом достаточно хорошо охарактеризован. Если же подробная информация о структуре генома не доступна, используют масс-спектрометрию ESI-TOF (electrospray- time-of-light). Для этого создаются белковые маркеры PTS (protein sequence tags), помогающие идентифицировать неизученный белок с помощью белковых библиотек. Метод позволяет идентифицировать белок при содержании нескольких сотен фемтомолей, следовательно, надо чтобы он синтезировался в клетке в количестве сотен тысяч копий.

ПРИМЕНЕНИЕ. Методы протеомики позволяют изучать специфические для клетки или индуцированные внешними воздействиями изменения в характере экспрессии белков, например: 1) различия в экспрессии генов Escherichia coli при росте на глюкозе или на молочной кислоте; 2) экспрессия генов в β-клетках поджелудочной железы у здоровых людей и у больных диабетом; 3) токсическое действие лекарственных препаратов на экспрессию генов, например, в клетках печени. Таким способом часто удается найти «белковые маркеры» определенных заболеваний. Методы протеомики позволяют выяснить функцию белка в клетке. Для этого создаются протеомные карты клеток и моделируются «клеточные фабрики», учитывающие сложные взаимосвязи между белковыми комплексами. Для изучения функции белка в клетке полезным оказывается мечение с помощью tag-последовательности, которая позволяет проводить аффинную очистку белка для масс-спект- рометрии и окончательной идентификации.

Один геном – различные протеомы

 

 

 

 

Геномная библиотека

Геном

 

 

 

Библиотека мРНК

Протеом 1

Протеом 2

Протеом 3

Протеом 4

 

Протеомная библиотека

 

 

 

 

Белковая библиотека

 

Анализ белка

 

 

• Определение N-концевых

• Масс-спектрометрия

 

аминокислот

 

• Посттрансляционные

 

• Аминокислотный состав

модификации

 

Литературные,

• Расщепление

 

• Иммуноанализ (вестерн-блот,

биологические,

протеиназами

 

белковые микрочипы)

медицинские данные

 

 

 

 

Высший организм с 30 000 генов содержит вплоть до 1 000 000 белков,

 

 

уровень экспрессии которых зависит от типа клеток (10 000 белков на каждый тип клеток)

 

Методы протеомного анализа

 

 

 

 

 

Приготовление пробы

 

Электроблоттинг

Разделение белков

Обработка

 

 

 

 

трипсином в геле

 

 

 

Интактные белки

 

Пептидные фрагменты

Анализ нуклео-

 

Без

Разделение

 

разделения

методами

тидной последо-

 

 

 

ЖХ* и КЭ**

вательности

 

 

 

 

 

Анализ амино-

 

 

Анализ нук-

кислотной пос-

Методы масс-спектрометрии:

 

леотидной

ледовательности

 

последова-

 

MALDI-TOF, ESI-TOF и др.

 

тельности

 

Банки данных ДНК и белков

 

* ЖХ – жидкостная хроматография. ** КЭ – капиллярный электрофорез.

 

Двумерный электрофорез белков

Применение

 

пекарских дрожжей

 

 

Обмен веществ

100 кДа

 

 

 

 

Взаимо-

 

 

 

масса

 

 

действия

 

Лекарства

Температура

 

 

Молекулярная

 

 

 

Химикаты

Стресс

 

 

 

 

 

 

 

 

Взаимо-

 

 

 

действие

 

 

 

с другими

6 кДа

 

 

клеткам

 

 

Экспрессия, специфическая

 

 

Геном

Изоэлектрическая точка

для данного типа клеток

 

273

 

 

 

Тенденции развития

Биоинформатика*

ВВЕДЕНИЕ. Стремительное развитие молекулярной

(по состоянию на конец 2005 г.). За год количество

биологии в последние десятилетия было бы невоз-

проанализированных структур увеличивается пример-

можно без прогресса компьютерных и телекоммуни-

но на 4000. Данные собраны в крупнейших банках

кационных технологий, позволяющих сохранять, упо-

белковых структур: PDB (Protein Data Bank) и Swiss-

рядочивать и проводить сравнение огромных объемов

Prot. Интернет позволяет сравнивать любую получен-

информации. Интернет, созданный в 1970 г. для уз-

ную последовательность ДНК или аминокислот с уже

ких научных целей, за последние годы стал «мировой

имеющимися последовательностями в банке данных.

сетью», насчитывающей более 40 млн сайтов и более

Если уровень гомологии между полученной последо-

100 млн пользователей по всему миру (эти числа уд-

вательностью и последовательностью из банка дан-

ваиваются каждый год). Интернет сделал возможным

ных превышает 30%, можно построить модель про-

обмен научными данными, что способствует большей

странственной организации изучаемого пептида.

продуктивности научной работы. Под термином «био-

Банки белковых структур (SCOP, CATH) содержат

информатика» принято понимать совокупность ин-

информацию об «архитектурных типах» белков. Нес-

формации о структуре ДНК и белков (геномы и проте-

мотря на то что теоретическое число аминокислотных

омы), расширяющуюся до представления о полных

последовательностей в белках очень большое (напри-

геномах и протеомах организмов и их функции.

мер, из 300 аминокислот можно составить 20300 бел-

ИНФОРМАЦИЯ О НУКЛЕОТИДНЫХ ПОСЛЕДОВАТЕЛЬ-

ков), в природе белков не так много. Вторичная бел-

НОСТЯХ ГЕНОМОВ. Широкое распространение мето-

ковая структура (α-спирали и β-слои) накладывает

дов секвенирования ДНК и высокая скорость анализа

определенные структурные ограничения, создавая и

привели к тому, что объемы информации в междуна-

организуя белковую молекулу по модульному типу,

родных банках данных ДНК каждые два года увеличи-

поэтому число вариантов из вышеуказанного числа

ваются более чем в 10 раз. Если в 1998 г. объем ми-

аминокислот уменьшается и составляет около 1500.

ровых банков ДНК составлял 2 млрд оснований, то в

В рамках структурной геномики изучаются возможно-

2004 г. эта цифра превысила 45 млрд. Благодаря

сти предсказания пространственной структуры белков

осуществлению большого числа проектов по анализу

на основе данных геномного анализа.

геномов, количество информации растет очень быст-

ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ. Для многих подробно

рыми темпами. Вся полученная к настоящему момен-

изученных белков, таких как ацетилхолинэстераза,

ту информация о структуре генов объединена в трех

протеиназы, белки ионных каналов, рецепторы и им-

«центральных» банках данных, созданных в США, Япо-

муномодуляторы, использование баз данных из ин-

нии и Англии. Использование интернета позволяет

тернета позволяет сравнивать структуру и функцию

исследователю сравнивать результаты секвенирова-

белков из разных организмов, а также проводить

ния с уже имеющимися в банках ДНК последова-

анализ гомологий. Конечной целью таких исследова-

тельностями с целью выявления гомологии или

ний является создание общей картины обмена

идентичности. Самые большие банки информации о

веществ в организме на основе информации о его от-

структуре белков – PIR (Protein Information Re-

дельных этапах (электронтранспортная цепь, глико-

source) в Вашингтоне и банк данных SwissProt; они

лиз и др.).

содержат информацию о 300 000 и 200 000 белках

 

соответственно (на конец 2004 г.).

 

СТРУКТУРНАЯ ИНФОРМАЦИЯ. По сравнению с секве-

 

нированием геномов темпы получения информации о

 

структуре белков не такие впечатляющие. Это связано

 

с весьма трудоемкой процедурой определения струк-

 

туры белка: получение кристалла и рентгеноструктур-

 

ный анализ комплекса белка с металлом – техниче-

 

ски очень сложные задачи; особые затруднения

 

вызывает анализ крупных белковых комплексов или

 

мембранных белков. Двумерный ЯМР-анализ позво-

 

ляет определить структуру только растворимых бел-

 

ков размером ~30 кДа, однако, несмотря на строгие

 

ограничения, этим методом получена информация

 

о пространственной структуре более 32 000 белков

 

* Леск А. Введение в биоинформатику / А. Леск; пер. с англ. – М.: БИНОМ. Лаборатория знаний, 2009. – 318 с.: ил., 274 [4] с цв. вкл.

Объем банков белковых структур

 

 

 

 

35

 

 

 

 

 

 

 

 

 

 

 

 

Тысячи

30

 

 

 

 

 

 

 

 

 

 

 

оснований

25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

Млрд

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

2000

2002

 

 

1980

1982

1984

1986

1988

1990

1992

1994

1996

1998

2004

Центры биоинформатики

 

 

 

 

 

 

Объем банков ДНК

 

 

 

 

 

 

 

 

45

 

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

35

 

 

 

 

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

 

 

 

 

25

 

 

 

 

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

2000

2002

 

1980

1982

1984

1986

1988

1990

1992

1994

1996

1998

2004

Банки нуклеотидных последовательностей ДНК

• GenBank, Washington D.C., USA

• European Bioinformatics Institute, Hinxton, UK

• DNA Data Bank of Japan, Mishima, Japan

Банки структурной информации для белков

• ProteinDatabank PDB, USA

• UniProtKB/SwissProt, UK

Геномные банки данных

• Sanger Center, Hinxton, UK

• NCBI, Bethesda, USA

• TIGR (The Institute of Genomic Research),

Gaithersburg, USA

Интернет-ресурсы по биоинформатике

 

 

ДНК

GenBank

~45 млрд п.н.

www.ncbi.nlm.nih.gov/Genbank/index.html

EMBL Database

(конец 2004 г.)

www.ebi.ac.uk/embl/index.html

DNA-Database of Japan

 

www.ddbj.nig.ac.jp

(3 mirror sites)

 

 

 

Геномы

 

Sanger Center

Геном человека, геном мыши и др.

www.sanger.ac.uk

 

 

 

National Center

Геном человека, геном мыши и др.

www.ncbi.nlm.nih.gov

for Biotechnology

 

 

Information (NCBI)

 

 

 

 

 

TIGR (Институт геномных

221 полный геном

www.tigr.org

исследований)

(середина 2005 г.)

 

 

 

 

 

 

Структурные данные

 

 

 

 

Protein DataBase

~32 000 белковых структур

www.pdb.bnl.gov

 

 

(середина 2005 г.)

 

 

 

 

 

 

 

 

 

 

UniProt/SwissProt

~200 000 белковых структур и амино-

www.ebi.ac.uk/swissprot

 

 

кислотных последовательностей

 

 

 

 

 

(середина 2005 г.), аннотированные

 

 

 

 

 

последовательности белков человека

 

 

275