Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Lection02

.pdf
Скачиваний:
7
Добавлен:
21.05.2015
Размер:
1.02 Mб
Скачать

Лекция 2. Генетический код. Банки биологических данных

Генетический код

Таблица 1.

Кодон

ÀÊ

Кодон АК Кодон АК Кодон АК

UUU

F

CUU

L

AUU

I

GUU

V

UUC

F

CUC

L

AUC

I

GUC

V

UUA

L

CUA

L

AUA

I

GUA

V

UUG

L

CUG

L

AUG

M

GUG

V

UCU

S

CCU

P

ACU

T

GCU

A

UCC

S

CCC

P

ACC

T

GCC

A

UCA

S

CCA

P

ACA

T

GCA

A

UCG

S

CCG

P

ACG

T

GCG

A

UAU

Y

CAU

H

AAU

N

GAU

D

UAC

Y

CAC

H

AAC

N

GAC

D

Лекция 2. Генетический код. Банки биологических данных

Генетический код

 

 

 

 

Таблица 1. (продолжение)

Кодон

ÀÊ

Кодон АК Кодон АК Кодон АК

UAA

Stop

CAA

Q

AAA

K

GAA

E

UAG

Stop

CAG

Q

AAG

K

GAG

E

UGU

C

CGU

R

AGU

S

GGU

G

UGC

C

CGC

R

AGC

S

GGC

G

UGA

Stop

CGA

R

AGA

R

GGA

G

UGG

W

CGG

R

AGG

R

GGG

G

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

В 1957 году Макс Перутц и Джон Кендрю получили первую детальную трехмерную структуру белка миоглобина. Тогда это был титанический труд, ведь в докомпьютерную эру все вычисления производились руками аспирантов. Объем информации был колоссальным - ведь в моделях хранятся координаты каждого атома! Именно поэтому первыми биологическими базами были базы трехмерных структур, работать с ними "на бумаге"было очень и очень сложно.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Другой огромный объем информации появился в результате совершенствования технологий секвенирования (секвенирование белков и нуклеиновых кислот определение их аминокислотной или нуклеотидной последовательности) геномов живых организмов, позволивших поставить этот процесс на поток. Методы полимеразной цепной реакции (ПЦР) и автоматического определения нуклеотидных последовательностей сделали возможным получение генетической информации в не представимом ранее масштабе.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Один геном человека это три миллиарда пар оснований! Первый геном человека был расшифрован в 2000м году, и в настоящее время секвенаторы по всему миру выдают миллиарды букв генетического кода, который собирается в базах данных первичных структур и требует анализа и обработки. Объем этой информации удваивается, в среднем, каждые 18 месяцев!

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

До изобретения быстрых методов секвенирования ДНК большинство исследований молекулярной эволюции проводились с использованием аминокислотных последовательностей. Определение аминокислотных последовательностей занимало много времени, и иногда было ошибочным.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Сейчас определить последовательность ДНК гораздо легче, чем последовательность белка, поэтому аминокислотные последовательности получают из нуклеотидных последовательностей, используя таблицы генетического кода.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Современные биологические базы являются централизованными хранилищами информации, тысячи исследователей непрерывно пополняют их новыми данными, исправляют и дополняют. Информация в этих базах бывает неполна или даже содержит ошибки, поэтому приходится проверять е¼, сверяя множество источников, но научная деятельность в биоинформатике без этих баз просто невозможна.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

В настоящее время существуют сотни Web-сайтов, которые доступны для обзора и поиска данных по молекулярной биологии и другим смежным дисциплинам. Каждая из них имеет свой формат хранения данных, различную степень избыточности, взаимосвязи с родственными или аналогичными базами данных. Каждая база данных имеет также свои средства доступа к информации - различные поисковые программы, программные средства визуализации, пополнения базы.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Крупнейшие хранилища первичных структур ДНК и аминокислотных последовательностей (такие, как EMBL, GenBank, DDBJ, SWISS-PROT, PIR и др.) пополняются аннотированными последовательностями непосредственно исследователями, расшифровавшими их, с помощью автоматизированной системы пополнения баз данных по сети Интернет. Конечно, впоследствии эти данные проверяются персоналом администраций баз данных и существенно пополняются.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]