Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Огурцов А. Н. Введение в биоинформатику

.pdf
Скачиваний:
315
Добавлен:
14.09.2020
Размер:
4.43 Mб
Скачать

Эдмана метод расщепления – применяемый в секвенировании полипептидов метод, с помощью которого остатки аминокислот последовательно отщепляют от N-конца посредством реакции с фенилизотиоцианатом, приводящей к образованию фенилтиокарбамилпептида (ФТК-пептида). Это соединение расщепляют в безводной кислоте, высвобождая промежуточное вещество тиазолинон и остаток пептида.

Экзон – кодирующая последовательность гена, входящая в первичный транскрипт.

Эквивалент генома – такое количество рекомбинантных клонов, суммарная длина вставок в которых равна длине генома.

Экспрессия гена – процесс, в ходе которого закодированная в гене информация преобразуется в структурные и функциональные элементы клетки. К экспрессируемым относятся гены, которые транскрибируются в мРНК и затем транслируются в белок, а также гены, которые транскрибируются в РНК, но не транслируются в белок (например, гены транспортной и рибосомной РНК).

Эмбриогенез – начальная, зародышевая стадия онтогенеза.

Энциклопедия клонов – контиг, перекрывающий весь геном.

Язык разметки гипертекста (HTML) – HyperText Markup Language – язык,

применяемый для создания веб-документов, которые могут интерпретироваться и отображаться программой-обозревателем.

Ярлык экспрессируемой последовательности (EST) – Expressed Sequence Tag – отрезок последовательности клона, произвольно выбранного из библиотеки кДНК, и используемый для опознавания генов, экспрессируемых в определённой ткани.

200

 

СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ

ASCII

American Standard Code for Information Interchange – Амери-

 

канский стандартный код обмена информацией (АСКОИ)

 

определяет 128 знаков, которым присвоены номера 0–127.

BAC

Bacterial Artificial Chromosome – Бактериальная искусствен-

 

ная хромосома.

BIOML

Biopolymer Markup Language – Язык разметки биополимеров

 

(БИОМЛ).

BIOS

Basic Input-Output System – базовая система ввода-вывода

 

(БИОС).

BLAST

Basic Local Alignment Search Tool.

BLOSUM

BLOcks Substitution Matrix – Матрица БЛОСУМ для расчёта

 

весов для замен в аминокислотных последовательностях.

bp

base pair – пара азотистых оснований (по).

BSML

Bioinformatic Sequence Markup Language – Язык разметки

 

последовательностей в биоинформатике (БСМЛ).

CERN

От фр. Conseil Européen pour la Recherche Nucléaire –

 

Европейский совет по ядерным исследованиям (ЦЕРН)

 

http://public.web.cern.ch/public/

COG

Cluster of Ortologous Gene) – кластер ортологичных генов,

 

представляет собой группу генов-ортологов или ортологич-

 

ные группы паралогов из геномов разных организмов.

CORBA

Common Object Request Broker Architecture – Общая архи-

 

тектура брокеров объектных запросов (ОАБОЗ).

 

201

dbEST

Database of Expressed Sequence Tags – База данных ярлыков

 

экспрессируемых последовательностей

 

http://www.ncbi.nlm.nih.gov/nucest

DBMS

Database Management System – Система управления базами

 

данных (СУБД).

DDBJ

DNA DataBank of Japan – Японский банк ДНК (ЯБД)

 

http://www.ddbj.nig.ac.jp/Welcome.html.en

DNS

Domain Name System – Система имен доменов (СИД).

EMBL

European Molecular Biology Laboratory – Европейская лабо-

 

ратория молекулярной биологии: http://www.embl.de/

EST

Expressed Sequence Tags – Маркерные экспрессирующихся

 

последовательностей или ярлыки экспрессируемых последо-

 

вательностей (ЯЭП).

ExPASy

Expert Protein Analysis System – Экспертная система анализа

 

белков – первый веб-сервер молекулярной биологии

 

http://www.expasy.org

FASTA

Fast Allignment – быстрое выравнивание (ФАСТА).

FASTP

Алгоритм "ФАСТП".

FISH

Fluorescence In Situ Hybridization – Флуоресцентная гибри-

 

дизация in situ – метод, который применяют in situ для де-

 

тектирования и определения положения специфической по-

 

следовательности ДНК на хромосомах.

FTP

File Transfer Protocol – Протокол передачи файлов (ППФ).

GCG

Genetics Computer Group – Фирма "Genetics Computer

 

Group".

GI

Genlnfo Identifiers – регистрационные номера "ГенИнфо"

 

биологических последовательностей, внесенных в Entrez

 

NCBI.

HGP

Human Genome Project – Проект "Геном человека".

HMM

Hidden Markov model – Скрытая марковская модель (СММ).

HTML

HyperText Markup Language – Язык разметки гипертекста.

HTTP

Hypertext Transfer Protocol – Протокол передачи гипертек-

 

стовых файлов.

 

202

HUGE

HUman Genome Equivalents – количество информации, со-

 

держащееся в геноме человека.

IDL

Interface Definition Language – Язык описания интерфейсов,

 

(ИДЛ).

IHGSC

International Human Genome Sequencing Consortium – Меж-

 

дународный консорциум секвенирования генома человека.

NBRF

National Biomedical Research Foundation – Национальный

 

фонд биомедицинских исследований США.

NCBI

National Center for Biotechnology Information – Националь-

 

ный центр биотехнологической информации.

NHGRI

National Human Genome Research Institute – Национальный

 

институт исследования генома человека.

NIH

National Inatitute of Health – Национальный институт здоро-

 

вья: http://www.nih.gov/

NLM

National Library of Medicine – Национальная медицинская

 

библиотека.

ORB

Object Request Broker – Брокер объектных запросов (БОЗ).

ORF

Open Reading Frame – Открытая рамка считывания (ОРС).

PAGE

Polyacrylamide Gel Electrophoresis – Электрофорез в полиак-

 

риламидном геле (ЭПААГ) .

PAM

Percent Accepted Mutation – проценты точечных мутаций

 

(ПТМ).

PCR

Polymerase chain reaction – Полимеразная цепная реакция

 

(ПЦР).

PDB

Protein data bank – Банк белковых данных:

 

http://www.pdb.org/

PERL

Practical Extraction and Reporting Language – Практический

 

язык извлечения данных и формирования отчетов (ПЕРЛ).

PFGE

Pulsed Field Gel Electrophoresis – Электрофорез в пульси-

 

рующем электрическом поле. Метод разделения крупных

 

(до 10 Mbp) фрагментов ДНК.

PHI-BLAST

Pattern Hit Initiated BLAST – Программа поиска белков, со-

 

держащих определённый пользователем паттерн.

 

203

PIR

Protein Information Resource – Ресурс информации о белках

 

(РИБ): http://pir.georgetown.edu/

PRF

База белковых данных Protein Research Foundation (Osaka):

 

http://www.genome.jp/dbget-bin/www_bfind?prf

PSI-BLAST

Position specific iterative BLAST – Программа сравнения с

 

целью поиска последовательностей, обладающих незначи-

 

тельным сходством.

RFLP

Restriction Fragment Length Polymorphism – Полиморфизм

 

длины рестрикта (ПДР) – полиморфизм длин рестрикционых

 

фрагментов в одинаковых локусах гомологичных хромосом.

SAGE

Serial Analysis of Gene Expression Серийный анализ экс-

 

прессии генов (САЭГ), http://www.sagenet.org/

SDS-PAGE

Sodium Dodecyl Sulfate Polyacrylamide Gel Electrophoresis –

 

Двумерный электрофорез белков в полиакриламидном геле в

 

присутствии додецилсульфата натрия.

SeqDB

The Sequence Database – База данных нуклеотидных после-

 

довательностей: http://pgrc-35.ipk-

 

gatersleben.de/portal/page/portal/PG_BICGH/P_BICGH/P_BIC

 

GH_RESOURCES/SeqDB

SGML

Standard Generalized Markup Language – Стандартный обоб-

 

щённый язык разметки.

SNP

Single Nucleotide Polymorphism – Однонуклеотидный поли-

 

морфизм (ОНП) или Полиморфизм отдельного нуклеотида

 

(ПОН) – отличия последовательности ДНК размером в один

 

нуклеотид.

SRS

Sequence Retrieval System – Система выборки последова-

 

тельностей (СВП): http://srs.ebi.ac.uk/

STR

Short Tandem Repeat – Короткое тандемное повторение

 

(КТП) – короткие (обычно до 5 нуклеотидов) тандемные по-

 

вторы, находящиеся в одинаковых локусах гомологичных

 

хромосом, но содержащие различное число повторов данно-

 

го типа.

 

204

STS

Sequence Tagged Site – Ярлык, определённый последова-

 

тельностью или Меченый участок последовательности

 

(МУП).

Swiss-Prot

База данных белковых последовательностей Шведского Ин-

 

ститута биоинформатики (Swiss Institute of Bioinformatics,

 

http://www.isb-sib.ch/): http://www.expasy.org/sprot/

TCP

Transmission Control Protocol – Протокол управления пере-

 

дачей.

ТСР/IР

Transmission Control Protocol / Internet Protocol – Протокол

 

управления передачей (данных) / Интернет-протокол

 

(ПУП/ИП).

URL

Uniform Resource Locator – Унифицированный указатель

 

(информационного) ресурса.

UTR

UnTranslated Region – нетранслируемые области (НТО).

VNTR

Variable Number Of Tandem Repeat – Переменное число тан-

 

демных повторений (ПЧТП).

WWW

World Wide Web – Всемирная паутина.

XML

Extensible Markup Language – Расширяемый язык разметки

 

(РЯР).

YAC

Yeast Artificial Chromosome – Дрожжевая искусственная

 

хромосома.

ПЦР

Полимеразная цепная реакция – Polymerase Chain Reaction

 

(PCR).

205

СОДЕРЖАНИЕ

 

Вступление

3

1. Предмет биоинформатики

4

1.1. Определение биоинформатики

4

1.2. История становления биоинформатики

7

1.3. Особенность биоинформационных данных

16

1.4. Цели и задачи биоинформатики

21

1.5. Применение биоинформатики

23

2. Понятие "информация"

31

2.1. Определение понятия "информация"

31

2.2. Количество информации

33

2.3. Свойства информации

39

2.4. Генетическая информация

48

3. Основания биоинформатики

57

3.1. Основные положения молекулярной биологии

57

3.2. Информационно-компьютерные компоненты

 

биоинформатики

62

3.3. Интернет-компоненты биоинформатики

67

3.4. Биоинформационные данные, сети и базы

73

4. Примеры сравнения данных

83

4.1. Биологическая классификация и номенклатура

83

4.2. Биологические последовательности

88

4.3. Поиск схожих последовательностей в базах данных

102

206

 

5. Белковая информация

112

5.1. Структуры белков

112

5.2. Предсказание структур белков и белковая инженерия

117

5.3. Биоинформатика в медицине

120

6. Секвенирование и анализ биологических последова-

 

тельностей

125

6.1. Геномика

126

6.2. Протеомика

131

6.3. Картографирование генома

133

6.4. Методы секвенирования ДНК

138

6.5. Открытая рамка считывания (ORF)

141

6.6. Определение сиквенса клона

144

6.7. Ярлыки экспрессируемых последовательностей

146

6.8. Секвенирование белков

150

7. Экспрессия генов

152

7.1. Микроматрицы ДНК

153

7.2. Анализ белков

158

7.3. Обнаружение генов

161

7.4. Анализ экспрессии генов

165

7.5. Использование результатов секвенирования

167

Список литературы

170

Словарь терминов

175

Список условных обозначений

201

207

Навчальне видання

ОГУРЦОВ Олександр Миколайович

ВСТУП ДО БІОІНФОРМАТИКИ

Навчальний посібник по курсу «Біоіформатика та інформаційна біотехнологія»

для студентів напряму підготовки 051401 «Біотехнологія», в тому числі для іноземних студентів

Російською мовою

Відповідальний за випуск М.Ф. Клещев Роботу до видання рекомендувала М.Г. Зінченко В авторській редакції

План 2011 р., поз. 31 / 196-10.

Підп. до друку 20.12.2010 р. Формат 60 × 84 1/16. Папір офісний. Riso-друк. Гарнітура Таймс. Ум. друк. арк. 12,0. Наклад 300 прим.

Зам. № 19. Ціна договірна

Видавничий центр НТУ «ХПІ».

Свідоцтво про державну реєстрацію ДК № 3657 від 24.12.2009 р. 61002, Харків, вул. Фрунзе, 21

Друкарня НТУ «ХПІ». 61002, Харків, вул. Фрунзе, 21