
Огурцов А. Н. Введение в биоинформатику
.pdfЭдмана метод расщепления – применяемый в секвенировании полипептидов метод, с помощью которого остатки аминокислот последовательно отщепляют от N-конца посредством реакции с фенилизотиоцианатом, приводящей к образованию фенилтиокарбамилпептида (ФТК-пептида). Это соединение расщепляют в безводной кислоте, высвобождая промежуточное вещество тиазолинон и остаток пептида.
Экзон – кодирующая последовательность гена, входящая в первичный транскрипт.
Эквивалент генома – такое количество рекомбинантных клонов, суммарная длина вставок в которых равна длине генома.
Экспрессия гена – процесс, в ходе которого закодированная в гене информация преобразуется в структурные и функциональные элементы клетки. К экспрессируемым относятся гены, которые транскрибируются в мРНК и затем транслируются в белок, а также гены, которые транскрибируются в РНК, но не транслируются в белок (например, гены транспортной и рибосомной РНК).
Эмбриогенез – начальная, зародышевая стадия онтогенеза.
Энциклопедия клонов – контиг, перекрывающий весь геном.
Язык разметки гипертекста (HTML) – HyperText Markup Language – язык,
применяемый для создания веб-документов, которые могут интерпретироваться и отображаться программой-обозревателем.
Ярлык экспрессируемой последовательности (EST) – Expressed Sequence Tag – отрезок последовательности клона, произвольно выбранного из библиотеки кДНК, и используемый для опознавания генов, экспрессируемых в определённой ткани.
200
|
СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ |
ASCII |
American Standard Code for Information Interchange – Амери- |
|
канский стандартный код обмена информацией (АСКОИ) |
|
определяет 128 знаков, которым присвоены номера 0–127. |
BAC |
Bacterial Artificial Chromosome – Бактериальная искусствен- |
|
ная хромосома. |
BIOML |
Biopolymer Markup Language – Язык разметки биополимеров |
|
(БИОМЛ). |
BIOS |
Basic Input-Output System – базовая система ввода-вывода |
|
(БИОС). |
BLAST |
Basic Local Alignment Search Tool. |
BLOSUM |
BLOcks Substitution Matrix – Матрица БЛОСУМ для расчёта |
|
весов для замен в аминокислотных последовательностях. |
bp |
base pair – пара азотистых оснований (по). |
BSML |
Bioinformatic Sequence Markup Language – Язык разметки |
|
последовательностей в биоинформатике (БСМЛ). |
CERN |
От фр. Conseil Européen pour la Recherche Nucléaire – |
|
Европейский совет по ядерным исследованиям (ЦЕРН) |
|
http://public.web.cern.ch/public/ |
COG |
Cluster of Ortologous Gene) – кластер ортологичных генов, |
|
представляет собой группу генов-ортологов или ортологич- |
|
ные группы паралогов из геномов разных организмов. |
CORBA |
Common Object Request Broker Architecture – Общая архи- |
|
тектура брокеров объектных запросов (ОАБОЗ). |
|
201 |
dbEST |
Database of Expressed Sequence Tags – База данных ярлыков |
|
экспрессируемых последовательностей |
|
http://www.ncbi.nlm.nih.gov/nucest |
DBMS |
Database Management System – Система управления базами |
|
данных (СУБД). |
DDBJ |
DNA DataBank of Japan – Японский банк ДНК (ЯБД) |
|
http://www.ddbj.nig.ac.jp/Welcome.html.en |
DNS |
Domain Name System – Система имен доменов (СИД). |
EMBL |
European Molecular Biology Laboratory – Европейская лабо- |
|
ратория молекулярной биологии: http://www.embl.de/ |
EST |
Expressed Sequence Tags – Маркерные экспрессирующихся |
|
последовательностей или ярлыки экспрессируемых последо- |
|
вательностей (ЯЭП). |
ExPASy |
Expert Protein Analysis System – Экспертная система анализа |
|
белков – первый веб-сервер молекулярной биологии |
|
http://www.expasy.org |
FASTA |
Fast Allignment – быстрое выравнивание (ФАСТА). |
FASTP |
Алгоритм "ФАСТП". |
FISH |
Fluorescence In Situ Hybridization – Флуоресцентная гибри- |
|
дизация in situ – метод, который применяют in situ для де- |
|
тектирования и определения положения специфической по- |
|
следовательности ДНК на хромосомах. |
FTP |
File Transfer Protocol – Протокол передачи файлов (ППФ). |
GCG |
Genetics Computer Group – Фирма "Genetics Computer |
|
Group". |
GI |
Genlnfo Identifiers – регистрационные номера "ГенИнфо" |
|
биологических последовательностей, внесенных в Entrez |
|
NCBI. |
HGP |
Human Genome Project – Проект "Геном человека". |
HMM |
Hidden Markov model – Скрытая марковская модель (СММ). |
HTML |
HyperText Markup Language – Язык разметки гипертекста. |
HTTP |
Hypertext Transfer Protocol – Протокол передачи гипертек- |
|
стовых файлов. |
|
202 |
HUGE |
HUman Genome Equivalents – количество информации, со- |
|
держащееся в геноме человека. |
IDL |
Interface Definition Language – Язык описания интерфейсов, |
|
(ИДЛ). |
IHGSC |
International Human Genome Sequencing Consortium – Меж- |
|
дународный консорциум секвенирования генома человека. |
NBRF |
National Biomedical Research Foundation – Национальный |
|
фонд биомедицинских исследований США. |
NCBI |
National Center for Biotechnology Information – Националь- |
|
ный центр биотехнологической информации. |
NHGRI |
National Human Genome Research Institute – Национальный |
|
институт исследования генома человека. |
NIH |
National Inatitute of Health – Национальный институт здоро- |
|
вья: http://www.nih.gov/ |
NLM |
National Library of Medicine – Национальная медицинская |
|
библиотека. |
ORB |
Object Request Broker – Брокер объектных запросов (БОЗ). |
ORF |
Open Reading Frame – Открытая рамка считывания (ОРС). |
PAGE |
Polyacrylamide Gel Electrophoresis – Электрофорез в полиак- |
|
риламидном геле (ЭПААГ) . |
PAM |
Percent Accepted Mutation – проценты точечных мутаций |
|
(ПТМ). |
PCR |
Polymerase chain reaction – Полимеразная цепная реакция |
|
(ПЦР). |
PDB |
Protein data bank – Банк белковых данных: |
|
http://www.pdb.org/ |
PERL |
Practical Extraction and Reporting Language – Практический |
|
язык извлечения данных и формирования отчетов (ПЕРЛ). |
PFGE |
Pulsed Field Gel Electrophoresis – Электрофорез в пульси- |
|
рующем электрическом поле. Метод разделения крупных |
|
(до 10 Mbp) фрагментов ДНК. |
PHI-BLAST |
Pattern Hit Initiated BLAST – Программа поиска белков, со- |
|
держащих определённый пользователем паттерн. |
|
203 |
PIR |
Protein Information Resource – Ресурс информации о белках |
|
(РИБ): http://pir.georgetown.edu/ |
PRF |
База белковых данных Protein Research Foundation (Osaka): |
|
http://www.genome.jp/dbget-bin/www_bfind?prf |
PSI-BLAST |
Position specific iterative BLAST – Программа сравнения с |
|
целью поиска последовательностей, обладающих незначи- |
|
тельным сходством. |
RFLP |
Restriction Fragment Length Polymorphism – Полиморфизм |
|
длины рестрикта (ПДР) – полиморфизм длин рестрикционых |
|
фрагментов в одинаковых локусах гомологичных хромосом. |
SAGE |
Serial Analysis of Gene Expression – Серийный анализ экс- |
|
прессии генов (САЭГ), http://www.sagenet.org/ |
SDS-PAGE |
Sodium Dodecyl Sulfate Polyacrylamide Gel Electrophoresis – |
|
Двумерный электрофорез белков в полиакриламидном геле в |
|
присутствии додецилсульфата натрия. |
SeqDB |
The Sequence Database – База данных нуклеотидных после- |
|
довательностей: http://pgrc-35.ipk- |
|
gatersleben.de/portal/page/portal/PG_BICGH/P_BICGH/P_BIC |
|
GH_RESOURCES/SeqDB |
SGML |
Standard Generalized Markup Language – Стандартный обоб- |
|
щённый язык разметки. |
SNP |
Single Nucleotide Polymorphism – Однонуклеотидный поли- |
|
морфизм (ОНП) или Полиморфизм отдельного нуклеотида |
|
(ПОН) – отличия последовательности ДНК размером в один |
|
нуклеотид. |
SRS |
Sequence Retrieval System – Система выборки последова- |
|
тельностей (СВП): http://srs.ebi.ac.uk/ |
STR |
Short Tandem Repeat – Короткое тандемное повторение |
|
(КТП) – короткие (обычно до 5 нуклеотидов) тандемные по- |
|
вторы, находящиеся в одинаковых локусах гомологичных |
|
хромосом, но содержащие различное число повторов данно- |
|
го типа. |
|
204 |
STS |
Sequence Tagged Site – Ярлык, определённый последова- |
|
тельностью или Меченый участок последовательности |
|
(МУП). |
Swiss-Prot |
База данных белковых последовательностей Шведского Ин- |
|
ститута биоинформатики (Swiss Institute of Bioinformatics, |
|
http://www.isb-sib.ch/): http://www.expasy.org/sprot/ |
TCP |
Transmission Control Protocol – Протокол управления пере- |
|
дачей. |
ТСР/IР |
Transmission Control Protocol / Internet Protocol – Протокол |
|
управления передачей (данных) / Интернет-протокол |
|
(ПУП/ИП). |
URL |
Uniform Resource Locator – Унифицированный указатель |
|
(информационного) ресурса. |
UTR |
UnTranslated Region – нетранслируемые области (НТО). |
VNTR |
Variable Number Of Tandem Repeat – Переменное число тан- |
|
демных повторений (ПЧТП). |
WWW |
World Wide Web – Всемирная паутина. |
XML |
Extensible Markup Language – Расширяемый язык разметки |
|
(РЯР). |
YAC |
Yeast Artificial Chromosome – Дрожжевая искусственная |
|
хромосома. |
ПЦР |
Полимеразная цепная реакция – Polymerase Chain Reaction |
|
(PCR). |
205
СОДЕРЖАНИЕ |
|
Вступление |
3 |
1. Предмет биоинформатики |
4 |
1.1. Определение биоинформатики |
4 |
1.2. История становления биоинформатики |
7 |
1.3. Особенность биоинформационных данных |
16 |
1.4. Цели и задачи биоинформатики |
21 |
1.5. Применение биоинформатики |
23 |
2. Понятие "информация" |
31 |
2.1. Определение понятия "информация" |
31 |
2.2. Количество информации |
33 |
2.3. Свойства информации |
39 |
2.4. Генетическая информация |
48 |
3. Основания биоинформатики |
57 |
3.1. Основные положения молекулярной биологии |
57 |
3.2. Информационно-компьютерные компоненты |
|
биоинформатики |
62 |
3.3. Интернет-компоненты биоинформатики |
67 |
3.4. Биоинформационные данные, сети и базы |
73 |
4. Примеры сравнения данных |
83 |
4.1. Биологическая классификация и номенклатура |
83 |
4.2. Биологические последовательности |
88 |
4.3. Поиск схожих последовательностей в базах данных |
102 |
206 |
|
5. Белковая информация |
112 |
5.1. Структуры белков |
112 |
5.2. Предсказание структур белков и белковая инженерия |
117 |
5.3. Биоинформатика в медицине |
120 |
6. Секвенирование и анализ биологических последова- |
|
тельностей |
125 |
6.1. Геномика |
126 |
6.2. Протеомика |
131 |
6.3. Картографирование генома |
133 |
6.4. Методы секвенирования ДНК |
138 |
6.5. Открытая рамка считывания (ORF) |
141 |
6.6. Определение сиквенса клона |
144 |
6.7. Ярлыки экспрессируемых последовательностей |
146 |
6.8. Секвенирование белков |
150 |
7. Экспрессия генов |
152 |
7.1. Микроматрицы ДНК |
153 |
7.2. Анализ белков |
158 |
7.3. Обнаружение генов |
161 |
7.4. Анализ экспрессии генов |
165 |
7.5. Использование результатов секвенирования |
167 |
Список литературы |
170 |
Словарь терминов |
175 |
Список условных обозначений |
201 |
207

Навчальне видання
ОГУРЦОВ Олександр Миколайович
ВСТУП ДО БІОІНФОРМАТИКИ
Навчальний посібник по курсу «Біоіформатика та інформаційна біотехнологія»
для студентів напряму підготовки 051401 «Біотехнологія», в тому числі для іноземних студентів
Російською мовою
Відповідальний за випуск М.Ф. Клещев Роботу до видання рекомендувала М.Г. Зінченко В авторській редакції
План 2011 р., поз. 31 / 196-10.
Підп. до друку 20.12.2010 р. Формат 60 × 84 1/16. Папір офісний. Riso-друк. Гарнітура Таймс. Ум. друк. арк. 12,0. Наклад 300 прим.
Зам. № 19. Ціна договірна
Видавничий центр НТУ «ХПІ».
Свідоцтво про державну реєстрацію ДК № 3657 від 24.12.2009 р. 61002, Харків, вул. Фрунзе, 21
Друкарня НТУ «ХПІ». 61002, Харків, вул. Фрунзе, 21