Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Lection02

.pdf
Скачиваний:
7
Добавлен:
21.05.2015
Размер:
1.02 Mб
Скачать

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Вторым основным источником информации во всех базах является специальная научная литература. Многие базы данных, работающие над коллекционированием однородной информации, координируют свои усилия, осуществляя международное разделение труда, это можно проиллюстрировать примером сотрудничества трех всемирных коллекций последовательностей нуклеотидов EMBL (Европа), GenBank (США), DDBJ (Япония).

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Наряду с общими базами данных в последнее время появилось много специализированных информационных ресурсов. Многие из них хранят данные, полученные с помощью компьютерных методов, результаты теоретических предсказаний. Большую роль в биоинформатике играют хранилища последовательностей ДНК и кДНК, специализированные базы данных по отдельным регуляторным мотивам нуклеотидных последовательностей, базы данных по экспрессии генов, библиотеки геномов, карт, последовательностей РНК, белков, белковых мотивов, по продукции белков.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Есть базы данных по протеомике, структурам белков, мутациям, метаболическим путям и регуляции, по трансгеннным организмам, анатомии, биохимии, а также по научной литературе, по существующему в этих областях исследований программному обеспечению. Есть даже база данных по базам данных, она имеет адрес http://www.infobiogen.fr/services/dbcat . Это текстовый файл с аннотациями более чем на 500 биологических баз данных. Он содержит краткое описание назначения базы, авторов, ссылки и адреса. Для того, чтобы обеспечить ориентирование в этом обширном информационном пространстве, журнал Nucleic Acids Research в течение ряда последних лет первый номер года посвящает описаниям баз данных, сделанным их авторами.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Каждая база данных содержит логически организованную структуру данных (так в библиотеке книги расположены по разделам и полкам). Любой записи этой базы обычно соответствует идентификатор. Как правило, в разных базах идентификаторы одной и той же сущности (например, биологической последовательности) разные, но бывает, что в нескольких базах принята одна и та же идентификация.

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Идентификатор однозначно определяет запись базы, но не биологический объект, несколько исследований одного и того же объекта с чуть разными результатами будут иметь разные идентификаторы.

Биологические базы данных всегда содержат средства для поиска данных, в том числе для ¾нечеткого¿ поиска, т. е. эти средства могут ответить на вопрос ¾найти что-то наиболее похожее на...¿

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

Идентификатор однозначно определяет запись базы, но не биологический объект, несколько исследований одного и того же объекта с чуть разными результатами будут иметь разные идентификаторы.

Биологические базы данных всегда содержат средства для поиска данных, в том числе для ¾нечеткого¿ поиска, т. е. эти средства могут ответить на вопрос ¾найти что-то наиболее похожее на...¿

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

GenBank http://www.ncbi.nlm.nih.gov/Genbank/

БД по нуклеотидным последовательностям (34 108 пар оснований в 4610000 последовательностях)

SWISS-PROT http://www.expasy.ch/sprot/sprot-top.html Аннотированная БД по аминокислотным последовательностям белков

PIR http://www-nbrf.georgetown.edu/pir/searchdb.html Аннотированная БД по аминокислотным последовательностям белков, организованным в соответствии с гомологией и таксономией

Лекция 2. Генетический код. Банки биологических данных

Банки биологических данных

PDB http://www.rcsb.org/pdb/

БД по 3D структуре биологических макромолекул (10811 структур)

NDB http://ndbserver.rutgers.edu

БД по нуклеиновым кислотам, включает структуры ДНК и РНК вместе с их трехмерными изображениями

PROSITE http://www.expasy.ch/prosite

БД паттернов функционально значимых участков белков

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]