- •1 Введение
- •Подготовка рабочего места
- •2 Базы данных для биоинформатика: инструмент и результат
- •2.1 GenBank — база данных биологических последовательностей
- •2.2 Protein Data Bank - банк данных трехмерных структур белков и нуклеиновых кислот
- •2.3 PubMed — база публикаций по медицине и биологии
- •2.4 Контрольные вопросы
- •3 Программы и форматы
- •3.1 UCSF Chimera и формат PDB
- •3.2 Редактор JalView и FASTA - формат
- •3.3 Контрольные вопросы
- •4.2 Выравнивание последовательностей в MAFFT
- •4.4 Облачные вычисления — дорога в будущее
- •4.5 Контрольные вопросы
- •5 Учебная работа по моделированию пространственной структуры биологического объекта
- •5.1 Задание
- •5.1.1 Извлечение знаний (Data mining)
- •5.2 Анализ вирусного белка NS3
- •5.2.1 Скрининг по гомологии
- •5.2.2 Скрининг с кластеризацией
- •5.2.3 Построение филогенетического древа
- •5.2.4 Конструирование трехмерной структуры вирусного белка NS3
- •5.2.5 Система поиска научных статей в базе данных Медлайн
- •5.2.6 Исследование функциональных доменов вирусного белка NS3
- •5.3 Необходимое послесловие к моделированию
- •6 Список рекомендованной литературы
Рисунок 20: UCSF Chimera - полученная в результате гомологичного моделирования модель
5.2.5Система поиска научных статей в базе данных Медлайн
База данных научных публикаций по биологической тематике компилируется и поддерживается Национальным институтом Здоровья США. На сайте www.ncbi.nlm.nih.gov есть собственная поисковая система для навигации в этой базе данных. Также эта база данных доступна для других разработчиков, желающих создать собственную систему поиска. Здесь на примере мы ознакомимся с поисковой системой по Medline реализованной на сайте bri-shur.com. На этом сайте проведен дополнительный лингвистический анализ текстов в базе данных, чтобы улучшить порядок сортировки статей в соответствии с поступившим запросом, а также отбирать группы статей со сходной темой обсуждения.
Итак попробуем найти научные статьи по теме вируса клещевого энцефалита, а именно вирусного белка NS3.
1.В меню сайта www.bri-shur.com щелкните по ссылке Medline.
2.В поле ввода напишите ns3 viral protein
41
Рисунок 21: Bri-shur - поиск информации по базе MedLine
3.На странице результатов вы увидите список статей на заданную тему.
4.Статьи, полный текст которых находится в свободном доступе имеют значок free full text нажав на него вы перейдете в базу данных PubMed и сможете скачать эту статью.
5.Вернувшись на bri-shur к результатам поиска, нажмите на название любой статьи и вы увидите аннотацию этой статьи на английском языке.
6.Щелкнув на красную ссылку — название мема, вы сможете посмотреть все статьи где упоминается данное словосочетание.
7.Также вверху страницы есть навигация по результатам поиска.
Из найденного списка научных статей можно что-нибудь скачать себе и ознакомиться с предложенной тематикой более подробно.
42
5.2.6Исследование функциональных доменов вирусного белка NS3
Исследуемый нами вирусный белок NS3 является многофункциональным, то есть содержит в себе несколько структурных доменов, выполняющих независимые функции.
Определим структурные домены вирусного белка NS3:
1.Для этого зайдите в базу данных белковых семейств Pfam по ссылке http://pfam.sanger.ac.uk/search
2.В поле последовательность (Sequence) вставьте последовательность белка NS3.
3.Отправьте запрос, нажав Submit.
4.На обновленной странице вы увидите названия семейства к которому относится искомый белок (Family) и полное название исследуемого вами белка (Description). Например,
Рисунок 22: Pfam (специализированная база белковых семейств) - описание белка NS3
43
для нашего частного примера мы получаем следующую информацию:
а) мы видим что наша последовательность содержит в себе три белка вместо ожидаемого одного.
б) Первый белок относится к классу пептидаз (Peptidase) S7, и является флавивирусной сериновой протеазой и служит для расщепления вирусного полипротеина на индивидуальные белки (Flavivirus NS3 serine protease).
в) Второй домен исследуемого белка это некий фантомный белок (DEAD domain) с неизвестной функцией, и он относится к семейству
Flavi_DEAD. |
|
г) Третий домен исследуемого белка, называется |
геликаза, |
существующая для раскручивания двойной спирали ДНК (Helicase conserved C-terminal domain). Все эти три домена вместе составляют один многофункциональный белок NS3.
Попробуем определить границы каждого структурного домена в общем белке NS3.
На странице в таблице описания белковых семейств даны три рамки, то есть место начало и конца для домена протеазы. Рамки, в зависимости от метода с помощью которого они были найдены, немного отличаются, причем иногда бывает так что все эти рамки не верны. Для того чтобы верно определить рамку необходимы дополнительные знания о исследуемом объекте из научных статей.
Проведем картирование структурных доменов белка NS3:
1.Для домена протеазы возьмем границы последовательности с позиции 16 по 173.
2.Для DEAD домена возьмем границы последовательности с позиции 189 по 336.
3.Для домена геликазы возьмем границы последовательности с позиции 379 по 468.
4.Используя предложенные рамки разметим разными цветами функциональные домены белка NS3 в программе Chimera на построенной вами модели.
44
