Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Потапов В.В. Решение задач биоинформатики при помощи веб - и интернет-сервисов.pdf
Скачиваний:
170
Добавлен:
14.09.2020
Размер:
2.93 Mб
Скачать

5.2Анализ вирусного белка NS3

Для выполнения анализа вирусного белка NS3 будем использовать вебсервисы bri-shur. Загрузим главную страницу www.bri-shur.com, при необходимости переключим интерфейс на русский язык.

Слева находится список сервисов (то есть инструментов по анализу биологических объектов), которыми мы будем пользоваться в ходе нашего исследования. Подробное описание сервисов и алгоритмов их работы доступно на сайте www.bri-shur.com в разделе «Документация».

Наше исследование перешло на новую стадию анализа, более глубокого познания биологического объекта.

Давайте немного порассуждаем, допустим вы нашли какой-то загадочный неизвестный объект, и не знаете что бы это могло быть. Лучший способ для начала - как то этот объект идентифицировать и классифицировать, то есть соотнести его с другими известными вам ранее объектами и исходя из этого дать ему название.

В нашем случае, мы взяли неизвестный объект и узнали что это последовательность вируса клещевого энцефалита.

Теперь необходимо определить местоположение этого объекта среди остального мира биологических существ.

5.2.1 Скрининг по гомологии

Проведем скрининг по гомологии (GenBank), то есть попытаемся найти среди всех известных последовательностей белков, которые собраны в международном банке данных GenBank, те последовательности белков, которые имеют родство (гомологию) с нашей заданной последовательностью:

1.Выберите из списка сервисов скрининг по гомологии (GenBank) и перейдите по ссылке.

2.Напишите адрес своей электронной почты в поле Email

3. В

поле

«Наименование

задания»

напишите

идентификационное имя задания, например ns3

 

4.Возьмите исследуемую последовательность белка NS3 (только аминокислоты, без идентификатора и описания) и вставьте в поле «Последовательность»

5.Для уменьшения времени расчетов воспользуемся следующими параметрами:

28

Критерий отбора — сходство по всей длине, точность поиска

— жесткий, количество последовательностей в полученном результате — 100,

6.Поставьте галочку и напишем слово virus в поле ввода параметра «сначала отобрать по ключевому слову (словам)», это позволит найти только последовательности с вирусов (последовательности с ключевым словом virus в описании).

7.Cкомандуем «Рассчитать»

Рисунок 14: Bri-shur - параметры скрининга по гомологии в GenBank

Как только поставленное вами задание на сервисе Скрининг по гомологии (GenBank) будет выполнено на указанный вами электронный адрес будет выслано письмо о завершении задания, в теме письма написано нечто подобное: «Скрининг по гомологии (GenBank): ns3 (Результаты задания на сайте Brishur)»

29

8.В самом письме вы увидите две ссылки, одна ссылка на страницу с вашим заданием и выбранными вами параметрами, вторая ссылка на страницу с результатом вашего запроса.

9.Если по какой то причине система письменного оповещения недоступна или не работает, всегда есть возможность обновить страницу вашего запроса на www.bri-shur.com и после завершения задачи, вы увидите страницу с результатом.

На обработку вашего запроса потребуется несколько минут, после этого, пройдя по ссылке из письма о выполнении задания, вы обнаружите страницу с результатом нашего запроса.

А результатом при заданных нами параметрах будет список последовательностей, наиболее эволюционно близких к искомой последовательности.

На получившейся странице можно увидеть, что достаточно большой блок последовательностей составляют различные штаммы вируса клещевого энцефалита (Tick-borne encephalitis virus), вирусы, вызывающие энцефалиты у коз и овец в странах Испании, Греции и Турции (Spanish sheep encephalitis virus, Greek goat encephalitis virus, Turkish sheep encephalitis virus), далее следует родственные вирусы, поражающие людей Омской геморрагической лихорадки (Omsk hemorrhagic fever virus), вирус распространенный в лесах Индии (Kyasanur forest disease virus), также вирус Повассан (Powassan virus) заражение которым происходит от укуса клеща, циркулирует в Канаде, вирус Лангат (Langat virus) в Малайзии и т. д.

Вернемся к интерфейсу страницы с результатом скрининга, первая цифра в строке это величина Z-score - критерий сходства между последовательностями, подробнее о Z-score можно прочитать в разделе сайта «Документация». Соответственно чем выше значение Z-score тем большее сходство имеют искомая последовательность с данной последовательностью из списка. Далее в строке приведены различные идентификаторы, которые являются ключами поиска данной последовательности во всех соответствующих биологических базах данных. Щелкнув на саму строку, вы увидите две последовательности

— первая запрошенная вами, вторая найденная. Гэпы, то есть прочерки это отсутствующие аминокислотные позиции, вставленные чтобы выровнять две последовательности по длине; буквы в верхнем

30

регистре это сходные буквы для этих последовательностей, буквы в нижнем регистре соответствуют несхожим участкам.

Сейчас мы провели с вами обзор ближайших родственников исследуемому вирусу клещевого энцефалита, а точнее вирусному белку NS3.

Но, как известно у каждого организма кроме ближайших родственников есть еще и дальние — и за множеством «ближних» найти их в обычном поиске не так-то просто.

Определить дальних родственников можно с помощью другого интересного сервиса «скрининг с кластеризацией»

5.2.2 Скрининг с кластеризацией

Этот сервис позволяет просмотреть большее количество не повторяющихся последовательностей, которые по степени сходства разбиваются на кластеры.

Итак, давайте узнаем кто же приходится дальними родственниками исследуемому сибирскому штамму вируса клещевого энцефалита.

Перейдем к сервису скрининг с кластеризацией:

1.Выберите из списка сервисов скрининг с кластеризацией

2.Напишите адрес своей электронной почты в поле Email

3.В поле «Наименование задания» напишите, например, ns3

4.Возьмите исследуемую последовательность белка NS3 (также, только аминокислоты, без идентификатора последовательности и текста описания) и вставьте в поле «Последовательность»

5.Для уменьшения времени расчетов воспользуемся параметрами, заданными по умолчанию:

Метод — blast, количество последовательностей в полученном результате — 300, количество итераций на одном шаге скрининга — 1, Evalue - 10, порог сходства для кластеризации

— 0,3

31

6.Cкомандуем «Рассчитать»

Рисунок 15: Bri-shur - пример результатов скрининга с кластеризацией

После выполнения задания в полученном вами письме перейдите по ссылке на страницу с результатом вашего запроса.

На странице с результатом мы видим несколько кластеров, щелкнув на кластер вы увидите весь список последовательностей (точное количество приведено вначале строки в круглых скобках). Последовательности разбиваются на кластеры в соответствии с заданным вами порогом кластеризации, чем выше порог тем больше кластеров вы увидите. Анализировать последовательности таким способом удобно, потому как взгляду представляется более широкий охват последовательностей. Кроме того, можно воспользоваться приведенными на странице идентификаторами специализированной базы белковых семейств Pfam и узнать принадлежность искомого вами белка к какому-либо белковому семейству.

32