
- •1 Введение
- •Подготовка рабочего места
- •2 Базы данных для биоинформатика: инструмент и результат
- •2.1 GenBank — база данных биологических последовательностей
- •2.2 Protein Data Bank - банк данных трехмерных структур белков и нуклеиновых кислот
- •2.3 PubMed — база публикаций по медицине и биологии
- •2.4 Контрольные вопросы
- •3 Программы и форматы
- •3.1 UCSF Chimera и формат PDB
- •3.2 Редактор JalView и FASTA - формат
- •3.3 Контрольные вопросы
- •4.2 Выравнивание последовательностей в MAFFT
- •4.4 Облачные вычисления — дорога в будущее
- •4.5 Контрольные вопросы
- •5 Учебная работа по моделированию пространственной структуры биологического объекта
- •5.1 Задание
- •5.1.1 Извлечение знаний (Data mining)
- •5.2 Анализ вирусного белка NS3
- •5.2.1 Скрининг по гомологии
- •5.2.2 Скрининг с кластеризацией
- •5.2.3 Построение филогенетического древа
- •5.2.4 Конструирование трехмерной структуры вирусного белка NS3
- •5.2.5 Система поиска научных статей в базе данных Медлайн
- •5.2.6 Исследование функциональных доменов вирусного белка NS3
- •5.3 Необходимое послесловие к моделированию
- •6 Список рекомендованной литературы
используются подсказки на основе ключевых фраз (мемов), выделенных в рефератах статей.
Интерфейс веб-сервисов доступен на русском и английском языках. Именно на основе сервисов данного сайта будет построена вторая часть нашего знакомства с биоинформатическими сервисами — учебная научная работа по моделированию пространственной структуры биологического объекта.
4.4Облачные вычисления — дорога в будущее
Что такое облако? Нет, мы не про те облака, что над головами, а про те, в которых производятся вычисления.
Облако — это интернет-сервис, в котором все ваши данные хранятся на удаленном сервере в Интернете и вы с ними работаете прямо там, используя мощность процессора, дисков и даже внешних устройств на серверной стороне. Облачные вычисления это перевод веб- и интернетсервисов на новый уровень, вы не только используете удаленные серверы для получения и обработки данных, но и результаты вашей работы тоже хранятся там. Самый простой пример облачного сервиса
— google docs, система работы с документами, где вы не загружаете, как обычно, текст или электронную таблицу со своего диска в программу и изменяете или создаете новый документ, а изменяете или создаете документы прямо на сервере в Интернете.
Чем это удобно для биоинформатика? Тем, что результат его работы — последовательности, аннотации, модели, статьи в конечном итоге все равно попадают в интернет-базы данных. Биоинформатик очень значительную часть данных для своей работы берет в Интернете и туда же они, обработанные и дополненные, возвращаются, потому совершенно логичным будет сразу работать в глобальной сети.
Это позволяет не заботиться о программном обеспечении на вашем компьютере, о его мощности, объеме памяти, защите. Нужен только браузер, и можно полноценно работать с маленького нетбука или смартфона, в командировках или даже экспедициях, ведь мест, где нет интернета, становится все меньше. Биоинформатика очень чувствительна к вычислительной мощности, например процессы молекулярной динамики считаются даже на современных быстрых рабочих станциях недели и месяцы. А ведь эти станции нужно купить, установить их сами и программы на них, научиться работать,
24

обеспечивать обслуживание и загрузку и. т. д. Облако же позволяет просто арендовать необходимые вычислительные мощности на нужное время, это получается гораздо дешевле и проще.
Несомненно, у облаков есть свои проблемы, например разграничение доступа и секретность, невозможность доступа к данным без интернета, но их плюсы несомненны и можно ожидать в ближайшем будущем появления виртуальных «лабораторий биоинформатика» которые можно будет арендовать для своих исследований.
Вопрос: Очень многие ученые - биоинформатики приходят в ходе своей работы к созданию новых алгоритмов, а на их основе - программ и сервисов. Обоснуйте, что более перспективно развивать в свете наступления «облачной эры» - интернетили веб-сервисы для биоинформатики?
4.5Контрольные вопросы
1.Что-такое веб- и интернет - сервисы?
2.Какие задачи решаются с помощью выравнивания?
3.В каких случаях применяется глобальное, а в каких — локальное выравнивания?
4.Какие сервисы для выравнивания вы знаете?
5.В чем преимущества облачных вычислений?
6.Что обозначает символ «*» в формате clustal?
7.Что такое множественное выравнивание?
25