Лекция_6_БИ_М_2014
.pdf
2 стадия BLAST - SCAN
Сканирование базы данных на поиск совпадений по всем выбранным словам.
Найденные совпадения слов называются “seeds” - ядра
3 стадия поиска BLAST: EXTEND
KENFDKARFSGTWYAMAKKDPEG 50 RBP (query) MKGLDIQKVAGTWYSLAMAASD. 44 lactoglobulin (hit)
extend Hit! extend
Расширение окна выравнивания
Пересчет качества выравнивания (BLOSUM) Остановка, если скор падает ниже порогового значения
Длина слова/seed
Blastn: стандартно – 11
Blastp: стандартно – 3
Как работает BLAST?
•Качество и относительная скорость поиска программ BLAST (важные свойства при учете того, что базы данных постоянно растут) достигается с помощью подхода, при котором исходная последовательность и последовательности базы данных разбиваются на фрагменты (слова, "words"), и первоначальный поиск совпадений производится между фрагментами.
•После изначального нахождения совпадающих “слов” выравнивание расширяется по обоим направлениям с целью сгенерить выравнивание с весом, превышающим некоторое пороговое значение S.
34
Алгоритм BLAST
35
Алгоритм BLAST
36
Как работает BLAST?
Параметры
W : Размер слова (Word) – найти совпадающие слова между последовательностями
длина 2-3 для aминокислот, 6-11 для нуклеотидов.
T : Порог (Threshold) – оставить только слова с весом >T обычно 11-13
X : Потеря веса – остановить расширять выравнивание, когда потеря >X
S : Вес (Score) – Финальный вeс сегмента
Как работает BLAST?
Алгоритм:
1.Выравнивает исходную последовательность с последовательностью из базы данных.
2.Находит “хиты” (“hits”): короткие выравненные сегменты длины W без пробелов с весом не меньше T.
3.Расширяет выравнивание до тех пор, пока вес не
уменьшится на величину X от некоторого максимума, который будет обозначен как наилучший вес
Этот шаг потребляет основное время процессора (>90%)
Как работает BLAST?
Расширение сегмента вдоль выравнивания
•Прекращает расширение, когда вес выравнивания
уменьшается на X ниже полученного максимального значения
•Не рассматривает сегменты с весом < S
ASKIOPLLWLAASFLHNEQAPALSDAN
JWQEOPLWPLAASOIHLFACNSIFYAS
Score=15
Score=17
Score=14
Как работает BLAST?
Результат – ЛОКАЛЬНОЕ выравнивание
•В результате BLAST выдает набор локальных выравниваний между исходной последовательностью и различными найденными хитами
