
Лекция_6_БИ_М_2014
.pdf
Output - II

Output - III

Output - III

Output - III

Output IV

Статистика
выравниваний

Параметры выравнивания
•В простейшем случае есть три параметра:
–премия за совпадение (match)
–штраф за несовпадение (mism)
–штраф за делецию (indel)
При поиске близких последовательностей важна статистика
•Различие между настоящим совпадением и артефактом делается с помощью оценок вероятности, что совпадение могло быть случайным.
•Мы обсудим значение весов (scores, S) и ожиданий (e-values, E), которые ассоциируются с выравниваниями, отобранными BLAST.
68

E-value, bit score
üExpected-score (E) – Вероятность случайности выравнивания. Чем ближе к 0, тем больше вероятность, что наше выравнивание верно
üE-value (the expectation value) – оценка числа раз наблюдать хит такого же качества при таком размере базы данных (0 - e-6 –
хорошо, > 0.001 - 0.01 – плохо)
Как правило, BLAST недооценивает e-value!
• .

E-value, bit score
•Bits score – оценка выравнивания в соответствии с количеством совпадений, «похожести» и т.д.
Bit Score – мера статистической значимости (вес – сумма стоимостей всех точечных замен) выравнивания, (меньше 50 – плохо