Лекция_5_БИ_М_2014
.pdf
Построение дерева. UPGMA
Шаг 4: продолжаем.
1 |
2 |
|
|
|
|
8 |
|
|
|
|
|
||
|
|
|
6 |
|
7 |
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
4 |
1 |
2 |
4 |
5 |
3 |
|
5 |
|||||
|
|
|
|
|
|
Page 382
Построение дерева. UPGMA
Step 4: Последний кластер. Финальное дерево.
1 2
9
8
7
3 |
6 |
|
|
|
4 |
|
|
|
|
5 |
2 |
4 |
5 |
3 |
1 |
Page 382
Построение дерева. UPGMA
Особенности UPGMA – простейшего метода построения дерева.
•Деревья всегда укоренённые.
•Принимаем гипотезу равномерности скоростей накопления замен во всех ветвях («одинакового хода» молекулярных часов). Если это не верно – топология дерева может быть искажена.
•UPGMA прост и уступает в точности методу объединения соседей (neighbor-joining).
Построение дерева. neighbor-joining
neighbor-joining (Saitou and Nei, 1987) более эффективен на большом количестве таксонов.
•Сначала объединяем все таксоны в виде звезды (один общий предок).
•Выявляем ближайших соседей (1 и 2).
•Отделяем эту пару от других OTU внутренней ветвью, XY.
•На каждом последующем этапе минимизируем сумму длин ветвей.
Дистанция от X до Y dXY = 1/2(d1Y + d2Y – d12)
Page 384
Построение дерева. neighbor-joining
Neighbor Joining
Строит дерево схожее с UPGMA:
Построение дерева. neighbor-joining
13 ортологов
RBP
Page 385
Построение дерева:
–distance-based методы
–character-based методы: maximum parsimony
–characterand model-based методы: maximum likelihood
–characterand model-based методы: Bayesian
Построение дерева. Character-based методы.
Вместо подсчёта парных расстояний между последовательностями анализируют колонки аминокислот множественного выравнивания – «буквы» (characters).
Сюда относятся такие методы, как:
•maximum parsimony (экономии)
•maximum likelihood (максимального правдоподобия)
Построение дерева. Character-based методы.
Основная идея character-based методов – нахождение такой топологии дерева, которая минимизирует общую длину ветвей.
Таким образом, мы ищем наиболее экономное (“простое”) дерево.
Определяем информативные сайты. Например абсолютно консервативные сайты с точки зрения экономии неинформативны.
Строим деревья и считаем число замен необходимых для каждого. Для 12 таксонов или меньше – перебираем все возможные деревья. Для большего числа – проводим эвристический поиск.
Выбираем «кратчайшее дерево» (или деревья).
Построение дерева. Character-based методы. Maximum parsimony
Пример - четыре OTU: AAG AAA GGA AGA
Как они могли образоваться от общего предка AAA?
