- •Глава 1. Филогенетика 4
- •Глава 2. Макросистематика 14
- •Предисловие
- •Глава 1. Филогенетика
- •1. Филогенетика как наука. Родство через сходство
- •2. Филогенетическое древо
- •3. Признаки
- •4. Синапоморфия. Гомология
- •5. Группы
- •6. Принципы кладистики
- •7. Построение деревьев методом парсимонии
- •8. Таблицы расстояний. Построение деревьев с помощью upgma
- •Глава 2. Макросистематика
- •1. Жизнь и три её домена
- •2. Современные тенденции в систематике
- •3. Группы прокариот
- •4. Группы эукариот
- •5. Систематика Metazoa
- •6. Систематика высших растений
- •Приложение. Система, используемая на Международной Биологической Олимпиаде
- •Электронные Древа жизни
- •Рекомендуемая литература
- •Использованная литература
8. Таблицы расстояний. Построение деревьев с помощью upgma
Существуют методики реконструкции филогенеза по предварительно составленным таблицам расстояний (дистанций) между рассматриваемыми объектами: чем больше расстояние, тем меньше родство. В иных таблицах, наоборот, может быть представлены данные подобия организмов: чем больше степень подобия, тем больше родство (см. рис. 9). Важно понимать, что в большинстве случаев данные дистанции или меры подобия не имеют непосредственной биологической интерпретации, например, в количестве и качестве различий, а служат лишь условной мерой различия или сходства соответственно.
таблица расстояний (%):
|
таблица подобия (%):
|
I II III
|
||||||||||||||||||||||||||||||||
Рисунок 9. Таблицы и соответствующее им древо
|
||||||||||||||||||||||||||||||||||
Одним из простейших методов построения деревьев с использованием таблиц расстояний, является UPGMA (Unweighted Pair Group Method with Arithmetic Mean12). При наличии таблицы расстояний ixj13 объектов, где для каждой пары рассматриваемых объектов i, j определена дистанция [d(i, j)], выполняется следующий алгоритм:
Находим пару объектов i, j с наименьшей дистанцией [d(i, j) = min]14.
Объединяем их в новый кластер k (ij= k).
Перестраиваем таблицу расстояний, которая будет короче на 1 столбец и 1 строку. Для не задействованных в шаге 2 объектов (или кластеров15) предыдущие расстояния сохраняются [d(x,y)=const, x≠i, y≠j)]. Расстояния между образованным в шаге 2 кластером k и остальными объектами (кластерами) (x) рассчитывается как среднее арифметическое расстояний от сгруппированных в данный кластер объектов i, j до объекта x:
x,
k)
=
.Если кластер k не включает все объекты, то повторить 2. Если включает, то кластеризация завершена.
Рассмотрим данный алгоритм на примере. Возьмём 4 известных нам гипотетических организма: белый грустный квадратик (I) и трех фейсиков: белый грустный (II), белый весёлый (III), серый весёлый (IV). Для наглядности составим таблицу признаков, включив туда ещё несколько известных фейсикологам признаков:
табл. 0 |
I |
II |
III |
IV |
фигура |
квадрат |
круг |
круг |
круг |
улыбка |
– |
– |
+ |
+ |
цвет |
белый |
белый |
белый |
серый |
ровные глаза |
– |
+ |
+ |
+ |
4 нуклеотид в гене RitA |
G |
A |
T |
T |
Подсчитаем для каждой пары различия и занесём в таблицу дистанций:
табл.1 |
I |
II |
III |
IV |
Наименьшее расстояние между III и IV. Кластеризуем их.
|
I |
0 |
|
|
|
|
II |
3 |
0 |
|
|
|
III |
4 |
2 |
0 |
|
|
IV |
5 |
3 |
1 |
0 |
табл.2 |
I |
II |
III+IV |
I |
0 |
|
|
II |
3 |
0 |
|
III+IV |
|
|
0 |
Повторим финальную кластеризацию и построим древо:
табл.3 |
I |
II+(III+IV) |
I II III IV |
I |
0 |
|
1 се2,5 3,75
|
II+(III+IV) |
|
0 |
|
В узлах древа можно указать полученное расстояние между сестринскими группами (см. рис. 10). |
|||
Рисунок 10. Древо, построенное по UPGMA
|
|||
