Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
filogenetika_23.docx
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
2.41 Mб
Скачать

8. Таблицы расстояний. Построение деревьев с помощью upgma

Существуют методики реконструкции филогенеза по предварительно составленным таблицам расстояний (дистанций) между рассматриваемыми объектами: чем больше расстояние, тем меньше родство. В иных таблицах, наоборот, может быть представлены данные подобия организмов: чем больше степень подобия, тем больше родство (см. рис. 9). Важно понимать, что в большинстве случаев данные дистанции или меры подобия не имеют непосредственной биологической интерпретации, например, в количестве и качестве различий, а служат лишь условной мерой различия или сходства соответственно.

таблица расстояний (%):

I

II

III

I

0

II

93

0

III

95

20

0

таблица подобия (%):

I

II

III

I

100

II

7

100

III

5

80

100

I II III

Рисунок 9. Таблицы и соответствующее им древо

Одним из простейших методов построения деревьев с использованием таблиц расстояний, является UPGMA (Unweighted Pair Group Method with Arithmetic Mean12). При наличии таблицы расстояний ixj13 объектов, где для каждой пары рассматриваемых объектов i, j определена дистанция [d(i, j)], выполняется следующий алгоритм:

  1. Находим пару объектов i, j с наименьшей дистанцией [d(i, j) = min]14.

  2. Объединяем их в новый кластер k (ij= k).

  3. Перестраиваем таблицу расстояний, которая будет короче на 1 столбец и 1 строку. Для не задействованных в шаге 2 объектов (или кластеров15) предыдущие расстояния сохраняются [d(x,y)=const, x≠i, y≠j)]. Расстояния между образованным в шаге 2 кластером k и остальными объектами (кластерами) (x) рассчитывается как среднее арифметическое расстояний от сгруппированных в данный кластер объектов i, j до объекта x: x, k) = .

  4. Если кластер k не включает все объекты, то повторить 2. Если включает, то кластеризация завершена.

Рассмотрим данный алгоритм на примере. Возьмём 4 известных нам гипотетических организма: белый грустный квадратик (I) и трех фейсиков: белый грустный (II), белый весёлый (III), серый весёлый (IV). Для наглядности составим таблицу признаков, включив туда ещё несколько известных фейсикологам признаков:

табл. 0

I

II

III

IV

фигура

квадрат

круг

круг

круг

улыбка

+

+

цвет

белый

белый

белый

серый

ровные глаза

+

+

+

4 нуклеотид в гене RitA

G

A

T

T

Подсчитаем для каждой пары различия и занесём в таблицу дистанций:

табл.1

I

II

III

IV

Наименьшее расстояние между III и IV. Кластеризуем их.

I

0

II

3

0

III

4

2

0

IV

5

3

1

0

табл.2

I

II

III+IV

I

0

II

3

0

III+IV

0

Повторим финальную кластеризацию и построим древо:

табл.3

I

II+(III+IV)

I II III IV

I

0

1

се

2,5

3,75

II+(III+IV)

0

В узлах древа можно указать полученное расстояние между сестринскими группами (см. рис. 10).

Рисунок 10. Древо, построенное по UPGMA

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]