Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методические указания. Лесная генетика и селекц...doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
3.54 Mб
Скачать

УДК_ _ _630*165_ _ _

Лесная генетика и селекция: Методические указания для студентов, обучающихся по специальности «Лесное и садово-парковое хозяйство» и работников лесных селекционно-семеноводческих предприятий

Составители: Данченко А. М. д-р биол. наук, профессор

Рецензенты:

(С) Томский государственный университет

ПРЕДИСЛОВИЕ

В методических указаниях приводится описание методов, которые могут оказаться полезными в практических работах по лесной генетике и селекции.

Для каждого метода подобраны конкретные примеры, помогающие выяснить его существо и назначение, а также подробно излагаются вычислительные процедуры, способствующие его практической реализации с использованием персональных электронно-вычислительных машин (ПЭВМ). Методические указание написаны в предположении, что студент знаком с основами математической статистики в пределах обычных курсов биометрии.

Предлагаемые рекомендации по применению ПЭВМ в учебном процессе для студентов, обучающихся по дисциплине «Лесная генетика и селекция» рассматривают наиболее типичные задачи селекции.

Состоит из следующих работ:

– оценка степени сходства или различия между популяциями по комплексу признаков (обобщенное расстояние Махаланобиса, критерий Животовского);

– оценка внутрипопуляционного разнообразия (показатели наследуемости количественных признаков в широком и узком смысле, индексная оценка потомства, информационная мера внутрипопуляционного разнообразия, оценка доли редких фенотипов в популяции);

– использование коэффициента наследуемости при прогнозировании эффективности селекции.

Программы, которые представлены в работе, рекомендуются для использования при выполнении лабораторных работ по лесной генетике и селекции, а также для обработки экспериментальных исследований при дипломном проектировании. Кроме того, окажут помощь специалистам лесного хозяйства, занимающихся селекцией и семеноводством.

  1. Оценка степени сходства или различия между популяциями по комплексу признаков

    1. Обобщенное расстояние Махаланобиса

В настоящее время в генетику популяции лесных древесных растений стали проникать более информативные методы многомерного статистического анализа, позволяющие выявить дивергенцию и генотипические различия популяции того или иного вида по комплексу признаков. Одним из методов выявления таких различий является применение обобщенного расстояния Махаланобиса /D/. Как показывают исследования, расстояние Махаланобиса – это действительно генетическое расстояние, не включающее в себя изменчивость под воздействием условий окружающей среды (Кукеков, Карамышев, 1978).

Алгоритм определения критерия D состоит из следующих этапов (Милер, Кан, 1965)

  1. Вычисление средних значений признаков для каждой из «m» выборок /популяции/ и их генеральных средних.

  2. Составление ковариационной матрицы, элементы которой являются обобщенными по всем популяциям оценками дисперсии и ковариации. Например, для признака «х» оценку дисперсий вычисляют по формуле:

(1.1.)

где - объем каждой из «m» выборок. Оценки ковариаций, например, для признаков «x» и «у», определяются по формуле:

(1.2)

  1. Определение нормированных величин изучаемых количественных признаков. Для этого из каждого среднего значения признаков вычитают соответствующие значения признаков вычитают соответствующее значение генеральной средней и полученную разность делят на соответствующее стандартное отклонение. Например, нормированное среднее значение признака «х» в первой популяции

(1.3)

  1. Составление матрицы оценок коэффициентов корреляции величин признаков, исходя из формулы:

(1.4)

Например,

(1.5)

  1. Преобразование нормированных средних значений признаков так, чтобы они стали независимыми и имели средние, равными нулю, а вариансы, равными 1. Для этого используют следующие уравнения:

(1.6)

(1.7)

(1.8)

(1.9)

(1.10)

Где x, y, z, g, h – изучаемые признаки. Коэффициенты вычисляют следующим образом:

(1.11)

(1.12)

(1.13)

(1.14)

(1.15)

(1.16)

(1.17)

(1.18)

(1.19)

(1.20)

(1.21)

(1.22)

(1.23)

(1.24)

(1.25)

(1.26)

(1.27)

(1.28)

Вычисляемые по формулам (1.6 – 1.10) величины , , , имеют дисперсии, не равные 1. При делении этих величин на соответствующие стандартные отклонения их дисперсии равны 1.

Преобразованное значение

и т.д.

  1. Обобщенное расстояние Махаланобиса для двух популяций А и В определяют по формуле:

(1.29)

Для проверки значимости между двумя популяциями вычисляют критерий Фишера F-критерий по формуле [10]:

(1.30)

где n – общий объем изучаемых выборок, – объем выборки одной популяции, - объем выборки другой популяции, m – число изучаемых популяций, p – число изучаемых признаков.

При этом число степеней свободы определяют по формулам:

(1.31)

(1.32)

Поясним вычисление критерия на следующем примере.

Пример 1. В 9 популяциях дуб изучалась изменчивость 5 количественных признаков: x, y, z, q, h.

Объемы выборок для всех популяций по каждому признаку были одинаковыми . В табл. 1.1. представлены средние значения анализируемых признаков.

Таблица 1.1 – Средние значения признаков в популяциях

№ популяции

1

5,870

93,400

53,100

4,820

38,500

2

5,260

92,200

49,500

5,140

32,630

3

3,570

83,700

37,700

4,790

44,320

4

5,200

90,400

46,800

5,180

36,350

5

5,610

95,600

56,900

4,860

34,180

6

5,540

97,100

51,100

4,630

37,740

7

5,700

106,800

61,200

4,670

31,750

8

3,270

78,000

43,600

4,030

44,310

9

4,610

88,700

47,900

5,600

35,870

Сумма

44,18

825,9

447,8

43,72

335,65

Генеральное среднее

4,91

91,77

49,76

4,86

37,29

Обобщенная ковариационная матрица рассчитанная по формулам 1.1 и 1.2 приведена в таблице 1.2

Таблица 1.2 – Обобщенная ковариационная матрица.

Признаки

x

y

z

q

h

X

1,0763

6,7680

4,2446

0,0486

-0,3017

Y

164,9820

90,6550

1,6320

-4,0820

Z

82,2940

1,0125

-3,3104

Q

0,4315

-0,2835

H

37,4250

Нормированное среднее значение признака «х» в популяции N1

,

Признака «у» в популяции N1 и т.д.

Значение всех вычисленных элементов сведены в табл. 1.3.

Таблица 1.3 – Нормированные средние значения признаков в популяциях

№№ популяции

1

0,926

0,126

0,368

-0,060

0,197

2

0,338

0,033

-0,028

0,426

-0,761

3

-1,290

-0,628

-1,329

-0,106

1,149

4

0,280

-0,106

-0,326

0,487

-0,153

5

0,675

0,298

0,787

0,000

-0,508

6

0,608

0,414

0,147

-0,350

0,073

7

0,762

1,170

1,261

-0,289

-0,905

8

-1,578

-1,072

-0,679

-1,263

1,147

9

-0,721

-2,239

-0,205

1,126

-0,232

Оценки коэффициентов корреляции, вычисленные по формуле (1.4):

и т.д.

Для вычислений использована табл. 1.2

Полученные оценки коэффициентов корреляции представлены в табл. 1.4

Таблица 1.4 – Матрица оценок коэффициентов корреляции.

Признаки

x

y

z

q

h

x

1

0,4704

0,4510

0,0713

-0,4375

y

1

0,7780

0,1934

-0,0619

z

1

0,1699

-0,0596

q

1

-0,0705

h

1

Значение коэффициентов а вычислены по формулам (1.11-1.27):

Подставляя значения в уравнения (1.6-1.9), получили:

, , ,

Например, для получения N1: (см. табл. 1.3), и т.д. Каждое из этих уравнений последовательно применяется ко всем 9 популяциям. Значения , , , , , для удобства дальнейших расчетов сведены в табл. 1.5.

Таблица 1.5 – Преобразованные средние значения признаков

NN

Популяции

1

0,926

-0,309

0,175

-0,063

0,262

2

0,338

-0,126

-0,089

0,425

-0,767

3

-1,290

-0,021

-0,732

0,031

0,947

4

0,280

-0,238

-0,280

0,508

-0,202

5

0,675

-0,019

0,497

-0,629

-0,382

6

0,608

0,128

-0,220

-0,426

0,065

7

0,762

0,812

0,328

-0,500

-0,774

8

-1,578

-0,329

0,272

-0,075

1,110

9

-0,721

-0,100

-0,047

1,158

-0,253

Как уже отмечалось, вычисление величины , , , имеют дисперсии, не равные 1. При делении этих величин на соответствующие стандартные отклонения, их дисперсии будут равны 1. Эти стандартные отклонения должны быть вычислены по формулам (1.14, 1.16, 1.22, 1.27). Тогда , и т.д. Например, в популяции N1 преобразованные значения , и т.д. Оценки средних преобразованных значений признаков приведены в табл. 1.6

Таблица 1.6 – Оценки средних преобразованных значений признаков

NN

Популяции

1

0,926

-0,351

0,282

-0,064

0,256

2

0,338

-0,143

-0,143

0,434

-0,746

3

-1,290

-0,024

-1,178

0,032

0,921

4

0,280

-0,269

-0,450

0,518

-0,197

5

0,675

-0,022

0,800

-0,030

-0,381

6

0,608

0,145

-0,350

-0,435

0,063

7

0,762

0,010

0,528

-0,511

-0,763

8

-1,578

-0,373

0,436

-1,098

1,080

9

-0,721

-0,114

0,076

1,183

-0,246

Эти оценки в дальнейшем используются для определения критерия D для всех пар популяций, которые представлены в табл. 1.6.

Например, для популяции N1 и N2

Аналогично определяются значения критерия Махаланобиса и для других пар популяции, которые приведены в табл. 1.7. Точкой над цифрами обозначены значимые по F-критерию различия при P = 0,05. Чем больше значение критерия Махаланобиса, тем более сравниваемые пары популяции генетически удалены друг от друга.

Таблица 1.7 – Обобщенное расстояние Махаланобиса для парных популяций

WM(1.2)=1,71

WM(5.2)=1,37

WM(1.3)=7,60

WM(5.3)=9,44

WM(1.4)=1,37

WM(5.4)=2,18

WM(1.5)=0,84

WM(5.5)=0,00

WM(1.6)=1,03

WM(5.6)=1,71

WM(1.7)=3,02

WM(5.7)=1,33

WM(1.8)=8,33

WM(5.8)=8,58

WM(1.9)=4,47

WM(5.9)=3,98

WM(2.2)=0,00

WM(6.2)=1,61

WM(2.3)=6,73

WM(6.3)=5,22

WM(2.4)=0,42

WM(6.4)=1,27

WM(2.5)=1,37

WM(6.5)=1,71

WM(2.6)=1,61

WM(6.6)=0,00

WM(2.7)=2,65

WM(6.7)=2,05

WM(2.8)=9,75

WM(6.8)=7,15

WM(2.9)=2,07

WM(6.9)=4,66

WM(3.2)=6,72

WM(7.2)=2,65

WM(3.3)=0,00

WM(7.3)=11,07

WM(3.4)=4,63

WM(7.4)=13,93

WM(3.5)=9,44

WM(7.5)=1,33

WM(3.6)=5,22

WM(7.6)=2,05

WM(3.7)=11,07

WM(7.7)=0,00

WM(3.8)=3,99

WM(7.8)=10,84

WM(3.9)=4,75

WM(7.9)=6,16

WM(4.2)=0,42

WM(8.2)=9,75

WM(4.3)=4,63

WM(8.3)=3,98

WM(4.4)=0,00

WM(8.4)=8,79

WM(4.5)=2,18

WM(8.5)=8,58

WM(4.6)=1,27

WM(8.6)=7,15

WM(4.7)=3,93

WM(8.7)=10,84

WM(4.8)=8,49

WM(8.8)=0,00

WM(4.9)=1,87

WM(8.9)=8,06

Следует отметить, что обобщенное расстояние Махаланобиса может быть использовано не только для выявления генетических различий между популяциями по их количественным признакам, но и для других целей, например, для определения степени удаленности по комплексу признаков различных генотипов и сортов (Кукетов, Карамышев, 1978). Исходя из основных положений вавиловской теории селекции, при получении гибридов наибольшим эффектом должна обладать родительская пара, составленная из особей, генетически максимально удаленных. Следовательно, критерий D может быть использован и при подборе родительских пар для гибридизации (Перфильев, Лебедев, 1980).

Применение обобщенного расстояния Махаланобиса для количественной оценки степени генетических различий имеет свои практические ограничения (Меницкий, 1971): 1) количественные признаки, используемые для сравнения выборок, должны быть случайными величинами, 2) анализируемые признаки должны иметь распределение вероятностей, близкое к нормальному.

Алгоритм расчета критерия Махаланобиса реализован в программе MAXALAN.ЕХЕ

РАЗМЕРНОСТЬ ПРОГРАММЫ: комплекс не более 5-ти признаков, число популяций – не более 20.

ПРИ ЗАПУСКЕ программы, т.е. при запуске файла MAXALAN. ЕХЕ на экране Вашего дисплея появится надпись:

ВВОД ДАННЫХ С ТЕРМИНАЛА ----- 1

ЧТЕНИЕ ДАННЫХ ИЗ ФАЙЛА ----- 2

Если Ваши данные уже записаны в файле (например, если Вы уже раньше работали с этой программой и набирали данные с клавиатуры), то необходимо нажать цифру 2 на клавиатуре – произойдет чтение данных из файла, имя которого Вы укажете в ответ на запрос с экрана: ВВЕДЕНИЕ ИМЯ ФАЙЛА (6 символов). Необходимо ввести с клавиатуры 6 символов имени файла, например FILMAX. Если Вы только собираетесь вводить свои данные с клавиатуры, то нажмите цифру 1 – компьютер готов к вводу Ваших данных, а Вы будьте готовы в ответ на запросы с экрана ввести:

- число популяции,

- число признаков,

-значение каждого признака. Введенные данные записываются в файл с именем, указанным пользователем по запросу с экрана терминала (в нашем примере – это файл FILMAX). В программе предусмотрена возможность внесения исправлений в данные непосредственно после ввода, т.е. на экране появится запрос: ХОТИТЕ ВНЕСТИ ИСПРАВЛЕНИЯ? – (Y/N)

Если исправления требуются, нужно нажать Y (Yes), появится запрос: С КАКОГО НОМЕРА ЗАПИСИ (ПОПУЛЯЦИИ)? Введите нужный номер, а затем вводите исправленные данные. В противном случае следует нажать N (No). Все расчеты в программе выполняются по формулам, приведенным в методической разработке.

ВЫВОД результатов работы программы осуществляется в файл, имя которого необходимо ввести в ответ на запрос:

ВВЕДИТЕ ИМЯ ФАЙЛА С РАСШИРЕНИЕМ. Например, можно ввести имя R_MAXALA или любое другое на Ваш выбор. Важно только, чтобы на том дисковом пространстве, на котором Вы работаете не было файла с таким же именем, т.к. в программе он описан как «новый». Номер таблиц в выходном файле соответствует номерам таблиц в методических указаниях.