
- •В биологии и экологии
- •Естественно-географического факультета
- •Содержание
- •1. Пояснительная записка
- •Роль и место курса в структуре учебного плана
- •Требования к уровню освоения содержания программы
- •Тематический план и содержание курса
- •Содержание курса
- •Тема 1. Введение в биометрию
- •Литература:
- •Тема 2. Типы варьирования и составление вариационных рядов
- •Литература:
- •Тема 3. Краткая характеристика статистических показателей
- •Литература:
- •Тема 4. Вычисление важнейших параметров не взвешенного
- •Литература:
- •Тема 5. Вычисление важнейших параметров взвешенного
- •Литература:
- •Тема 6. Установление статистической достоверности различий между результатами опытов
- •Литература:
- •Тема 7. Корреляция
- •Литература:
- •Тема 8. Регрессия
- •Литература:
- •2. Материал для лекционного курса
- •Тема 1. Введение в биометрию
- •Тема 2. Типы варьирования и составление вариационных рядов
- •Тема 3. Краткая характеристика статистических показателей
- •Тема 4. Вычисление важнейших параметров не взвешенного вариационного ряда
- •К вычислению параметров не взвешенного ряда способом условной средней (даты зацветания к. Генри- a. Henryi Pax.)
- •Доверительные интервалы статистических параметров
- •Тема 5. Вычисление важнейших параметров взвешенного вариационного ряда
- •Высота растений а. Высочайшего (a. Altissima Swingle) в контроле (см)
- •Высота растений а. Высочайшего (a. Altissima Swingle) в опыте (см)
- •К вычислению моментов ряда распределений
- •К вычислению моментов ряда распределений
- •Тема 6. Установление статистической достоверности различий между результатами опытов
- •Статистические показатели морфологических признаков
- •Вычисленные и табличные значения критерия Стьюдента для средних арифметических значений морфологических признаков у сравниваемых видов
- •7. Корреляция
- •7.1.Особенности и типы корреляционной зависимости
- •7. 2. Корреляционная решетка и эмпирическая линия регрессии
- •7.3. Вычисление коэффициента корреляции для малых выборок
- •Зависимость урожая сои от высоты растений
- •Зависимость урожая сои от высоты растений
- •Зависимость урожая сои от высоты растений (к вычислению коэффициента корреляции с преобразованием имеющихся данных)
- •7. 4. Определение коэффициента корреляции для больших выборок
- •7.5. Совместное вычисление коэффициента корреляции и прямого
- •7. 6. Критерии криволинейности
- •Анализ корреляционной зависимости массы семян (у) от продолжительности вегетации (х) у сортов ячменя
- •8. Регрессия
- •8.1. Уравнение прямой линии
- •К вычислению коэффициентов прямой линии зависимости массы семян у сортов ячменя от продолжительности их вегетации
- •8.2. Уравнение множественной регрессии
- •Зависимость массы 1000 семян (у) от высоты растений (х)
- •9. Задания для выполнения лабораторно-практических работ
- •Лабораторно-практическая работа №1
- •Высоты однолетних саженцев (см) маклюры оранжевой (Maclura aurantiaca Nutt.)
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа №2
- •В виде ранжированного вариационного ряда
- •Литература:
- •Лабораторно-практическая работа №3
- •К вычислению моментов ряда распределений
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа №4
- •Опыт по выявлению эффективности контейнерного метода выращивания растений
- •Результаты инвентаризации (опыт)
- •Приживаемость растений в опыте и контроле (вариант №…)
- •Сводная таблица результатов исследования
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа № 5
- •Величины вариантов длины (х) и диаметра (у) желудей, выраженные в мм
- •Результаты замеров диаметра и длины желудей у дуба черешчатого (Quercus robur l.)
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа № 6
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа №7
- •К вычислению коэффициентов прямой линии зависимости
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа № 8 Тема: Определение коэффициентов уравнения множественной регрессии
- •Ответить на вопросы:
- •Литература:
- •10.Тесты достижений и умений Вариант 1
- •Вариант третий
- •Вариант 4
- •11. Вопросы к зачету
- •12. Основные термины и понятия
- •Список рекомендуемой литературы:
- •Приложение
- •Перевод календарных дат в непрерывный ряд (по Зайцеву, 1984)
- •Для определения достоверности коэффициента корреляции
- •241036, Брянск, Бежицкая, 14.
7. 4. Определение коэффициента корреляции для больших выборок
Коэффициент корреляции для больших выборок рекомендуется вычислять по формуле:
где N-
объем выборки; fxy-совместные
частоты рядов х и у; aх
, ау –отклонения вариант рядов х
и у от условных
средних: Ах и Ау; fx-
частоты ряда х; fy
- частоты ряда у;
-
сигма ряда х;
сигма
ряда у. Отклонения вариант в рядах
вычисляются по формулам: ах = (х -
Ах)/сх; ау = (у- Ау)/
су, где х, у – варианты рядов х и
у; Ах и Ау- центральные
варианты (условные средние) рядов х и
у; сх и су – классовые
интервалы в рядах х и у.
Средние квадратические отклонения вычисляются по формулам:
,
В качестве примера, вычислим коэффициент корреляции для проверки наличия связи между массой семян и продолжительностью периода вегетации у сортов ячменя.
Таблица 14
К вычислению коэффициента корреляции между продолжительностью вегетации и массой 1000 семян ячменя
Вегетационный период, дни, х |
|||||||||||
Масса 1000 семян, г у |
57,5-62,4 |
62,5-67,4 |
67,5-72,4 |
72,5-77,4 |
77,5-82,4 |
82,5-87,4 |
87,5-92,5 |
ау |
fy |
ayfy |
a2yfy |
|
60 |
65 |
70 |
75=AX |
80 |
85 |
90 |
|
|
|
|
55-61 58 |
|
-6 1 |
-6 2 |
0 3 |
21 7 |
6 1 |
|
+3 |
14 |
42 |
126 |
49-54,9 52 |
|
-20 5 |
-16 8 |
0 10 |
22 11 |
8 2 |
12 2 |
+2 |
38 |
76 |
152 |
43-48,9 46 |
|
-14 7 |
-10 10 |
0 17 |
33 33 |
6 3 |
3 1 |
+1 |
71 |
71 |
71 |
37-42,9 40=Ay |
0 1 |
0 8 |
0 9 |
0 20 |
0 18 |
0 1 |
0 1 |
0 |
58 |
0 |
0 |
31-36,9 34 |
3 1 |
8 4 |
5 5 |
0 10 |
-5 5 |
-2 1 |
|
-1 |
26 |
-26 |
26 |
25-30,9 28 |
|
12 3 |
|
0 3 |
|
|
|
-2 |
6 |
-12 |
24 |
19-24,9 22 |
|
6 1 |
|
|
|
|
|
-3 |
1 |
-3 |
9 |
ax |
-3 |
-2 |
-1 |
0 |
+1 |
+2 |
+3 |
|
|
∑= 148 |
∑=408 |
fx |
2 |
29 |
34 |
63 |
74 |
8 |
4 |
N= |
214 |
|
|
axfx |
-6 |
-58 |
-34 |
0 |
74 |
16 |
12 |
∑=4 |
|
|
|
a2xfx |
18 |
116 |
34 |
0 |
74 |
32 |
36 |
∑=310 |
|
|
|
fxyaxay |
3 |
-14 |
-27 |
0 |
71 |
18 |
15 |
∑= 66 |
|
|
|
Вычисления производим в следующем порядке:
1. Варианты по обоим признакам разбиваются на классы и производится разноска вариант совместно обоих рядов по клеткам корреляционной решетки. Аргумент (х) располагается в горизонтальном ряду таблицы слева направо. Значения функции (у) возрастают снизу вверх.
2. Вычисляется эмпирическая линия регрессии для выяснения степени криволинейности данной связи. Если эмпирическая линия регрессии близка к прямой линии и не является двускатной, можно вычислять коэффициент корреляции, в противном случае вычисляется показатель корреляции для криволинейных связей.
3. В корреляционной таблице произвольно выбирается условный центр. Обычно это близкая к центру клетка, содержащая наибольшую частоту (в нашем примере- клетка с частотой 20 вариант). В ряду х против нее находится условная средняя Ах =75, а в ряду у –Ау =40.
4. Вычисляем условные отклонения ах: (60-75)/5 = -3; (65-75)/5= - 2; (70-75)/5 = - 1; (75-75) /5 = 0; (80-75)/5 =+1 и т.д.
Условные отклонения (ах) записываем в горизонтальной строке.
5. Также вычисляем и условные отклонения ау от условной средней Ау= 40. Условные отклонения записываем в вертикальной графе табл. 14.
6. Условные отклонения умножаем на соответствующие им частоты: ахfx = -3 x 2 = -6; -2 х 29 = - 58; -1 х 34 = -34 и т.д.; ауfу = +3 х 14 = 42; +2 х 38 = 76 и т.д.
7. Квадраты условных отклонений умножаем на их частоты: а2хfx = (-3)2 х 2 = 18; (-2)2 х 29 = 116; (-1)2 х 34 =34 и т.д.
Аналогично проводим вычисления и для вариационного ряда у: a2yfy=32 x 14= 126; 22 x 38 =152 и т.д.
8. Находим произведения условных отклонений между собой и на имеющуюся совместную для них частоту. Вычисления начинаем по столбцам слева направо;
первый столбец: axayfxy = (-3) x 0 x 1 =0; (-3) x 1 x (-1) =3;
второй столбец: (-2) х 3 х 1 = -6; (-2) х 2 х 5 = -20; (-2) х 1 х 7 = -14. Записываем результаты в правом верхнем углу соответствующих клеток табл. 14.
9. Суммируем совместные частоты по столбцам и записываем в горизонтальной строке снизу таблицы: 3; -14; -27; 0; 71; 18; 15.
10. Получаем суммы по строкам (ряд х) и по столбцам (ряд у):
∑fx=N=214; ∑axfx=4; ∑fy=N=214; ∑a2xfx=310; ∑fxyaxay= 66; ∑ayfy = 148; ∑a2yfy= 408.
11. Для проверки наших вычислений находим сигму ряда х и сигму ряда у по формулам:
,
12. Подставляя вычисленные значения в формулу коэффициента корреляции, получаем:
Для небольших
групп вариационного ряда N
< 100 ошибку коэффициента корреляции
вычисляем по формуле mz
=
,
а для больших групп N >
100 - по формуле
,
где mr-
ошибка коэффициента корреляции; r
– коэффициент корреляции; N-
объем выборки (N > 100).
Для рассматриваемого
примера mr
= (1- 0,20552) /
критерий достоверности Стьюдента:
Число степеней свободы при определении
значимости коэффициента корреляции
равно:
.
По таблице на доверительном уровне 95%
он составляет 2,0.
Ввиду того, что вычисленное значение выше табличного, можно сделать заключение о имеющейся положительной небольшой, но достоверной зависимости между массой зерен ячменя и продолжительностью вегетации.
При расчете коэффициента корреляции на ЭВМ как для малых, так и для больших выборок Г.Н.Зайцев рекомендует формулу:
где r
– коэффициент корреляции; x
– M x
– отклонения значений ряда аргумента
от его средней; у - М у - отклонения
значений ряда функции от ее средней
величины.