- •В биологии и экологии
- •Естественно-географического факультета
- •Содержание
- •1. Пояснительная записка
- •Роль и место курса в структуре учебного плана
- •Требования к уровню освоения содержания программы
- •Тематический план и содержание курса
- •Содержание курса
- •Тема 1. Введение в биометрию
- •Литература:
- •Тема 2. Типы варьирования и составление вариационных рядов
- •Литература:
- •Тема 3. Краткая характеристика статистических показателей
- •Литература:
- •Тема 4. Вычисление важнейших параметров не взвешенного
- •Литература:
- •Тема 5. Вычисление важнейших параметров взвешенного
- •Литература:
- •Тема 6. Установление статистической достоверности различий между результатами опытов
- •Литература:
- •Тема 7. Корреляция
- •Литература:
- •Тема 8. Регрессия
- •Литература:
- •2. Материал для лекционного курса
- •Тема 1. Введение в биометрию
- •Тема 2. Типы варьирования и составление вариационных рядов
- •Тема 3. Краткая характеристика статистических показателей
- •Тема 4. Вычисление важнейших параметров не взвешенного вариационного ряда
- •К вычислению параметров не взвешенного ряда способом условной средней (даты зацветания к. Генри- a. Henryi Pax.)
- •Доверительные интервалы статистических параметров
- •Тема 5. Вычисление важнейших параметров взвешенного вариационного ряда
- •Высота растений а. Высочайшего (a. Altissima Swingle) в контроле (см)
- •Высота растений а. Высочайшего (a. Altissima Swingle) в опыте (см)
- •К вычислению моментов ряда распределений
- •К вычислению моментов ряда распределений
- •Тема 6. Установление статистической достоверности различий между результатами опытов
- •Статистические показатели морфологических признаков
- •Вычисленные и табличные значения критерия Стьюдента для средних арифметических значений морфологических признаков у сравниваемых видов
- •7. Корреляция
- •7.1.Особенности и типы корреляционной зависимости
- •7. 2. Корреляционная решетка и эмпирическая линия регрессии
- •7.3. Вычисление коэффициента корреляции для малых выборок
- •Зависимость урожая сои от высоты растений
- •Зависимость урожая сои от высоты растений
- •Зависимость урожая сои от высоты растений (к вычислению коэффициента корреляции с преобразованием имеющихся данных)
- •7. 4. Определение коэффициента корреляции для больших выборок
- •7.5. Совместное вычисление коэффициента корреляции и прямого
- •7. 6. Критерии криволинейности
- •Анализ корреляционной зависимости массы семян (у) от продолжительности вегетации (х) у сортов ячменя
- •8. Регрессия
- •8.1. Уравнение прямой линии
- •К вычислению коэффициентов прямой линии зависимости массы семян у сортов ячменя от продолжительности их вегетации
- •8.2. Уравнение множественной регрессии
- •Зависимость массы 1000 семян (у) от высоты растений (х)
- •9. Задания для выполнения лабораторно-практических работ
- •Лабораторно-практическая работа №1
- •Высоты однолетних саженцев (см) маклюры оранжевой (Maclura aurantiaca Nutt.)
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа №2
- •В виде ранжированного вариационного ряда
- •Литература:
- •Лабораторно-практическая работа №3
- •К вычислению моментов ряда распределений
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа №4
- •Опыт по выявлению эффективности контейнерного метода выращивания растений
- •Результаты инвентаризации (опыт)
- •Приживаемость растений в опыте и контроле (вариант №…)
- •Сводная таблица результатов исследования
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа № 5
- •Величины вариантов длины (х) и диаметра (у) желудей, выраженные в мм
- •Результаты замеров диаметра и длины желудей у дуба черешчатого (Quercus robur l.)
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа № 6
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа №7
- •К вычислению коэффициентов прямой линии зависимости
- •Ответить на вопросы:
- •Литература:
- •Лабораторно-практическая работа № 8 Тема: Определение коэффициентов уравнения множественной регрессии
- •Ответить на вопросы:
- •Литература:
- •10.Тесты достижений и умений Вариант 1
- •Вариант третий
- •Вариант 4
- •11. Вопросы к зачету
- •12. Основные термины и понятия
- •Список рекомендуемой литературы:
- •Приложение
- •Перевод календарных дат в непрерывный ряд (по Зайцеву, 1984)
- •Для определения достоверности коэффициента корреляции
- •241036, Брянск, Бежицкая, 14.
К вычислению коэффициентов прямой линии зависимости массы семян у сортов ячменя от продолжительности их вегетации
X |
Y |
x- Mx |
(x- Mx)2 |
y- My |
(x- Mx) (y- My) |
(y-My)2 |
90 |
47,50 |
15 |
225 |
3,777 |
+56,655 |
14,266 |
85 |
46,75 |
10 |
100 |
3,027 |
30,270 |
9,163 |
80 |
45,75 |
5 |
25 |
2,027 |
+10,135 |
4,109 |
75 |
42,85 |
0 |
0 |
-0,873 |
0 |
0,762 |
70 |
44,76 |
-5 |
25 |
1,037 |
-5,185 |
1,075 |
65 |
41,44 |
-10 |
100 |
-2,283 |
+22,83 |
5,212 |
60 |
37,0 |
-15 |
225 |
-6,723 |
+100,845 |
45,199 |
525 |
306,05 |
0 |
700 |
|
+215,55 |
79,786 |
My
и Мх –средние арифметические
рядов у и х. Мх= 525/7=75 дней;
Му=306,05/7=43,723 г.
а1=215,55/700=+0,30793; а0=43,723 – 0,30793 х 75 = 20,628.
Ошибка уравнения и точки пересечения прямой с осями координат вычисляются по ранее приведенным формулам: у = а0,
х = - (а0/а1).
Если известны
средние квадратические отклонения
рядов х и у и коэффициент корреляции
между ними, то величины коэффициентов
а1 и а0 уравнения прямой
линии, не вычисляя точек эмпирической
линии регрессии, можно определить по
формулам:
или
где а1 – коэффициент регрессии
при аргументе х; rxy
- коэффициент корреляции между
признаками х и у;
сигмы рядов у и х в исходных единицах;
sy, sx
– сигмы тех же рядов в классовых
интервалах; су и сх –
классовые интервалы рядов у и х. Свободный
член а0 вычисляется по формуле
8.2. Уравнение множественной регрессии
Аналитическим выражением многофакторных связей являются уравнения множественной регрессии. В рассматриваемом примере, предложенном Г. Н. Зайцевым о высоте растений, массе 1000 семян и урожайности сои связь между факторами оказалась недостаточно тесной (табл. 19). В данном случае целесообразно искать параметры уравнения, выражающего зависимость массы семян от двух других факторов:
где у- функция,
зависимая переменная, масса 1000 семян;
а0, а1, а2 – коэффициенты
уравнения; х – высота растений (в см) и
z- урожайность сои (в
ц/га)- независимые переменные.
Таблица 20
Зависимость массы 1000 семян (у) от высоты растений (х)
и урожайности (z) у сои (у, - теоретические значения массы семян)
х, см |
z, ц/га |
у, г |
у,, г |
х - Мх |
z - Mz |
y- My |
66 |
16 |
199 |
214,3 |
1,462 |
-4 |
-21,62 |
44 |
17 |
200 |
208,3 |
-20,538 |
-3 |
-20,62 |
77 |
15 |
210 |
216,5 |
12,462 |
-5 |
-10,62 |
63 |
20 |
212 |
220,1 |
-1,538 |
0 |
-8,62 |
62 |
19 |
217 |
218,0 |
-2,538 |
-1 |
-3,62 |
73 |
12 |
218 |
210,0 |
8,462 |
-8 |
-2,62 |
64 |
23 |
218 |
225,5 |
-0,538 |
3 |
-2,62 |
74 |
27 |
223 |
235,8 |
9,462 |
7 |
2,38 |
63 |
19 |
225 |
218,4 |
-1,538 |
-1 |
4,38 |
74 |
25 |
234 |
232,4 |
9,462 |
5 |
13,38 |
54 |
25 |
235 |
225,4 |
-10,538 |
5 |
14,38 |
43 |
25 |
235 |
221,5 |
-21,538 |
5 |
14,38 |
82 |
17 |
242 |
221,7 |
17,462 |
-3 |
21,38 |
|
|
|
|
+0,006 |
0 |
0,06 |
Для получения коэффициента уравнения множественной регрессии требуется, например, по предлагаемому способу, решить систему трех
нормальных уравнений, полученных по методу наименьших квадратов:
Для решения уравнений вычислим необходимые суммы (Табл.21).
Таблица 21
Суммы квадратов и произведений высоты, массы и урожайности
Высота, см, х |
Масса зерен, г, у |
Урожайность, ц, га |
х2 |
у2 |
z2 |
xy |
xz |
yz |
62 |
217 |
19 |
3844 |
47089 |
361 |
13454 |
1178 |
4123 |
63 |
212 |
20 |
3969 |
44944 |
400 |
13356 |
1260 |
4240 |
73 |
218 |
12 |
5329 |
47524 |
144 |
15914 |
876 |
2616 |
Продолжение табл. 21
82 |
242 |
17 |
6724 |
58564 |
289 |
19844 |
1396 |
4114 |
66 |
199 |
16 |
4356 |
39601 |
256 |
13134 |
1056 |
3184 |
44 |
200 |
17 |
1936 |
40000 |
289 |
8800 |
748 |
3400 |
43 |
235 |
25 |
1849 |
55225 |
625 |
10105 |
1075 |
5875 |
54 |
235 |
25 |
2916 |
55225 |
625 |
12690 |
1350 |
5875 |
63 |
225 |
19 |
3969 |
50625 |
361 |
14175 |
1197 |
4275 |
74 |
234 |
25 |
5476 |
54756 |
625 |
17316 |
1850 |
5850 |
74 |
223 |
27 |
5476 |
49729 |
729 |
16502 |
1998 |
6021 |
64 |
218 |
23 |
4096 |
47524 |
529 |
13952 |
1472 |
5014 |
77 |
210 |
15 |
5929 |
44100 |
225 |
16170 |
1155 |
3150 |
839 |
2868 |
260 |
55869 |
634906 |
5458 |
185412 |
16609 |
57737 |
∑ y = 2868, ∑x=839, ∑yx=185412, ∑x2=55969, ∑yz = 57737, ∑xz = 16609, ∑z2= 5458, ∑z = 260.
1.Подставим полученные суммы в выше приведенную систему уравне-ний:
(1) 2868 = 13а0 + 839а1 + 260а2,
(2) 185412 = 839а0 + 55869а1 +16609а2,
(3) 57737 = 260а0 +16609а1 + 5458а2.
2.Решим систему, состоящую из первого и второго уравнений, для чего разделим первое уравнение на 13, а второе – на 839 и вычтем из второго первое:
220,9916 = а0 + 66,589 а1+ 19,7962 а2
-
220,6154 = а0 + 64,5385 а1 + 20а2
0,3762 = 2,0515 а1 – 0,2038а2
3. Чтобы получить второе уравнение с двумя неизвестными, решим систему, состоящую из первого и третьего уравнений, для чего разделим первое уравнение на 13, а третье на 260 и вычтем из третьего первое:
222,0654 = а0 + 63,8808 а1+ 20,9923 а2
-
220,6154 = а0+ 64,5385 а1 + 20а2
1,4500= - 0,6577а1+ 0,9923 а2
4. Решим систему двух получившихся уравнений с двумя неизвестными:
0,3762 = 2,0515 а1 – 0,2038а2
1,4500= - 0,6577а1+ 0,9923 а2
для чего разделим первое из них на 2,0515, а второе – на 0,6577 и, сложив полученные уравнения, найдем а2:
0,183378 = а1 – 0,099342 а2
+
2,20465 = -а + 1,50874 а2
2,388028 = 1,409398 а2
а2 = 1,694367
5. Подставляя значения а2 в первое уравнение из системы двух уравнений (пункт 4) с двумя неизвестными, определим а1:
0,3762 = 2,0515 а1 – 0,2038 х 1,6944;
а1 = (0,3762 + 0,3453)/2,0515 = 0,3517.
6. Подставляя в первое уравнение нашей начальной системы значения а1 и а2, найдем а0:
2868 = 13а0+ 839 х 0,3517 + 260 х 1,6944;
а0 = (2868 – 295,0763 – 440,5440)/ 13 = 164,030.
7. Уравнение регрессии:
yxz = 164,030 + 0,3517x + 1,69436z.
8. Проверка: подставляя в первое уравнение начальной системы значения а0, а1 и а2, получим:
2868 + 13х 164,030 +839 х 0,3517 + 260 х 1,69436 = 2132,3900 + 295,0763 + 440,5336 = 2867,9999.
Очевидно, что коэффициенты а0, а1 и а2 определены правильно.
9. Ошибка уравнения множественной регрессии определяется по формуле:
где
- ошибка теоретических значений функции
у; ay,
ax, az
– коэффициенты уравнения множественной
регрессии; N – объем ряда;
n – число коэффициентов
уравнения, включая свободный член.
Суммы отклонений ay, ax, az вычисляются по формулам:
Пользуясь данными
табл.20, определяем средние арифметические
рядов x, y,
z по формуле
Мх = 839/13=64,5384; Му=2868/13 =220,615; Мz=260/13=20,0;
Подставляя найденные величины в формулы сумм отклонений
Определены все величины, необходимые для вычисления ошибки уравнения множественной регрессии по формуле:
Таким образом, по
уравнению уxz=
164,030 +0,3517х +1,6944z,
можно рассчитать массу 1000 семян, зная
высоту растений и урожайность сои с
ошибкой
Коэффициенты уравнения множественной регрессии можно найти и другими способами, например, через суммы квадратов и произведений отклонений от средней. При этом, несколько сокращается трудоемкость расчетов, так как позволяет оперировать с меньшими по абсолютной величине числами. Способ может применяться в любых случаях, но особенно он рекомендуется тогда, когда исходные данные представлены многозначными числами, а также когда одновременно желательно вычислить дисперсии, сигмы всех трех рядов и коэффициенты корреляции между ними. Рассмотрим технику вычисления, используя тот же пример, что и в первом способе (Табл. 22).
Таблица 22
Вычисление сумм для определения коэффициентов уравнения множественной регрессии (Зайцев, 1984)
(х-Мх)2 |
(у-Мy)2 |
(z-Mz)2 |
(х-Мх) (у-Мy) |
(z-Mz) (у-Мy) |
(х-Мх) (z-Mz) |
1 |
2 |
3 |
4 |
5 |
6 |
2,1374 |
467,42 |
16 |
-31,608 |
86,48 |
-5,848 |
Продолжение табл. 22
421,81 |
425,18 |
9 |
423,49 |
61,86 |
61,614 |
155,3 |
112,78 |
25 |
-132,35 |
53,1 |
-62,31 |
2,3654 |
74,304 |
0 |
13,258 |
0 |
0 |
6,4414 |
13,104 |
1 |
9,1876 |
3,62 |
2,538 |
71,605 |
6,8644 |
64 |
-22,17 |
20,96 |
-67,696 |
0,28944 |
6,8644 |
9 |
1,4096 |
-7,86 |
-1,614 |
89,529 |
5,6644 |
49 |
22,52 |
16,66 |
66,234 |
2,3654 |
19,184 |
1 |
-6,7364 |
-4,38 |
1,538 |
89,529 |
179,02 |
25 |
126,6 |
66,9 |
47,31 |
111,05 |
206,78 |
25 |
-151,54 |
71,9 |
-52,69 |
463,89 |
206,78 |
25 |
-309,72 |
71,9 |
-107,69 |
304,92 |
457,1 |
9 |
373,34 |
-64,14 |
-52,386 |
1721,2 |
2181,2 |
258 |
315,68 |
377 |
-171 |
1.
По данным табл. 19 вычислим средние
арифметические для трех вариационных
рядов: Му=220,62; Мх=64,538; Mz=20;
и следующие суммы (табл.21):
Найдем вспомогательные величины:
3.Коэффициент при х равен:
0,35173.
4. Коэффициент при z равен:
5.Находим свободный член уравнения множественной регрессии:
таким образом, величины всех коэффициентов практически совпадают с полученными ранее. Используя суммы из табл.21, можно вычислить сигмы всех трех рядов и коэффициенты корреляции между ними по формулам:
Коэффициенты корреляции между этими признаками совпадают с величинами коэффициентов, вычисленными другими способами.
Оценку достоверности значений коэффициентов, или, точнее, оценку достоверности их отличия от нуля, можно произвести по формулам:
где
и
-
величины критерия Стьюдента, сравниваемые
с табличными значениями, при числе
степеней свободы:
-
ошибка уравнения по формуле:
и
суммы квадратов отклонений величин x
и z;
rxz- коэффициент корреляции между рядами x и z. Величина критерия Стьюдента соответственно для коэффициентов а1 и а2 равна:
При числе степеней
свободы
и на 95% доверительном уровне t
=2,228, что больше вычисленных значений.
Следовательно, можно сделать заключение,
что масса семян сои (у) существенно не
зависит ни от средней высоты растений
(х), ни от урожайности (z).
