Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

223996

.pdf
Скачиваний:
3
Добавлен:
15.11.2022
Размер:
668.52 Кб
Скачать

tнабл.

 

d

 

0,586

2,028

 

 

 

 

 

 

 

 

S

 

 

 

 

0,289

 

d

 

 

 

При

 

 

 

 

 

 

0,05; k n 1 7 1 6 tкр(0,05;6) 2,447.

Т.к. tнабл.

 

tкр(0,05;6) , то нулевая гипотеза принимается и можно сделать

вывод, что два сорта яровой пшеницы статистически существенно не различаются по уровню урожайности.

Пример 6. На основании испытаний двух сортов яровой пшеницы в одинаковых условиях получены следующие данные.

Таблица 11 – Урожайность двух сортов яровой пшеницы

 

Сорт

 

 

 

 

Повторения

 

 

 

 

 

 

 

1

 

2

3

4

5

 

6

7

 

8

 

 

 

 

 

 

 

 

А ( xi )

17,0

 

18,1

25,0

21,0

22,5

 

26,1

22,1

 

22,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В ( yi )

18,2

 

18,9

18,0

21,0

22,6

 

23,0

-

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

Предположим, что обе выборки взяты из независимых нормально-

распределенных

генеральных совокупностей.

При уровне

значимости

0,05 проверим нулевую гипотезу о равенстве средних урожайностей двух

сортов яровой пшеницы: Н0 : х y при Н1 : х y . Найдем выборочные средние и исправленные дисперсии по каждому сорту с помощью вспомогательной таблицы 12.

Таблица 12 – Вспомогательная таблица для расчета

 

xi

yi

 

 

 

 

 

2

 

 

 

 

 

 

 

2

№ п/п

xi х

 

 

 

yi у

 

 

 

x

х

y

i

 

у

 

 

 

 

 

 

i

 

 

 

 

 

 

 

1

17,0

18,2

-4,8

 

22,7

-2,1

 

 

 

4,3

 

2

18,1

18,9

-3,7

 

13,4

-1,4

 

 

 

1,9

 

3

25,0

18,0

3,2

 

10,5

-2,3

 

 

 

5,2

 

4

21,0

21,0

-0,8

 

0,6

 

0,7

 

 

 

0,5

 

5

22,5

22,6

0,7

 

0,5

 

2,3

 

 

 

5,4

 

6

26,1

23,0

4,3

 

18,8

2,7

 

 

 

7,4

 

7

22,1

-

0,3

 

0,1

 

-

 

 

 

 

-

 

 

8

22,3

-

0,5

 

0,3

 

-

 

 

 

 

-

 

 

Итого:

174,1

121,7

0,0

 

66,9

0,0

 

24,7

 

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

хi

 

 

 

 

 

 

хi

 

х

 

 

 

 

 

 

 

 

 

174,1

 

;

Sх

 

 

 

66,9

 

 

3,09

 

х

21,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

8

n1

1

 

 

 

 

8

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

уi

 

 

 

 

 

 

уi

 

 

у

 

 

 

 

 

 

 

 

121,7

 

;

Sх

 

 

 

 

24,7

 

2,22

у

20,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

8

n2

1

 

 

 

 

 

6

1

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как откорректированные выборочные дисперсии оказались неравные (3,09 и 2,22), то предварительно проверим нулевую гипотезу о равенстве генеральных дисперсий, используя F-критерий Фишера. Найдем отношение большей дисперсии к меньшей:

 

 

 

Fнабл.

Sб2

 

3,092

 

9,5481

1,94

(10)

 

 

 

 

 

 

 

 

 

 

 

 

Sm2

 

2,222

 

4,9284

 

 

 

 

 

 

 

 

По таблице при уровне значимости

0,05 и числе степеней свободы

k1 n 1 8 1

7 ; k2

n

1

6 1 5 Fтабл. = 4,88.

 

 

Так как

Fнабл.

<

Fтабл. ,

то нулевая гипотеза о равенстве генеральных

дисперсий принимается.

Для проверки нулевой гипотезы о равенстве двух средних независимых нормально-распределенных генеральных совокупностей с одинаковыми дисперсиями найдем наблюдаемое значение t-критерия

Стьюдента:

tнабл.

 

 

y

x

 

 

 

 

 

 

 

 

20,3 21,8

 

 

 

 

 

 

 

 

1,006

(11)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sx2 n1

1 Sy2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n2 1

 

n

n

9,5481

7

4,9284

5 8

 

6

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

6

2

8

 

6

 

 

 

 

 

 

 

n1

n2

2

 

n1

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

По условию,

конкурирующая гипотеза имеет вид

Н1 : х

 

 

y , поэтому

критическая область является двухсторонней. При уровне значимости

0,05 и числе

степеней

свободы

k1 n1

n2 2 8

6

2 12 по

таблице

Стьюдента tкр(0,05;12)

2,179.

Так как

tнабл.

tкр(0,05;12) ,

то

нулевая

гипотеза

принимается.

 

 

 

 

 

 

 

22

5.Дисперсионный анализ

Впрактике статистического анализа часто возникает вопрос –

насколько существенное влияние оказывает изменение одного или несколь-

ких факторов на изменение результативного признака. Для ответа на этот вопрос проводится дисперсионный анализ, сущность которого заключается в том, что дисперсия изучаемого признака разлагается на сумму составляющих её дисперсий (закон сложения дисперсий):

2

2

 

 

2

 

(12)

 

 

 

 

 

внутригр

 

о

межгруп

 

 

 

где о – общая дисперсия изучаемого признака;

межгруп – межгрупповая

2

 

 

 

 

 

 

2

дисперсия, вызванная влиянием фактора;

 

 

2

– средняя из внутригрупповых

 

 

 

 

внутригр

дисперсий, вызванных неучтёнными случайными причинами.

В дисперсионном анализе рассматривается гипотеза Н 0 – ни один из рассматриваемых факторов не оказывает влияния на изменчивость признака.

Алгоритм проведения расчетов:

1.Определяются необходимые суммы квадратов отклонений результативного признака, в соответствии с моделью дисперсионного анализа.

2.Находится число степеней свободы по каждому источнику вариации.

3.Рассчитываются средние квадраты отклонений.

4.Определяются наблюдаемые и критические значения критерия F-критерия Фишера, формулируются выводы относительно гипотезы Н 0 .

5.Оценивают значимость различий групповых средних по вариантам опыта.

Если Fнабл. > Fтабл. F, то делается вывод о существенности различий

результативного признака, обусловленных влиянием признака-фактора, т.е.

действие фактора на результативный признак признается статистически достоверным.

Пример 7. Оценить существенность различий в урожайности яровой пшеницы в зависимости от доз применяемых удобрений (табл. 13).

23

Таблица 13 – Урожайность яровой пшеницы в регионе

Дозы удобрений

 

Повторности

 

Сумма

Средняя

 

 

1

2

3

4

( хi )

урожайность ( xi )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Без удобрений

40

39

34

44

157

39,25

 

 

N0 P90 K60

 

 

 

56

53

52

62

223

55,75

 

 

N90 P90 K60

 

 

 

57

51

47

61

216

54,00

 

 

Сумма

х j

153

143

133

167

596

-

 

 

Средняя

 

 

 

51,00

47,67

44,33

55,67

-

49,67

 

 

 

 

 

 

 

 

урожайность ( x j )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитаем суммы квадратов отклонений (табл. 14).

Таблица 14 – Вспомогательная таблица для расчета квадратов отклонений урожайности

 

 

 

 

 

2

 

 

Дозы удобрений

 

xij

 

x

 

Сумма

 

1

2

3

4

 

Без удобрений

93,44

113,78

245,44

32,11

484,78

N0 P90 K60

40,11

11,11

5,44

152,11

208,78

N90 P90 K60

53,78

1,78

7,11

128,44

191,11

Сумма х j

187,33

126,67

258,00

312,67

884,67

Общая сумма квадратов отклонений

SS0 = 884,67 с числом степеней

свободы k0

N

1 l

n

1, l

– число уровней фактора ( l 3 ), а n – число

повторностей ( n

4 ), тогда k0

3

4 1

11.

 

 

 

 

 

 

Факторная сумма квадратов отклонений:

 

 

 

 

 

 

 

 

 

2

 

49,67)2

 

49,67 2

 

49,67 2 ) 657,17 .

SSv

n

 

xi

x

4((39,25

55,75

54

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(13)

Число степеней свободы факторное: kv

p

1

3 1

2 .

 

Остаточная сумма квадратов отклонений:

 

 

 

 

 

 

 

 

 

 

SSz

SS0

SSv

884,67 - 657,17

227,5,

(14)

а число степеней свободы k я

l

n 1

 

3(4

1)

9 .

 

 

Далее рассчитаем средние квадраты отклонений, т.е. дисперсии:

 

 

 

 

 

 

 

 

Sv2

SSv

 

 

657,17

328,59

;

 

(15)

 

 

 

 

 

 

 

 

kv

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

 

S z2

 

SSz

 

227,5

 

25,28 .

(16)

 

 

k z

9

 

 

 

 

 

 

 

Определим наблюдаемое и критическое значение критерия F-критерия

Фишера при уровне значимости

 

 

0,05 и числе степеней свободы kv 2 ,

k я 9 , Fкрит.

4,26. Наблюдаемое значение F-критерия Фишера:

 

 

Fнабл.

 

sv2

 

328,59

12,998.

(17)

 

 

s 2

25,28

 

 

 

 

z

 

 

 

 

Так

как Fнабл. > Fкрит. , то

нулевая

гипотеза о равенстве

средних

урожайностей по дозам удобрений отвергается, т.е. влияние доз удобрений на урожайность озимой пшеницы является значимым.

Для оценки существенности частных различий в средней урожайности

вычисляем:

а) среднюю ошибку средней арифметической (среднюю ошибку

опыта):

 

 

 

 

 

 

 

 

2

 

 

 

25,28

 

 

 

 

 

 

 

 

 

 

 

 

S x

 

 

z

 

 

 

2,514;

 

 

(18)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

4

 

 

 

 

 

 

 

 

 

б)

 

ошибку разности средних:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3,555;

 

 

(19)

 

 

 

 

 

Sd

S

 

 

 

2

 

2,514 2

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в)

 

наименьшую существенную разность ( HCP ,k

 

t ,k

sd ):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

 

z

 

Значение t

,k

определяется по таблице при

0,05;

k я

9 ; t0,5;9 2,26 ,

 

 

 

 

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

HCP ,k

 

t ,k

sd

2,26 3,555

 

8,0343.

 

 

 

 

 

 

 

 

 

 

 

 

z

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитаем разность в средней урожайности по дозам удобрений, взяв за стандарт урожайность яровой пшеницы без применения удобрений.

Таблица 15 – Средняя урожайность по разным дозам удобрений, ц/га

Дозы удобрений

Средняя

Разность со

урожайность, ц/га

стандартом, ц/га

 

Без удобрений

39,25

-

N0 P90 K60

55,75

16,5

N90 P90 K60

54,00

13,75

Сравнивая полученные разности с HCP , видно, что они превосходят

25

HCP . Значит, исследуемые дозы удобрений дают значимую прибавку в сред-

ней урожайности озимой пшеницы по сравнению с первым вариантом.

6.Корреляционно - регрессионный анализ

Вэкономическом анализе первостепенное значение имеет выявление связей между явлениями. Связь между явлениями или отдельными признаками может быть многообразной. Один признак выступает как фактор,

другой как результат. Признак называется факторным, если он оказывает действие на другие признаки. Признак называется результативным, если он изменяется под влиянием фактора.

Многообразие связей классифицируется по следующим группам:

- Функциональные (полные) связи – такие связи, при которых значение результатов признака определяется значением факторного признака, т.е. при изменении в каждом отдельном случае фактора результат изменяется на строго определённую величину y f x , где x – фактор; y

результат.

- Корреляционные (неполные) связи – связь, характеризующая взаимную зависимость двух случайных величин х и у, при этом изменение результативного признака (у) обусловлено не только влиянием факторного признака (х), но и прочих факторов ( ): y f x .

Корреляционно-регрессионный анализ – это совокупность статистико-

математических методов, используемых для количественного анализа связей

изависимостей между различными явлениями и процессами.

Взависимости, от числа признаков, между которыми изучается зависи-

мость, различают парную и множественную связь. Если изучается связь ме-

жду результативным признаком и двумя и более факторными признаками, то ока называется множественной.

При изучении связей между признаками устанавливают ее аналитиче-

ское выражение в виде линейного и нелинейного уравнения связи. Линейная

26

связь выражается уравнением y a bx , которое на графике имеет вид пря-

мой линии. При нелинейной зависимости применяются следующие функции:

параболическая, гиперболическая, степенная, показательная и другие.

Алгоритм проведения корреляционно-регрессионного анализа:

1.Определяется круг взаимодействующих факторов, показывающих влияние на результативный признак.

2.Для этой модели подбирается математическое уравнение, которое бы определило эту связь. Определяются параметры этого уравнения методом наименьших квадратов.

3.В прямоугольной системе координат на оси абсцисс откладывают значения факторного признака (х), на оси ординат – результативного (у).

На поле графика отмечают соответствующие индивидуальные значения признаков и по характеру их расположения судят о форме и направлении связи.

4.Производится оценка и анализ полученных результатов с использованием коэффициентов корреляции, детерминации, эластичности и других.

5.Определяются ошибки коэффициентов регрессии, а также их значимость.

6.Делаются выводы.

Параметры линейного уравнения (а и b) определяют путем составления и решения системы уравнений:

y an b х,

(20)

yх a х b х2 ,

Коэффициент регрессии (b) показывает, на сколько единиц в среднем изменяется результативный признак (у) при увеличении факторного признака (х) на единицу.

Коэффициент корреляции ( r ) характеризует направление и тесноту связи, он изменяется в пределах от -1 до 1. Если имеет место прямая связь, то

0 r 1, если обратная, то 1 r 0 . Коэффициент корреляции рассчитывается по формуле:

27

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ryx

 

 

 

 

xy

 

x y

 

 

 

 

 

 

 

 

 

 

 

(21)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xy

;

 

 

 

 

 

 

 

x

;

 

 

 

 

 

y

 

 

(22-23)

 

xy

 

x

 

 

 

 

 

y

 

 

n

 

 

 

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

2

,

 

 

 

 

 

 

 

 

 

y 2

 

 

2

(24-25)

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

x

n

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теснота связи между результативным и факторным признаком оценивается по величине коэффициента корреляции.

Атрибутивная оценка тесноты корреляционной зависимости:

до 0,3 – слабая;

0,3 – 0,5 – умеренная;

0,5 – 0,7 – связь заметная;

0,7 – 0,9 – связь тесная;

0,9 – связь весьма тесная.

Возведя коэффициент корреляции в квадрат, и выражая результат в процентах, получают коэффициент детерминации:

D

r 2 100

(26)

Он показывает насколько изменится результативный признак с

изменением факторного признака на 1%.

 

Коэффициент эластичности определяется по формуле:

 

 

 

 

 

 

 

 

Э

в

 

x

 

 

(27)

 

 

 

 

 

 

 

 

y

 

Он показывает, на сколько процентов в среднем изменится результативный признак с изменением факторного на 1 %.

Пример 6. Проанализировать влияние на урожайность зерновых культур количества осадков за май, июнь на основании следующих данных

(табл. 16). Определить форму связи между признаками, параметры уравнения регрессии, тесноту связи между признаками, исчислить коэффициенты корреляции, детерминации и эластичности. Сделать выводы.

28

Решение. Урожайность зерновых культур зависит от количества осадков за май, июнь, поэтому факторным признаком является количество осадков за май, июнь, мм (х), результативным – урожайность с 1 га, ц (у).

Таблица 16 – Урожайность зерновых культур и количество осадков, выпавших в мае, июне

 

Урожайность

Количество

 

 

 

№ п\п

зерновых с 1

осадков за май,

y x

y 2

x 2

 

га, ц ( y )

июнь ( x )

 

 

 

 

 

 

 

 

 

1

18,4

329

6053,60

338,56

108241

2

15,3

320

4896,00

234,09

102400

3

21,1

450

9495,00

445,21

202500

4

30,1

455

13695,50

906,01

207025

5

13,5

263

3550,50

182,25

69169

6

19,8

230

4554,00

392,04

52900

7

17,5

270

4725,00

306,25

72900

8

14,9

310

4619,00

222,01

96100

9

16,2

330

5346,00

262,44

108900

10

16,0

345

5520,00

256,00

119025

Итого:

182,8

3302

62454,60

3544,86

1139160

Проверку гипотезы о причинно-следственной связи между исследуемыми признаками начнем с графического метода, сущность которого заключается в построении корреляционного поля зависимости результативного признака (у) от факторного (х) (рис. 5).

ц/га

500

450

400

350

300

250

200

150

100

50

0

0

10

20

30

40

 

 

 

 

мм

Рисунок 5 – Зависимость между урожайностью зерновых культур и количества осадков в мае, июне

29

a bx .

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

На основании построенного поля можно сделать вывод о наличии прямой корреляционной зависимости между урожайностью зерновых культур и количеством осадков в мае, июне, поскольку наблюдается тенденция к увеличению из левого нижнего угла в правый верхний.

Расположение точек на графике показывает, что зависимость можно

выразить уравнением ~ y

Найдем параметры данного уравнения, составив систему уравнений,

используя данные таблицы 16 (колонки 4-6):

182,8 10а 3302в

62454,6 3302а 1139160в

Решив систему получим: а 25,41,в 0,132. Тогда уравнение связи

между урожайностью и количеством осадков примет вид: ~

y 25,41 0,132х .

Значит, при увеличении количества выпавших осадков в мае, июне на

1 мм, урожайность зерновых культур в среднем возрастает на 0,132 ц/га.

Рассчитаем коэффициент корреляции:

 

 

xy

62454,60

 

 

 

;

 

 

x

3302

 

;

xy

6245,46

x

330,2

 

 

 

 

 

 

 

 

 

 

n

10

 

n

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

182,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

18,28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

1139160

330,22

 

 

69,8853,

 

x

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

n

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

3544,86

18,282

 

4,5086,

y

 

 

 

 

 

y

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ryx

 

 

 

xy

x y 6245,46 330,2

18,28

0,664

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

y

 

 

 

 

 

 

 

69,8853 4,5086

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, между изучаемыми признаками существует прямая

заметная связь.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент детерминации составляет D

r 2

100

0,6642 100 44,09% .

Таким образом, вариация урожайности зерновых культур на 44,09%

обусловлена вариацией количества выпавших в мае, июне осадков.

Коэффициент эластичности равен Э в

 

x

 

0,132

330,2

2,384 .

 

 

 

18,28

 

 

 

y

 

 

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]