Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

УМК Б ОГД 1 МатСтат 3 УЧПОС Воронов И.А

.pdf
Скачиваний:
44
Добавлен:
02.04.2015
Размер:
3.01 Mб
Скачать

Задача 2.3 [1]. Исследовалась динамика венозного давления ∆вд у 8 боль-

ных при эпидуриальной анестезии:

15, 20, 20, 25, 30, 30, 35, 55.

Выявить аномальность числа «55» в выборке для P ≤ 0,05

Критериальная статистика вычисляется по формуле

Dn

(xn M )

SD

 

В нашем случае D8 =(55-28,75)/11,66=2,25,

что больше табличного D8 =2,17 для P≤0,05

Вывод: «55» – аномально.

 

Xi

d

d2

1

15

-13,75

189,06

2

20

-8,75

76,56

3

20

-8,75

76,56

4

25

-3,75

14,06

5

30

1,25

1,56

6

30

1,25

1,56

7

35

6,25

39,06

8

55

26,25

689,06

 

M=28,75

 

SS=1087,50

 

 

 

δ2 =135,94

 

 

 

SD=11,66

 

 

 

D=2,25

 

P≤0,05

 

Dtab=2,17

Критические значения статистики Dn

Примечание: Распределение величины Dn получено Карлом Пирсоном (1857 – 1936) и Николаем Васильевичем Смирновым (1910 – 1966). В таблице приведены значения, рассчитанные Н.В. Смирновым и Ф. Граббсом в 1950 г.

21

Задача 2.4 [5]. Содержание Ca (мг%) в сыворотке крови клинически здоровых павианов гамадрилов.

13,6

12,9

12,3

9,9

12,7

11,7

10,8

10,4

10,9

10,2

14,7

10,4

11,6

11,7

12,1

10,9

12,1

9,2

10,7

11,5

13,1

10,9

12,0

11,1

13,5

11,2

13,5

10,1

14,0

10,0

11,6

12,4

11,9

11,4

12,8

11,4

10,9

12,7

13,8

13,2

11,9

10,8

11,0

12,6

10,0

10,3

12,7

11,7

12,1

13,8

12,2

11,9

11,6

10,6

11,1

10,7

12,3

11,5

11,2

11,5

12,7

10,5

11,2

11,9

9,7

13,0

9,6

12,5

11,6

9,0

11,5

12,3

12,6

12,6

12,8

12,5

12,8

11,4

12,5

12,3

14,5

12,3

12,8

11,7

12,2

12,3

11,6

12,0

13,5

12,5

11,6

11,9

12,0

11,4

14,7

11,3

13,2

14,3

13,2

14,2

Требуется: сгруппировать данные (n = 100) в вариационный ряд (упо-

рядоченные по возрастанию элементы выборки).

1. Устанавливаем величину классового интервала по формуле для выборки объемом 100 и менее единиц

 

 

 

 

 

i

 

 

xmax

 

xmin

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 3,32 lg n = 0,8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Строим таблицу.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Классы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

по уровню Ca,

8,6-9,3

 

 

9,4-10,1

 

10,2-10,9

 

11,0-11,7

 

11,8-12,5

 

12,6-13,3

 

13,4-14,1

 

14,2-14,9

 

мг%

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Срединные

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значения

9,0

 

 

9,8

 

10,6

 

11,4

 

 

 

12,2

 

13,0

 

13,8

 

14,6

 

 

классов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Частота

2

 

 

6

 

 

15

 

 

23

 

 

 

25

 

 

17

 

 

7

 

 

5

 

100

Накопленная

2

 

 

8

 

23

 

46

 

 

 

71

 

88

 

95

 

100

 

 

частота

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. С помощью MS Excel построим графики:

а) Гистограмму распределения Ca в крови (абсцисса – границы классовых интервалов; ордината – частоты вариант);

б) Кумуляту (абсцисса – значения классовых вариант; ордината – кумулированные частоты).

22

МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

Величины, отражающие все результаты измерений в распределении, называются центральной тенденцией. Тремя характеристиками центральной тенденции являются: среднее, медиана и мода. Среднее (M) – это среднее арифметическое, которое нахоится путем сложения всех результатов (Σxi ) и деления полученной суммы на количество результатов (n).

Медиана (Me) – это значение, расположенное в центре распределения и разделяющее все наблюдения на две половины. Мода (Mo) – это величина или категория, которая появляется наиболее часто. Среднее отклонение (более подробно см. ниже) вычисляют по следующей формуле:

 

 

M

x

1

 

 

xi

Номер

Возраст (xi)

 

 

 

 

 

 

X1

X4

 

 

 

n

 

 

 

 

 

 

 

3

17

 

 

 

 

 

 

 

 

 

 

Задача 2.5. Каков средний возраст женщин, участво-

5

23

 

7

18

вавших в исследовании?

Поскольку мы исключаем из

8

32

этого анализа мужчин, то должны подсчитать только те

9

22

результаты в графе возраст, которым соответствует чи-

10

20

словое значение 2 в графе пол (номера в этом анализе не

12

18

нужны; они приведены в качестве справки)

15

19

 

 

1

 

 

206

 

 

M

 

xi

22,88 .

п = 9

Σxi = 206

 

 

 

 

 

 

 

 

 

 

n

9

 

 

 

 

 

 

 

 

 

ОЦЕНКА ИЗМЕНЧИВОСТИ

Стандартное отклонение (standard deviation – SD) – это один из наиболее час-

то используемых показателей того, насколько величины отличаются от среднего. Формула для вычисления стандартного отклонения:

SD

 

1

 

(xi M )2

SS

 

.

n

 

 

n 1

 

 

1

 

Задача 2.6. Каково стандартное отклонение для количества часов, отработанных в неделю мужчинами?

Выберите из графы отработанные часы данные по мужчинам (мужчинам в графе пол соответствует числовое значение 1).

Подсчитайте для этой группы среднее арифметическое М.

Вычислите отклонение D – отнимите среднее значение от количества часов, отработанных каждым человеком D=(xi – M),

Возведите в квадрат каждую из полученных величин D2=(xi – M)2. Вычислите сумму квадратов отклонений SS = ΣD2.

Подставьте эти величины в формулу SD.

23

X1

X7

 

 

Номер

Отработанные часы (xi)

D

D2

1

38

12

144

2

15

11

121

4

30

4

16

6

35

9

81

11

20

6

36

13

30

4

16

14

30

4

16

16

10

16

256

n = 8

Σxi = 208

 

SS = 686

M

1

xi

208

26

SD

SS

 

686

9,89

 

 

 

n 1

7

n

8

 

 

 

 

 

 

 

Помимо средней арифметической нередко требуется определить сред-

нее гармоническое, квадратическое, кубическое, а так же их средневзве-

шенные значения. В приведенных ниже примерах ознакомимся с ними.

Вычисление средней арифметической способом произведений или основным

Задача 2.7 [5]. Длина тела

личинок

 

Длина

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

личинок,

 

 

D

 

 

D

 

 

 

 

 

 

 

 

 

 

 

 

 

 

щелкуна (мм), отобранных случайным спо-

 

мм

 

 

 

 

 

 

 

 

собом в посеве озимой ржи, варьировала

7

 

 

-5

 

28

 

следующим образом:

 

 

 

10

 

 

-2

 

5

 

7, 10, 14, 12, 15, 16, 12.

 

 

 

14

 

 

2

 

3

 

Используя MS Excel, определить:

 

 

12

 

 

0

 

0

 

Формулы: =СРЗНАЧ(А1:А7)

 

 

15

 

 

3

 

7

 

 

=СУММ(B1:B7)

 

 

 

 

 

 

 

 

 

 

 

16

 

 

4

 

14

 

 

=B1^2

 

 

 

 

 

 

 

 

 

 

 

12

 

 

0

 

0

 

 

=КОРЕНЬ(C8/(7-1))

 

 

 

 

 

 

 

 

 

 

M = 12

 

 

0

 

 

SS = 57

 

 

 

 

 

 

 

 

 

 

 

 

1) среднее арифметическое:

M

1

xi – простое = 12;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)дисперсию – dispersion или variance:

3)стандартное отклонение (среднеквадратическую ошибку) – standard deviation

2

 

 

SS

2

 

SS

 

 

 

 

 

n

 

или (если n<30)

 

;

 

 

 

 

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

SD

SS

 

или (если n<30) SD

 

 

SS

 

= 3,09.

 

n

 

 

n

1

 

 

 

 

 

 

 

 

 

24

Задача 2.8

[5].

На

8

10

6

10

8

5

11

7

10

6

9

7

8

7

9

11

 

 

 

свиноферме

зарегистри-

8

9

10

8

7

8

8

11

рован опорос 64 свинома-

7

10

8

8

5

11

8

10

ток. От каждой свиномат-

12

7

5

7

9

7

5

10

ки получено

следующее

8

9

7

12

8

9

6

7

количество живых

поро-

8

7

11

8

6

7

9

10

сят:

 

 

6

7

6

12

8

10

6

11

Используя MS Excel определить:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1) среднее арифметическое

M p

1

 

 

xi

pi или M p

 

xi

pi

= 8,25;

(взвешенное (Σpi=n)):

 

 

n

 

 

 

 

 

 

 

 

 

 

pi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

1

 

 

 

2

1

 

 

 

 

 

2

 

 

 

2) дисперсию (при учете весов):

p

 

 

 

 

 

(

pi xi

 

(

pi xi )

 

) = 3,46;

 

 

 

 

 

n

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

3) стандартное отклонение:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SD

 

 

 

 

p2 = 1,86.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Классы (xi)

Частоты (pi)

 

 

 

 

xipi

 

xi2

 

 

 

 

 

pixi2

 

 

 

5

 

4

 

 

 

 

 

20

 

25

 

 

 

 

 

 

 

100

 

 

6

 

7

 

 

 

 

 

42

 

36

 

 

 

 

 

 

 

252

 

 

7

 

13

 

 

 

 

 

91

 

49

 

 

 

 

 

 

 

637

 

 

8

 

15

 

 

 

 

 

120

 

64

 

 

 

 

 

 

 

960

 

 

9

 

7

 

 

 

 

 

63

 

81

 

 

 

 

 

 

 

567

 

 

10

 

9

 

 

 

 

 

90

 

100

 

 

 

 

 

 

 

900

 

 

11

 

6

 

 

 

 

 

66

 

121

 

 

 

 

 

 

 

726

 

 

12

 

3

 

 

 

 

 

36

 

144

 

 

 

 

 

 

 

432

 

 

 

n = Σpi = 64

Σxipi=528

 

 

 

 

 

Σpi xi2= 4574

 

 

Вычисление средней гармонической

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Mh

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Средняя гармоническая простая:

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

Задача 2.9 [5]. 5 доярок в течение 1 часа ручным способом надоили сле-

дующее количество молока: 10, 20, 25, 30, 20 – всего 105 л. Сколько времени затрачивает в среднем доярка на выдаивание 1 л молока?

М = 105/5 = 21 л.

Мh =5 /(1/10 +1/20 +1/25 +1/30 +1/20) = 5 /0,273 = 18,31 л

t= 60 / 21 = 2,86 мин.

t = 60/18,31 = 3,23 мин.

25

Средняя гармоническая взвешенная:

Mh

n

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

pi

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

Задача 2.10 [5].

 

 

 

 

 

 

 

 

 

 

 

Плотность колосьев ржи =

Длина колосьев

 

8

 

 

9

10

11

12

(кол-во зерен в колосе) /

Кол-во зерен в колосе

36

 

 

38

40

41

42

(длина колоса). Объем вы-

Частота (n = 20)

 

2

 

 

5

10

2

1

борки – 20 растений

Плотность колосьев

4,5

 

 

4,2

4,0

3,7

3,5

Средняя плотность колосьев в выборке:

Мh= 20 / (2×1/4,5 + 5×1/4,2 + 10×1/4,0 + 2×1/3,7 + 1×1/3,5) = 20 / 5 = 4. Сравните: М = (2×4,5 + 5×4,2 + 10×4,0 + 2×3,7 + 1×3,5) / 20 = 81/20 = 4,1.

Вычисление средней квадратической

Применяется при выражении признаков мерами площади

 

 

 

xi2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p x2

Средняя квадратическая простая

M q

 

; взвешенная M q

 

 

 

i

i

.

n

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2.11 [5].

 

 

 

 

 

 

 

 

 

 

 

 

 

Измерялся – диаметр корзинок

 

Диаметр корзинок (xi)

8

11

13

15

16

17

 

подсолнуха в см., n = 10

 

Число случаев (pi)

1

1

2

3

2

 

1

 

 

Средний размер признака

 

 

 

 

 

 

 

 

 

 

 

 

 

pi xi2

1×82+1×112

+2×132 +3×152 +2×162

+1×172

=1999. M q

1999

 

 

10

 

 

 

 

 

Сравните: М = (1×8 +1×11 +2×13 +3×15 +2×16 +1×17) / 10 = 139 /10 =

Вычисление средней кубической

Применяется при выражении признаков мерами объема.

14,1 см.

13,9 см.

 

 

x3

 

 

 

 

pi xi3

 

3

 

i

 

 

M C

3

 

 

Средняя кубическая простая M C

n

 

; взвешенная

 

n

.

 

 

 

 

 

 

 

Задача 2.12 [5]. Измерялся диаметр

яиц в мм [полусумма большого и малого диаметров], n = 18 яиц

Средний размер признака

Диаметр яиц (xi)

47

48

50

54

56

60

Число случаев (pi)

2

4

6

3

2

1

pi xi3

2×473 + 4×483 + 6×503 + 3×543 + 2×563 + 1×603 = 24397;

 

 

 

 

 

 

 

 

M C

3

 

24397

 

51 мм.

 

 

 

18

 

 

 

 

 

 

 

26

Вычисление средней геометрической

Применяется при увеличении линейных размеров тела, прироста численности популяции за определенный промежуток времени

Средняя геометрическая

 

M

g

n x x x ...x

 

 

 

 

1

2 3 n

 

обычно вычисляется с помощью десятичных логарифмов по формуле

 

 

lg M g

 

 

lg xi

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2.13 [5].

 

Возраст

 

Живая

 

Абсолютные

 

Логарифм

 

мышей

 

масса,

 

недельные

 

прибавок

 

 

 

 

 

Живая масса подопытных

 

(неделя)

 

г,

xi

 

прибавки массы, г

 

массы

мышей изменяется с возрас-

 

1

 

 

 

10

 

 

-

 

-

том. Средняя геометриче-

 

2

 

 

 

15

 

 

5

 

0,69897

ская недельных абсолютных

 

3

 

 

 

20

 

 

5

 

0,69897

прибавок массы мышей за

 

4

 

 

 

27

 

 

7

 

0,84510

первые 9 недель их жизни

 

5

 

 

 

35

 

 

8

 

0,90309

lgМg =7,58895/8 =0,94861,

 

 

 

 

 

 

 

 

6

 

 

 

46

 

 

11

 

1,04139

Мg = 8,9 г.

 

7

 

 

 

58

 

 

12

 

1,07918

 

8

 

 

 

72

 

 

14

 

1,14613

 

 

 

 

 

 

 

 

Сравните: М =77/9 = 9,6 г.

 

9

 

 

 

87

 

 

15

 

1,17609

 

Сумма

 

 

 

 

 

77

 

7,58892

 

 

 

 

 

 

 

 

Если признак варьируется не-

Возраст

Живая

 

Относительные

Логарифм

прерывно и выборка группиру-

мышей

масса,

 

недельные при-

прибавок

ется в интервальный вариаци-

(неделя)

г, xi

 

бавки массы, г,

массы

онный ряд, то

 

 

 

 

 

 

 

Q

lgQ

 

 

lg Qi

 

1

10

 

 

-

-

lg M g

 

,

2

15

 

 

1,50

0,17609

 

 

 

 

 

n 1

 

 

 

 

 

3

20

 

 

1,33

0,12385

где Qi =x2 / x1

 

 

 

4

27

 

 

1,35

0,13033

lgМg = 0,93806 / 8 = 0,1173,

5

35

 

 

1,30

0,11394

 

 

 

 

 

 

Мg = 1,310 г.

 

6

46

 

 

1,31

0,11727

 

7

58

 

 

1,26

0,10037

 

 

 

 

 

 

Сравните: Мi

=10,50/8 =1,313 г.

8

72

 

 

1,24

0,09342

9

87

 

 

1,21

0,08279

 

 

 

 

 

 

 

 

 

 

Сумма

 

 

 

10,50

0,93806

Используют также следующую формулу: lg M g

 

lg xn

lg x0

.

 

 

n

1

 

 

 

 

 

 

 

 

 

 

27

Задача 2.14 [5]. Селекция гибридного хлопчатника за 5 лет позволила уве-

личить длину волокна с 26,3 мм до 31,0 мм. Определить среднегодовой эффект.

lg M g

lg xn

lg x0

lg31,0

lg 26,3

0,07140

0,01785.

 

n

1

 

5

1

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

Мg = 0,1044мм → 10,44% →

Среднегодовой эффект: 10,44/5 = 2,1%.

 

Вычисление коэффициента вариации:

V

SD

100% .

 

M

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 2.15 [5]. На кролиководческой

3,0

2,7

2,1

 

1,6

1,2

1,6

2,2

2,1

2,3

1,5

 

1,1

2,2

2,5

2,4

 

 

 

 

 

 

 

ферме взвешивание 35 животных показа-

1,9

2,1

2,3

 

1,3

1,0

1,8

1,9

ло следующий результат:

 

 

1,8

3,2

2,1

 

2,9

3,0

1,3

1,9

 

 

 

 

 

 

2,6

1,5

2,4

 

2,7

1,9

2,0

2,6

Сравнить V двух выборок – 35 кроликов и 64 поросят (см. задачу 2.8).

 

 

Vкроликов = 27,3%,

 

Vпоросят = 22,5%.

 

 

 

Определение медианы

Медиана (Me) – средняя, относительно которой ряд распределения делится на 2 половины (в обе стороны от медианы) одинаковое количество вариант.

n

Me xMe i 2pMeps ,

где: XMe – нижняя граница интервала, в котором находится Ме или полусумма соседних классовых вариант; i – величина классового интервала; n – объем выборки; ps – число накопленных частот, стоящее перед медианным классом; pMe – частота медианного класса.

Задача 2.16

[5]. (см. Задачу 2.4) Вычислить

Ме ряда

распределения Са

(мг%) в сыворотке крови павианов гамадрилов

 

 

 

Классы по содержанию

Срединные значения

Частоты

 

Накопленные

Са в сыворотке крови

классов

(pi)

 

частоты (ps)

8,6

– 9,3

9,0

2

 

2

9,4

– 10,1

9,8

6

 

8

10,2

– 10,9

10,6

15

 

23

11,0

– 11,7

11,4

23

 

46

11,8

– 12,5

12,2

25

 

71

12,6

– 13,3

13,0

17

 

 

13,4

– 14,1

13,8

7

 

 

14,2

– 14,9

14,6

5

 

 

 

 

 

100

 

 

28

Вариант 1. i = 0,8. Величина n/2= 50 находится между ps = 46 и ps = 71. Границы интервала для (ps = 71) – 11,8 ÷ 12,5 т. е. pMe = 25.

По формуле: Ме = 11,8 + 0,8 (50 – 46) / 25 = 11,93. Вариант 2. По формуле: Ме = (11,4 + 12,2) / 2 + 0,8 (50 – 46)/25 = 11,93.

Задача 2.17 [5] (см. задачу 2.6). Вычислить Ме ряда распределения числен-

ности поросят.

 

 

Классы (xi)

 

Частоты (pi)

Накопленные частоты

Величина n/2= 32 находится

5

 

4

 

4

между

6

 

7

 

11

ps = 24 и ps = 39.

7

 

13

 

24

 

8

 

 

15

 

39

То xMe = (7+8)/2 = 7,5;

9

 

7

 

 

pMe = 15.

10

 

9

 

 

 

11

 

6

 

 

По формуле:

 

 

 

Ме = 7,5 + 1 (32 – 24)/15 =

12

 

3

 

 

 

 

 

7,5 + 0,53 = 8,03.

 

 

 

Σpi= 64

 

 

 

 

 

 

Определение моды

Мода (Mo) – наиболее часто встречающаяся, в данной выборке, величина. Класс с наибольшей частотой называется модальным.

Mo xниж

i

p2

p1

,

2 p2

p1 p3

 

 

 

где: Xниж – нижняя граница модального класса; i – величина классового интервала; p1 – частота класса, предшествующего модальному; p2 – частота модального класса; p3 – частота класса, следующего за модальным.

Задача 2.18 [5]

(см. задачу 2.4). Вычислить (используя MS Excel) Мо ряда распределения Са (мг%) в сыворотке крови павианов гамадрилов.

i = 0,8.

По формуле

Мо = 11,8 +0,8 (25-23) / (2×25-23-17) = 11,8+0,16 =

11,96.

Классы по

Срединные

Час-

Накоп-

содержанию Са

значения

тоты

ленные

в сыворотке

классов

(pi)

частоты

крови

 

 

(ps)

8,6

– 9,3

9,0

2

2

9,4

– 10,1

9,8

6

8

10,2

– 10,9

10,6

15

23

11,0

– 11,7

11,4

23

46

11,8

– 12,5

12,2

25

71

12,6

– 13,3

13,0

17

 

13,4

– 14,1

13,8

7

 

14,2

– 14,9

14,6

5

 

 

 

 

100

 

29

Хи-квадрат

Хи-квадрат (χ2) – это непараметрический статистический показатель, используемый для определения того, отличается ли наблюдаемая частота результатов от ожидаемой частоты. Поскольку для подсчета χ2 необходимы частоты, можно использовать как количественные, так и качественные переменные. Формула для χ2, где О соответствует наблюдаемой (эмпирической) частоте, а Е

ожидаемой (теоретической):

2

(O E)2

.

 

 

 

E

Степени свободы df для χ2, где R – число строк, а С – число столбцов в таблице распределения частот, находят с помощью формулы df (R 1)(C 1) .

Задача 2.19 [9]. Наблюдается ли различие между уровнем знаний женщин

и мужчин? При вычислении χ2 желательно пользоваться таблицами распределения частот, помогающими упорядочить О и Е частоты. В таблице распределения эмпирических частот подсчитываются суммы по столбцам, по строкам и общая сумма n. Чтобы подсчитать значение для каждой клетки в таблице распределения теоретических частот, умножьте сумму всей строки на сумму столбца и разделите полученный результат на общую сумму n. Затем эти величины О и Е используются в формуле для вычисления критерия хи-квадрат

Таблица распределения эмпирических частот (O)

Пол

Низкий

 

 

Высокий

 

 

Итого

Женщины

6

 

 

3

 

 

 

9

Мужчины

2

 

 

6

 

 

 

8

Итого

8

 

 

9

 

 

 

п = 17

 

 

Таблица распределения теоретических частот (E)

 

Пол

Низкий

 

 

Высокий

 

 

Итого

Женщины

(9×8)/17 = 4,24

 

(9×9)/17 = 4,76

 

 

9

Мужчины

(8×8)/17 = 3,76

 

(8×9)/17 = 4,24

 

 

8

Итого

8

 

 

9

 

 

 

п = 17

 

 

 

 

 

 

 

 

 

 

Х2

 

Х9

 

 

 

 

 

 

 

категория

 

Уровень знаний

O

Е

(O – Е)

 

(O – Е)2

(O – Е)2

Женщины

 

НИЗКИЙ

6

4,24

1,76

 

3,11

0,74

2

 

ВЫСОКИЙ

3

4,76

– 1,76

 

3,11

0,65

Мужчины

 

НИЗКИЙ

2

3,76

– 1,76

 

3,11

0,83

1

 

ВЫСОКИЙ

6

4,24

1,76

 

3,11

0,74

2

(O E)2

 

 

2,95.

 

 

 

E

В нашем примере R = 2 и С = 2; таким образом, df = 1. Чтобы определить, превышает ли полученная нами величина χ2 (2,95) желаемое критическое значение, мы обращаемся к табл. П 3.З. Критическое значение при df = 1 и уровне значимости 0,05 равно 3,84. Полученная нами величина 2,94 меньше этого критического значения; следовательно, между мужчинами и женщинами отсутствует статистически значимое различие в уровне знаний.

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]