Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5165.pdf
Скачиваний:
6
Добавлен:
13.11.2022
Размер:
1.04 Mб
Скачать

60

L 3, следовательно, гипотеза Н0 не отвергается, а расхождения эмпирического и теоретического распределений носят случайный характер.

Задачи

8.1. В течение рабочей недели поводилось наблюдение за работой 50 станков и регистрировались неисправности, требовавшие остановки станков для их регулировки. Результаты наблюдений следующие:

Число неисправностей

0

1

2

3

4

5

Число станков

14

16

10

7

2

1

Требуется вычислить вероятности и теоретические частоты числа неисправностей, считая, что распределение последних подчиняется закону нормального распределения.

8.2. По цеху имеются следующие данные о распределении рабочих по стажу работы:

Группы рабочих

по

0 2

2 4

4 6

6 8

8 10

10 12

12 14

Итого

стажу работы (лет)

 

 

 

 

 

 

 

 

 

 

Число рабочих

 

6

8

12

24

17

8

5

80

 

 

 

 

 

 

 

 

 

 

На основе приведённых данных проверить соответствие эмпирического распределения закону нормального распределения, используя критерий согласия К. Пирсона ( = 0,01).

8.3. Результаты статистического обследования фирм, участвовавших в международной выставке, представлены в следующей таблице:

Расходы на рекламу

 

 

 

 

 

 

 

 

в % к общим

 

 

 

 

 

 

 

 

расходам фирмы

0,5 1,0

1,0 1,5

1,5 2,0

2,0 2,5

2,5 – 3,0

3,0 3,5

3,5 4,0

4,0 4,5

Количество фирм

46

123

525

228

35

28

12

3

1. Вычислим теоретические частоты, соответствующие нормальному распределению. 2. Испытаем нулевую гипотезу, состоящую в том, что распределение подчиняется нормальному закону на основе критерия χ2 с 5% уровнем значимости.

61

8.4. По данным задачи 8.3 испытайте нулевую гипотезу о том, что распределение подчиняется нормальному с помощью критериев В. И. Романовского, А. Н. Колмогорова, Б.С. Ястремского.

8.5. Распределение 1 000 семей по уровню душевого дохода за месяц характеризуется следующими данными:

Группа семей по среднедушевому Число семей

Частота

теоретического

доходу в месяц, руб.

 

 

нормального распределения

до 5 000

50

 

57

5 000

6 000

100

 

90

6 000

7 000

182

 

170

7 000

8 000

163

 

156

8 000

9 000

150

 

148

9 000

10 000

120

 

115

10 000

11 000

107

 

113

11 000

12 000

70

 

86

12 000

13 000

48

 

52

13 000 и более

10

 

13

Итого

1 000

 

1 000

На основе критерия χ2 проверьте, согласуется ли распределение семей по среднедушевому доходу с нормальным распределением с вероятностью

0,95.

8.6. По данным задачи 8.5 проверьте близость эмпирического и теоретического распределений с помощью В.И. Романовского, А.Н. Колмогорова, Б.С. Ястремского.

2.3. Проверка гипотез о связях

Для установления и оценки уровня значимости связи применяются различные статистические критерии (тесты).В качестве критериев чаще используются χ2 Пирсона, t − статистика Стьюдента, F − критерий Фишера.

Классическим тестом, используемым в тех случаях, когда данные расклассифицированы в двумерной таблице, является хи-квадрат тест, как было показано в предыдущем параграфе, 2 – это сумма квадратов разностей между фактическими и теоретическими частотами, делёнными

на теоретическую частоту с целью стандартизации:

2

 

( f f )2

 

 

.

 

 

 

 

 

f

62

Как правило, χ2 – тест применяется для анализа двух переменных, не имеющих количественного выражения, однако с успехом может быть использован и при анализе взаимосвязи количественных переменных.

Традиционно распределение двух качественных признаков задается таблицей сопряжённости. Таблица сопряжённости (таблица частот, перекрестная классификация, корреляционная таблица, комбинированная таблица) представляет собой совместное распределение двух качественных признаков, то есть величин частот или частостей наблюдений, обладающих одновременно r – значением одного и S − значением другого признака. Таблица сопряжённости двух переменных

размером r S . Обозначим:

nij

наблюдаемая частота (число объектов) в

ячейке (ij)

таблицы; nˆij − теоретически ожидаемая (по H 0 )

частота в этой

ячейке; i 1,2,...,r ; j 1,2,...,S ;

r – число строк; S

– число столбцов. Таблица

сопряжённости имеет вид (таблица 2.3.1).

 

 

 

 

Таблица 2.3.1 − Таблица сопряжённости

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

y1

 

y2

 

 

yS

 

Итого

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x1

 

n11

 

n12

 

 

n1S

 

n10

 

 

 

 

 

 

x2

 

n21

 

nr2

 

 

n2 S

 

n20

.

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xr

 

nr1

 

nr2

 

 

nrS nrs

 

nr 0 nr0

 

 

 

 

 

 

 

Итого

 

n01

 

n02

 

 

n0S

 

N

 

 

 

 

 

 

 

В таблице сопряженности представлены так называемые маргинальные частоты, образующие крайний правый столбец, а также самую нижнюю

строку, то

есть

итоги

по каждому r – значению, S – значению

соответственно.

 

 

r

 

 

 

nio nij

− сумма по i -й строке (маргинальные частоты);

j 1

 

 

 

s

 

 

 

nij nij

− сумма по j -му столбцу (маргинальные частоты);

i 1

 

 

 

s

r

r

s

nio nio

noj nij − объём выборки.

j 1

i 1

j 1 i 1

63

Выдвинутая гипотеза формулируются как H

0

: 2

0 или H

0

: n

 

nˆ

, а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ij

ij

 

альтернативная гипотеза H

1

: n

nˆ

. Критерий

2

для проверки Н

0

имеет

 

 

 

 

 

 

 

ij

ij

 

 

 

 

 

 

 

 

 

вид 2

n

nˆ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ij

 

ij

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

( j ) (i)

 

nij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где nˆ

 

nio

noj

теоретические частоты.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ij

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Число

степеней

свободы

для r s таблицы

 

сопряжённости

 

равно

df

(r 1)(s 1) . Табличное значение χ2расч. зависит от уровня значимости

и

числа

степеней свободы df (Приложение 2). Если χ2расч. χ2табл., то

гипотеза

H 0 при заданном уровне значимости отвергается. В противном

случае, т.е. когда χ2расч.< χ2табл, гипотеза принимается.

Для конкретного применения методов, основанных на χ2, необходимо обеспечить выполнение следующих условий:

1)выборку необходимо получить из независимых наблюдений;

2)ни одна из ожидаемых частот не должна быть слишком мала (минимум 5). Если частоты оказываются меньше 5, то необходимо объединить соседние категории признака или обратиться к другому критерию;

3)не имеют смысла вычисления критерия χ2 в том случае, когда таблица сопряжённости содержит ячейки с нулевым значением

наблюдаемых частот, т.к. интерпретация полученного показателя χ2 значительно усложняется.

Например. По данным опроса, 187 предпринимателей, работающих в кафе и ресторанах, относительно оценки возможностей деятельности при разных формах собственности получены следующие данные (таблица

2.3.2).

64

Таблица 2.3.2 − Исходные данные

Форма собственности

 

Оценка возможностей деятельности

Итого

 

крайне

 

Неблаго-

трудн

благо-

исключи-

 

 

неблаго

приятно

о

при-

тельно бла-

 

 

-

 

 

сказат

ятно

гоприятно

 

 

приятн

 

 

ь

 

 

 

 

о

 

 

 

 

 

 

Один владелец

20

 

18

7

15

7

67

Товарищество

6

 

6

12

13

13

50

Товарищество с ограни-

 

 

 

 

 

 

 

ченной ответственностью

12

 

17

10

25

6

70

Итого

38

 

41

29

53

26

187

Испытаем гипотезу о независимости переменных: Н0:nij nˆij . 1. Рассчитаем теоретические частоты:

- для оценки условий деятельности одного владельца

nˆ

 

38 67

13,6;

nˆ

 

41 67

14,7 и т.д.

 

 

11

187

 

12

 

187

 

 

 

 

 

 

- для оценки условий деятельности товариществ

nˆ

 

38 50

10,2;

nˆ

 

41 50

11,0 и т.д. (таблица 2.3.3).

 

 

21

187

 

22

 

187

 

 

 

 

 

 

Таблица 2.3.3 − Теоретические частоты

Форма собственности

Оценка возможностей деятельности

Итого

 

 

крайне

неблаго-

трудно

благо-

исклю-

 

 

 

неблаго-

приятно

сказать

приятно

чительно

 

 

 

приятно

 

 

 

благо-

 

 

 

 

 

 

 

приятно

 

Один владелец

13,6

14,7

10,4

19,0

9,3

67

Товарищество

10,2

11,0

7,7

14,2

6,9

50

Товарищество с огра-

 

 

 

 

 

 

ниченной

ответствен-

 

 

 

 

 

 

ностью

 

14,2

15,3

10,9

19,8

9,8

70

Итого

 

38

41

29

53

26

187

Таким было бы распределение ответов о возможностях деятельности, если бы формы собственности никак не сказывались. Задавая уровень значимости 0,05 , находим по таблице значений χ2 – критерия Пирсона

(Приложение Б). 2 ( 0,05; df (r 1)(S 1) (3 1)(5 1) 8) 15,51

65

2. Определим χ2расч., показывающим различия между фактическими и теоретическими клеточными частотами:

2расч

(nij

nˆij )2

 

20 13,6 2

 

18 14,7 2

 

7 10,4 2

15 19 2

 

7 9,3 2

 

 

nˆij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13,6

 

 

14,7

 

 

10,4

 

 

19

 

9,3

 

 

6 10,2 2

6 11 2

12 7,7 2

 

13 6,9 2

 

13 6,9 2

 

12 14,2 2

 

 

 

 

 

 

 

 

 

 

 

 

 

10,2

 

 

11

 

 

 

 

7,7

 

 

6,9

 

 

6,9

 

 

14,2

 

 

 

 

17 15,3 2

 

10 10,9 2

 

25 19,8 2

 

6 9,8 2

25,78.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15,3

 

 

10,9

 

 

 

19,8

 

9,8

 

 

 

 

 

 

 

 

 

Так

как χ2расч.>

χ2табл.,

 

H

0

отклоняется, то

 

есть форма собственности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

небезразлична для деятельности кафе и ресторанов.

Задачи

9.1. По данным опроса 540 семейных групп (семья детей – семья родителей) требуется определить, имеет ли место зависимость образования детей от образования родителей с помощью критерия χ2 ( = 0,01).

Образование матери

Образование сына или дочери

 

 

 

высшее

среднее

среднее общее

и

всего

 

специальное

неполное среднее

 

 

 

 

 

высшее

56

7

4

 

67

среднее специальное

34

40

6

 

80

среднее общее

49

23

17

 

89

неполное среднее

68

98

138

 

304

Всего

207,0

168,0

165,0

 

540

9.2. По одному из факультетов имеются следующие данные о распределении 600 студентов-заочников по двум признакам − характеру работы и результатом сдачи экзаменов по специальным предметам:

Характер работ

 

 

Сдавшие сессию без

Получившие

Всего

 

 

 

неудовлетворительных

неудовлетворитель-

студентов

 

 

 

оценок

ные оценки

 

Работающие

 

по

270

50

320

профилю факультета

 

 

 

 

Работающие

не

по

150

130

280

профилю факультета

 

 

 

 

Всего студентов

 

 

420

180

600

Определить, случайно или неслучайно распределение в таблице, то есть сделать вывод о наличии или отсутствии зависимости успеваемости студентов-заочников от соответствия профиля работы с помощью критерия χ2 ( = 0,05).

66

9.3. Предположим, имеется следующее распределение 100 опытных участков (под овощной культурой) по двум признакам: степени полива и уровню урожайности

Полив

 

Урожайность

 

Итого

 

высокая

 

средняя

низкая

 

Обильный

40

 

10

5

55

Средний

20

 

7

3

30

Слабый

-

 

5

10

15

Итого

60

 

22

18

100

С помощью критерия χ2

 

проверить случайно или неслучайно данное

распределение, т.е. установить существует ли зависимость между поливом и урожайностью ( = 0,05).

9.4. Проверить гипотезу на независимость с помощью критерия χ2 ( = 0,1) между возрастом и социальным положением основных категорий потенциальных эмигрантов по следующим данным:

Основные категории

Возраст, лет

 

 

Все

потенциальных

до 30

30 40

40 50

50 и более

го

эмигрантов

 

 

 

 

 

 

 

 

 

Руководители

5

30

39

26

100

Рабочие

21

38

28

13

100

Итого

26

68

67

39

200

9.5. Фирма специализирующаяся по продаже недвижимости, зарегистрировала следующие данные относительно первоначально назначенной цены и срока продажи квартиры в днях:

Начальная цена (руб.)

Дни до продажи

 

 

 

 

 

до 30

 

30 60

60 90

свыше 90

2 000 000

– 3 000 000

50

 

25

15

10

3 000 000

5 000 000

20

 

70

80

80

5 000 000

и более

30

 

50

60

50

Проверить гипотезу о независимости срока продажи от начальной цены при = 0,05 с помощью критерия χ2.

2.4.Проверка гипотез о средней и о доле

Встатистической практике наиболее часто проверяются два вида гипотез о средних величинах:

1) гипотеза о равенстве средней величины установленному нормативу;

Н1 : х 2.

67

2) гипотеза о равенстве средних значений признака двух совокупностей.

Предположим, что проверке подлежит гипотеза о среднем значении признака в генеральной совокупности Hо : х а . Альтернативная гипотеза может быть сформулирована следующим образом: H1 : х а , H1 : х а или

H1: х а .

В качестве критерия в этом случае целесообразно использовать нормированное отклонение выборочной средней от заданной величины:

t

 

 

x a

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где – средняя квадратическая ошибка выборочной средней, то есть средняя

ошибка выборки.

При большом объёме выборки ( n ≥ 30) рассчитывается по формуле

 

2

 

 

2

 

 

 

 

, а при n<30 – по формуле

 

 

.

 

n

 

 

n

1

 

Если полученное по результатам обследования расчётное значение t − статистики меньше табличного, т.е. tрасч < tтабл. , то гипотеза не отклоняется. В противном случае нулевую гипотезу следует отклонить.

Например. При оценке влияния изменений в налоговой политике на платёжеспособность предприятий одного из регионов установлено, что до указанных изменений средний коэффициент покрытия по этим предприятиям соответствовал нормативу, равному 2. После внесения изменений в действующую налоговую систему было проведено выборочное обследование 49 предприятий региона, в результате которого установлено, что средний коэффициент покрытия на них составил 1,7 при среднем квадратическом отклонении 0,6.

Выдвинутая нулевая гипотеза состоит в том, что изменения в проводимой налоговой политике существенно не повлияли на платёжеспособность предприятий региона, то есть коэффициент покрытия остался на прежнем уровне Hо : х 2 . В качестве альтернативной может быть рассмотрена гипотеза о том, что указанные изменения повлияли на степень платёжеспособности предприятий:

68

Для проверки выдвинутой гипотезы примем уровень значимости0,05 . Так как вероятность Р х 2 t ) 0,05 , а n>30, то для значения

 

 

 

 

 

 

 

 

1

 

 

t

 

t 2

 

 

 

 

 

 

 

 

 

 

 

е

 

 

 

 

 

 

интеграла вероятностей Лапласа

 

 

 

 

 

2 dt 0,95 находим табличное

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

значение t-статистики: t=1,96 (Приложение Г).

 

 

 

 

~

a

 

 

 

~

a

 

 

 

1,7 2

 

 

 

 

 

 

 

 

 

 

 

 

tрасч.=

 

x

 

 

 

x

 

 

 

 

3,5 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

0,36

 

 

 

 

 

 

 

 

 

n

 

 

 

 

49

 

 

 

Так как tрасч > tтабл. , то выдвинутая гипотеза отклоняется, т.е. изменения в налоговой системе повлияли на платёжеспособность предприятий региона.

Для того чтобы сделать более определённый вывод о характере этих изменений, альтернативную гипотезу сформулируем следующим образом: изменения в налоговой системе привели к снижению платёжеспособности

предприятий региона, т.е. H1 :

х 2 .

Зададим для этого случая уровень

значимости α=0,05. Вероятность

Р( х 2 -tμ)=0,05, следовательно, значение

интеграла вероятностей Лапласа в пределах от – t до 0 равно

1

0

 

t 2

1

 

 

e

 

dt

0,05 0,45 ,

 

2

 

 

 

 

 

 

 

2

2

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

а в пределах от – t до + t соответственно 0,45 · 2 = 0,9. По таблице находим для данной вероятности значение t – статистики: t=1,65. Так как tрасч > tтабл. (3,5 > 1,65), то нулевая гипотеза должна быть отклонена, т.е. с вероятностью 0,95 можно считать, что изменения в налоговой системе привели к снижению платёжеспособности предприятий региона.

Если для проверки выдвинутой гипотезы используется малая выборка, то значение t − статистики определяется с помощью распределения Стьюдента.

Например. Часовая выработка забойщика при добыче угля в шахте по норме составляет 400 кг. Фактическая выработка соответствовала норме. При переходе в новый забой условия работы забойщиков усложнились. Для проверки обоснованности нормы в новых условиях был проведён учёт работы 9 забойщиков. Их средняя часовая выработка составила 388 кг с

2=171.

69

Выдвигается гипотеза о том, что норму выработки пересматривать не нужно. Следовательно, Н 0: х =400 кг. Проверку этой гипотезы проведём с 5%-м уровнем значимости. Поскольку выборка малая, отыскиваем t в таблице распределения Стьюдента при доверительной вероятности 0,95 (1 − 0,05) с числом степеней свободы df n 1 9 1 8 (Приложение Д).

Табличное значение tтабл. ( 0,05; df 8) 2,3060 .

Расчётное значение tрасч вычисляем по приведённой выше формуле:

 

 

 

~

а

 

 

 

 

 

388 400

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tрасч.=

 

 

х

 

 

 

 

 

 

 

2,6 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

171

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9 1

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

Поскольку tрасч > tтабл. (2,6 >2,3), выдвинутая гипотеза отвергается. Норма выработки в новых условиях должна быть пересмотрена, так как производительность труда в усложнённых условиях существенно ниже нормального.

Гипотеза о средних может принимать форму гипотезы о связи признаков, если сопоставляются две средние величины, одна из которых была получена при условии действия испытуемого фактора, а другая без него.

Одну из средних принимают за гипотетическую, а другую за эмпирическую. Нулевая гипотеза может быть сформулирована следующим

~

~

 

 

 

 

~

~

 

образом: Н0= х1 х2 . Альтернативная гипотеза

 

Н1: х1

х2 . Для проверки

Hо проводится выборочное обследование,

при котором объём из первой

выборки составляет n1 , а из второй

n2 . Обозначим соответствующие

значения средних

 

~

 

и

~

 

 

2

2

в этих выборках через х

1

х

2

, дисперсии ~ и

~ . В

 

 

 

 

 

 

х1

х2

качестве критерия при проверке этой

гипотезы принимается t-статистика,

расчётное значение которой по результатам выборочного обследования

 

 

 

 

 

 

 

 

 

~

~

 

 

 

 

 

 

 

 

 

 

 

 

 

определяется по формуле tрасч.=

 

 

х1 х2

 

 

,

 

 

 

 

~

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х1

х2

 

 

 

 

 

 

 

 

 

 

 

 

 

~

~

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

где ~

~

х1

 

x2

 

стандартная ошибка разности выборочных средних.

 

 

х1

х2

n1

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Стандартная ошибка разности двух выборочных средних имеет вид

70

 

 

 

2

 

2

 

 

2

 

(n n

 

)

 

 

 

 

 

 

 

 

 

 

 

~ ~

 

 

x

 

x

x

1

2

 

 

хi x2

 

n1

n2

 

 

 

n1n2

 

 

 

 

 

 

 

 

 

 

 

2

2

)(n

n

 

)

 

(n ~

n ~

2

.

1 х1

2 х2

1

 

 

(n1 n2 2) n1 n2

 

 

 

~

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

Тогда tрасч. примет вид tрасч.=

 

 

x1

x2

 

 

 

n1 n2

n1n

2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n ~

n ~

 

 

 

 

 

 

 

n n

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

 

 

 

1 x1

 

2 x2

1

2

 

 

 

Сравнивая расчётное значение t-статистики с табличным (Приложение Д) при заданном уровне значимости, можно сделать вывод о необходимости согласиться с выдвинутой гипотезой или отклонить её.

Например. Для оценки влияния формы собственности на платёжеспособность предприятий отрасли проведено выборочное обследование частных и государственных предприятий, в результате которого получены данные, приведённые в таблице 2.4.1.

В качестве нулевой выдвинем гипотезу о независимости степени платёжеспособности предприятий от формы собственности, то есть о

равенстве коэффициентов покрытия на

предприятиях указанных

форм

~

~

~

~

. При

собственности: Н0: х

х . Альтернативной

гипотезой будет Н0: х

х

1

2

1

2

проверке выдвинутой гипотезы примем уровень значимости α=0,05.

Таблица 2.4.1 − Выборочное обследование частных и государственных предприятий отрасли

Форма

Число

Средний

Дисперсия в

собственности

обследованных

коэффициент

выборочной

 

предприятий ni

~

2

 

покрытия хi

совокупности ~

 

 

 

xi

Частная

16

1,8

0,25

Государственная

10

1,2

1,18

Определим по формуле расчётности значение t-статистики:

 

 

 

~

 

~

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

16 10 2

 

 

 

 

 

 

 

tрасч.=

 

 

x1 x2

 

 

n1 n2

 

n1n2

 

 

 

1,8

1,2

 

 

16 10

1,83 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16 0,25 10 1,18

 

 

 

 

 

 

 

n ~

 

n ~

n

n

 

 

 

 

 

 

16 10

 

 

 

 

 

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

x1 2 x 2

1

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табличное

 

 

значение

 

 

 

найдём

 

на основе

распределения

Стьюдента

 

 

при

α=0,05

 

 

 

 

и

числе

 

 

 

степеней

свободы

df (n1 1) (n2

1) n1 n2 2 16 10 2 24

 

 

(Приложение

Д)

tтабл.( 0,05; df

24 )=2,063

9.

 

Расчётное

 

значение t-статистики меньше

табличного,

следовательно,

с

вероятностью

0,95 можно

считать, что

71

платёжеспособность предприятий не зависит от принятой на них формы собственности.

Выдвинутую гипотезу можно проанализировать иначе. Зная величину

среднеквадратической ошибки разности двух выборочных средних ~ ~ ,

хi x2

можно с заданной вероятностью указать предел возможных расхождений

двух выборочных средних ~ ~

=t ~ ~ где t-табличное значение критерия

хi x2

хi x2

Стьюдента.

Например. Воспользуемся данными предыдущего примера (таблица 2.4.1.). Определяем среднеквадратическую ошибку разности двух выборочных средних:

 

 

 

 

 

 

2

 

2

)(n

n )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n ~

n ~

 

 

 

(16 0,25 10 1,18)(16 10)

 

 

 

 

~ ~

1

x1

2

x2

1

2

 

 

 

 

 

0,33 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

хi x2

 

 

(n1

n2

2) n1n2

 

 

 

 

 

 

(16 10 2) 16 10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предельная ошибка разности двух выборочных средних:

 

 

 

 

 

 

 

 

 

 

~

~

t

табл

~

~ =2,06·0,33=0,680

 

 

 

 

 

 

 

 

 

 

 

 

x1

x2

 

 

 

x1

x2

 

 

 

 

 

tтабл( 0,05; df 24 )=2,06 (Приложение Д).

 

 

 

 

Поскольку

 

фактическая

 

разность

двух средних

составляет

~

~

 

1,8

1,2

0,6 ,

то нулевая

 

 

гипотеза

подтверждается

(0,6<0,68) и

 

 

 

х1

х2

 

 

 

можно утверждать с вероятностью 0,95, что платёжеспособность не зависит от формы собственности предприятий.

Аналогично два вида гипотез могут проверены и для доли:

1)гипотеза о равенстве доли единиц, обладающих определённым признаком с нормативом;

2)сравнение долей единиц, обладающих определённым признаком, в двух совокупностях.

Порядок гипотез первого вида аналогичен порядку, приведённому для средней, то есть проверяется гипотеза H 0 : p a , где p − доля единиц,

обладающих изучаемым признаком в генеральной совокупности; a – норматив. Альтернативными могут быть гипотезы трёх видов:

1) H1 : p a ; 2) H1 : p a ; 3) H1 : p a .

В качестве критерия может быть принято значение t-статистики.

Расчётное значение величины t определяется по формуле t расч.

 

 

w a

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

w

72

где w – доля изучаемого признака в выборке; μw – средняя ошибка выборки для доли.

Для выборки большого объёма w

 

w(1 w)

 

,

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

для малой выборки w

w(1 w)

.

 

 

 

 

 

 

 

 

 

n 1

 

 

 

Табличное значение t-статистики как для доли, так и для средней, находится на основе интеграла вероятностей Лапласа (Приложение Г) или по распределению Стьюдента (для малой выборки) (Приложение Д).

Например. Партия изделий принимается, если доля бракованных не превышает 2%. Среди случайно отобранных 1 000 изделий 40 оказались бракованными. Можно ли при уровне значимости 0,01 принять партию?

Выдвигается нулевая гипотеза H 0 : w 0,02 . В качестве конкурирующей принимается альтернативная гипотеза H 0 : w 0,02 .

Находим относительную частоту брака в выборке: w=

m

 

 

40

0,04 .

n

1 000

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассчитываем среднюю ошибку выборки для доли:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w =

w(1 w)

=

 

0,04(1 0,04)

=0,006 2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

1 000

 

 

 

 

 

 

 

Определим t расч.

 

 

w a

 

 

=

 

 

0,04 0,02

 

 

 

=3,23.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

0,006 2

 

 

 

 

 

 

 

 

 

 

 

 

Табличное значение t-статистики находим на основе интеграла

вероятностей Лапласа (Приложение

Г).

 

Так как

вероятность

 

 

 

 

 

1

 

t

t 2

 

 

w 0,02

 

t ) 0,01

( 0,01), то Ф(t)=

 

e

 

 

 

P(

 

 

2 dt 0,99 ,

а значение

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

tтабл.=2,68.

Поскольку tрасч.> tтабл, то выдвинутая гипотеза отклоняется, т.е. партию изделий принять нельзя.

При сравнении долей единиц, обладающих определённым признаком, в двух совокупностях применяется схема, аналогичная приведённой ранее для проверки соответствующей гипотезе о средней.

m2 – частота появления изучаемого признака в каждой из двух

73

В качестве критерия используется t-статистика. Расчётное значение

критерия определяется по формуле t

расч.

 

 

 

w1 w2

 

 

,

 

 

 

 

 

 

 

w1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

2

 

 

 

где w1 и w2 – доля единиц, обладающих изучаемым признаком в сравниваемых выборках;

w1 w2 – стандартная ошибка выборки.

Стандартная ошибка выборки может быть рассчитана по формуле

 

 

 

 

 

 

 

 

w1 w2

 

p(1 p)(

1

 

1

) ,

 

 

 

 

 

n1

n2

где p – доля признака в генеральной совокупности; n1 и n2 − объём каждой их двух выборок.

Так как при проверке нулевой гипотезы величина p неизвестна, то можно использовать её оценку, полученную по результатам выборочного обследования:

p

m1 m2

 

w1n1 w2 n2

,

 

 

 

n n

2

 

n n

2

 

1

1

 

где m1 и выборок.

Сравнивая расчётное и табличное значение t-статистики делают вывод об отклонении или принятии нулевой гипотезы. Если tрасч.>tтабл. гипотезу отклоняют, и наоборот.

Например. По результатам выборочного обследования домохозяйств двух областей Дальневосточного региона были получены данные о доле доходов от предпринимательской деятельности в источниках доходов домохозяйств (таблица 2.4.3).

Таблица 2.4.3 − Выборочное обследование домохозяйств

Номер области

Количество обследованных

Удельный вес доходов от предпри-

 

домохозяйств (в тыс.шт.), ni

нимательской деятельности (%), wi

 

 

 

1

15,2

7,0

2

13,5

7,5

74

Можно ли считать несущественными различиями в доле доходов от предпринимательской деятельности в источниках доходов домохозяйств двух областей?

Нулевая гипотеза заключается в том, что отсутствуют существенные различия в доле новых видов доходов, традиционных для рыночной экономики ( H 0 : w1 w2 ). Тогда в качестве оценки генеральной доли будет использоваться средняя взвешенная из долей, полученных по результатам выборочных обследований каждой области:

р

w1n1 w2n2

 

0,07 15,2 0,075 13,5

 

2,076 5

0,072 4 ,

n1 n2

15,2 13,5

28,7

 

 

 

 

то есть оценка доли дохода от предпринимательской деятельности в генеральной совокупности составляет 7,24%. Ошибка разности двух долей при справедливости нулевой гипотезы будет рассчитываться по формуле

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

w1 w2

 

p(1 p)(

1

 

1

) = 0,072 4 0,927 6(

 

) 0,003 05 .

n1

 

15 200

13 500

 

 

 

 

n2

 

 

 

Таким образом, средняя квадратическая ошибка разности двух выборочных долей составляет 0,305%.

Поскольку обе выборки достаточно большого объёма, можно воспользоваться таблицей нормированной функции Лапласа (Приложение Г) для определения значения коэффициента доверия t при вероятности 0,95 и 0,99. Соответствующие этим значения tтабл. равна 1,96 и 2,58.

Расчётное значение t-критерия, равное отношению разности двух выборочных долей, составит.

t расч.

 

w1

w2

 

=

 

 

0,070 0,075

 

 

1,64 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

w

 

 

0,00305

 

 

 

 

1

2

 

 

 

 

 

 

 

 

Поскольку расчётное значение tрасч.<tтабл. как при α=0,05 и при α=0,01, нулевая гипотеза не отвергается и делается заключение о несущественности различий доли доходов от предпринимательской деятельности в источниках доходов домохозяйств двух областей.

Можно было определить и максимальную возможную величину расхождений двух выборочных долей с заданной вероятностью:

w1 w2 t w1 w2 .

75

При вероятности 0,95 w1 w2 =1,96·0,003 05=0,005 98. При вероятности

0,99 w1 w2 =2,58·0,003 05=0,007 87. Поскольку фактическая разность двух выборочных долей 0,005 (0,075-0,070) меньше найденных предельных ошибок, можно принять нулевую гипотезу.

Таким образом, оба варианта проверки гипотезы о несущественности различий доли доходов от предпринимательской деятельности по результатам выборочных обследований в двух областях доли один и тот же результат.

Задачи

10.1. Крупная торговая фирма желает открыть в новом районе города филиал. Известно, что в прошлом году фирма работала прибыльно при еженедельном среднем доходе жителей района 14 700 рублей. Цена на продукцию фирмы в связи с инфляцией возросла. Для проверки работы фирмы в новых условиях было проведено выборочное обследование 100 жителей района. Их средний еженедельный доход составил 4 750 рублей с дисперсией 400. Определите, будет ли фирма работать прибыльно, если уровень дохода жителей района останется на уровне прошлого года ( = 0,01).

10.2. Предположим, что выборочное обследование восьми студентов академии показало, что на подготовку к контрольной работе по статистике они затратили следующее количество часов: 8,5; 8,0; 7,8; 9,0; 7,2; 6,2; 8,4; 6,6. Оцените выборочные средние затраты времени и постройте доверительный интервал для среднего значения признака в генеральной совокупности, приняв доверительную вероятность равной 0,95.

10.3. На предприятии выборочно проверен стаж работы у 12 мужчин и 8 женщин. Результаты наблюдения следующие:

Группа

Объём выборки

Средний

стаж

Среднее

квадратическое

рабочих

 

работы

 

отклонение

 

Мужчины

12

14

 

3

 

Женщины

8

11

 

2

 

76

Определить, можно ли считать расхождения в значениях выборочной средней стажа работы у мужчин и женщин случайным (на уровне значимости = 0,05).

10.4. Предположим, на предприятии из коллектива рабочих выборочно обследовано 25 мужчин и 25 женщин. Средняя месячная заработная плата мужчин оказалась равна 24 830 руб. при среднем квадратическом отклонении 200 руб., а у женщин 23 780 руб. при среднем квадратическом отклонении 300 руб. Определить, можно ли считать расхождение между средней заработной платой мужчин и женщин случайным при = 0,05.

10.5. Обработка детали № 427 производится в цехе на двух однотипных станках. При выборочном наблюдении (механический отбор единиц) были зарегистрированы следующие затраты на обработку детали:

Затраты времени на одну

 

Число деталей

деталь, мин

станок № 1

 

станок № 2

1,5 – 2,5

7

 

-

2,5 – 3,5

10

 

12

3,5 – 4,5

15

 

17

4,5 – 5,5

8

 

11

Итого

40

 

40

На основе приведённых данных следует определить, существенно ли расхождение в затратах времени на обработку одной детали для этих двух станков, гарантируя результат с вероятностью 0,95.

10.6. На автотранспортном предприятии известны следующие результаты выборочного обследования пробега автомобильных шин одного типоразмера в городских условиях при работе водителей различной квалификации.

На основе приведённых данных следует определить, существенно ли расхождение среднего пробега автомобильных шин для двух групп, гарантируя результат с вероятностью 0,954.

Пробег автомобильных

Число шин

при работе водителей

при работе водителей

шин, тыс. км.

I класса

II класса

 

50 – 52

2

10

52 – 54

6

26

54 – 56

18

10

56 – 58

10

8

 

 

77

 

 

 

 

Продолжение таблицы

58 – 60

4

 

6

Итого

40

 

60

10.7. Расход сырья на одно изделие случаен. Результаты наблюдений таковы:

 

Старая технология

 

Новая технология

 

 

 

 

 

 

 

 

 

 

 

 

Расход сырья

304

307

 

308

303

304

 

306

308

 

 

 

 

 

 

 

 

 

 

Число изделий

1

4

 

4

2

6

 

4

1

 

 

 

 

 

 

 

 

 

 

Предположим, что расход сырья как при старой, так и при новой технологии имеет нормальное распределение, выясните, влияет ли технология на средний расход сырья на одно изделие = 0,05.

10.8. По результатам опроса жителей Приморского и Хабаровского краёв о доле доходов, потраченных на покупку валюты, были получены следующие данные:

 

Количество

Удельный вес доходов, потраченных на

 

опрошенных, чел.

покупку валюты, %

Хабаровский край

1 500

9,2

Приморский край

2 000

8,0

Можно ли считать существенными различия в доле доходов, потраченных на покупку валюты, жителями Приморского и Хабаровского краёв с вероятностью 0,95.

10.9. По результатам выборочного обследования жителей Хабаровского края были получены данные о доле социальных групп с наибольшим и наименьшим среднедушевым доходом в месяц:

Группы населения со среднедушевым

Число

Доля

групп

в

общей

доходом в месяц, руб.

человек

численности населения, %

 

До 5 000/

155

 

1,5

 

 

Свыше 30 000/

6 795

 

45,2

 

 

Можно ли при уровне значимости 0,1 считать, что расхождение доли населения, имеющего наибольший и наименьший уровень среднедушевого дохода несущественно?

10.10. Обработка детали № 318 производится в цехе на 2 станках, имеющих различную производительность

78

№ станка

№ 1

№ 2

Число проверенных деталей, шт.

200

120

В том числе брак, шт.

4

3

Можно ли считать несущественными различия в доле брака для двух станков ( = 0,05).

10.11. По результатам выборочного обследования домохозяйств двух городов были получены следующие данные о доле расходов на коммунальные услуги:

Город

Количество обследованных

Удельный вес расходов на

домохозяйств

коммунальные услуги

 

1

10

20,5

2

12

25,0

Можно ли считать существенными различия в доле расходов на коммунальные услуги в расходах домохозяйств двух городов ( = 0,01).

2.5. Дисперсионный анализ

Основным способом проверки гипотезы о связях признаков служит дисперсионный анализ. Заключение об отсутствии или наличии связи делается при этом на основе F -критерия. Критерий F представляет собой отношение выборочных дисперсий S12 и S22 , которые представляются как

оценки одной и той же генеральной дисперсии 2:

F

S12

.

 

 

 

S 2

 

 

2

 

Распределение дисперсионного отношения F зависит от числа степеней свободы df1 и df2 . Построены таблицы критических значений величины F при разном числе степеней свободы для разных уровней значимости (Приложение Е). Таблицей F-распределения можно пользоваться и при малых и при больших выборках. За S21 берётся большая из дисперсий, т.е. S21 > S22, соответственно df1 – число степеней свободы S21 , df2 – число степеней свободы S22 . Минимальное значение F=1 соответствует случаю равенства дисперсий, чем значительнее расхождение между дисперсиями, тем больше величина F.

Сущность дисперсионного анализа заключается в расчленении общей вариации на части и в сравнении полученных частных дисперсий. Испытуемая гипотеза при этом состоит в том, что если данные каждой

79

части представляют случайную выборку из нормально распределённой генеральной совокупности, то величина всех частных дисперсий должны быть пропорциональны своим степеням свободы и каждую из них можно рассматривать как приближённую оценку генеральной дисперсии. Нулевая гипотеза предполагает случайность различия сравниваемых величин S21 и S22 . Опровержение нулевой гипотезы служит доказательством действия того фактора, на основе которого производилась разбивка данных.

Очевидна связь дисперсионного анализа с методом аналитических группировок. При изучении связей признаков с помощью аналитических группировок совокупность разбивается на группы по значениям признакафактора и полагают, что различие средних результативного признака в группах определяются действием данного фактора. Задача состоит в оценке существенности различий между групповыми средними результативного признака, когда выделены лишь две группы, эта задача решается с помощью t - критерия. Если же число признаков больше двух, то существенность различия выделенных частей (групп) доказывается с помощью дисперсионного анализа на основе F-критерия. В зависимости от количества учтённых факторов, действующих на результативный признак, дисперсионный анализ подразделяется на однофакторный и многофакторный.

В случае выделения групп по одному фактору (однофакторная аналитическая группировка) общая вариация результативного признака – общая сумма квадратов отклонений индивидуальных значений от его общего среднего значения – может быть разложена на две составные части вариацию, обусловленную действием факторного признака на результативный (факторная дисперсия) и вариацию, обусловленную действием всех прочих причин (остаточная дисперсия).

Сумма квадратов отклонений внутри групп определяется следующим образом:

m n

m

m n

 

( yi j

y)2 n j ( y j

y)2 ( yij

y j )2 ,

j 1 i 1

j 1

j 1 i 1

 

где уij – значение результативного признака y i -й единицы в j

Dост

 

 

 

 

80

 

 

 

группе;

 

 

i

− номер единицы,

i 1,...,n ;

 

 

j

− номер группы,

j 1,...,m ;

n j − численность j -й группы;

 

 

j

− средняя величина результативного признака в j -й группе;

 

y

 

 

– общая средняя результативного признака.

 

y

Если обозначить суммы квадратов отклонений буквой D , получим

равенство:

Dобщ Dфакт Dост ..

На основе разложения дисперсии в соответствии с гипотезой отсутствия различий между группами могут быть получены три оценки генеральной дисперсии, пропорциональные степеням свободы: на основе общей вариации, межгрупповой (факторной) и внутригрупповой (остаточной). Число степеней свободы равно:

1)для общей вариации dfобщ n 1;

2)для вариации между группами (межгрупповая вариация) dfфакт m 1

( m – число групп);

3) для вариации внутри групп: dfост n m .

Как и суммы квадратов отклонений, числа степеней свободы связаны между собой равенством: df общ dfфакт dfост. Рассчитываем дисперсии путём деления сумм квадратов отклонений на соответствующее число степеней

свободы.

При этом получаем три оценки генеральной дисперсии 2 :

S 2

 

Dобщ

; S 2

 

Dфакт

; S 2

 

D

ост

.

 

 

 

 

общ

 

n 1

факт

 

m 1

ост

 

n m

 

 

 

 

 

 

 

Поскольку

Dфакт

измеряет вариацию результативного признака,

связанную с изменением фактора, по которому произведена группировка, а – вариацию, связанную с изменением всех прочих факторов, сравнение этих величин, рассчитанных на одну степень свободы, даёт возможность оценить существенность влияния признака-фактора на

 

 

 

 

 

 

 

 

2

 

 

 

 

 

результативный признак с помощью F -критерия:

F

 

Sфакт

. Эта запись

2

 

 

 

 

 

 

 

расч

Sост

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

предполагает, что

S 2

S 2

Если F

расч

F

 

( ; df

; df

2

) ,

можно

 

факт

ост .

 

т абл

 

1

 

 

 

 

утверждать, что нуль-гипотеза

не соответствует

фактическим

данным,

81

влияние признака-фактора является существенным или статистически значимым.

Например. По выборке 20 заводов отрасли установить, оказывает ли существенное влияние фондооснащённость предприятий на выпуск продукции (таблица 2.5.1).

Таблица 2.5.1 − Расчётные данные

Стоимость основных

Объём продукции,

уi -

 

 

i -

 

)2

y

y

производственных фондов, млн руб.

млн руб., уi

 

 

 

 

 

 

2,8

2,8

- 2,34

5,4756

2,2

2,5

- 2,64

6,9696

1,0

1,6

- 3,54

12,5316

2,0

0,7

- 4,44

19,7136

1.9

0,9

- 4,24

17,9776

3,1

2,5

- 2,64

6,9696

3,2

2,8

- 2,34

5,4756

4,0

5,6

0,46

0,2116

3,8

4,4

- 0,74

0,5476

3,5

3,5

- 1,64

2,6896

3,4

3,6

- 1,54

2,3716

3,9

4,6

- 0,54

0,2916

4,8

6,4

1,26

1,5876

4,1

4,3

- 0,84

0,7056

3,2

1,3

- 3,84

14,7456

5,9

14,6

9,46

89,4916

6,5

9,4

4,26

18,1476

7,0

13,6

8,46

71,5716

6,7

10,0

4,86

23,6196

5,1

7,6

2,46

6,0516

Итого

102,7

-

 

 

307,1460

Испытуемой является гипотеза об отсутствии связи, её можно сформулировать как H 0 : у1 у2 ... ут или H 0 : Sфакт2 0 .

Решение:

1. Находим среднее значение результативного признака

y yi 102,7 5,135 . n 20

82

2. Определяем общую сумму квадратов отклонений индивидуальных значений результативного признака – объём продукции от его общей

m

n

 

 

средней: Dобщ. ( yij y)2

307,146.

 

j 1

i 1

 

 

3. Рассчитаем

сумму

квадратов

отклонений, вызванных действием

 

 

 

m

данного фактора (таблица 2.5.2): Dфакт.

( y j y)2 n j .

j 1

Таблица 2.5.2 − Расчёт факторной дисперсии

Стоимость основных

Число

∑уij

 

 

 

 

 

j -

 

 

(

 

j -

 

)2

(

 

j -

 

)2nj

 

y

y

y

 

j

y

y

y

y

производственных

заводов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

фондов, млн руб., (х)

(nj)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 3

5

8,5

1,70

- 3,435

11,7992

58,9961

3 5

10

39,0

3,90

- 1,235

1,5252

15,2523

5 7

5

55,2

11,04

5,905

34,8690

174,3451

Итого

20

102,7

5,135

-

 

 

-

 

 

248,5935

Dфакт.=248,5935.

4.Определяем остаточную сумму квадратов отклонений

Dост=Dобщ-Dфакт=307,146-248,594=58,552. 5.Число степеней свободы составит:

-для общей суммы квадратов отклонений dfобщ=n-1=20-1=19;

-для суммы квадратов отклонений за счёт фактора dfфакт.=m-1=3-1=2;

-для остаточной суммы квадратов отклонений dfост=n-m=20-3=17.

6. Рассчитаем дисперсии факторную и остаточную на одну степень

свободы: Sфакт2

Dфакт

 

248,594

124,297;

Sост2

D

 

58,552

3,444.

 

 

 

ост

 

 

 

 

 

m 1

3 1

n m

 

20 3

 

 

 

 

 

 

 

 

 

7. Определяем F-критерий расчётный

F

 

 

Sфакт2

 

 

124,297

35,58 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

расч

 

 

S 2

 

 

 

3,444

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ост

 

 

 

 

 

 

8. Находим табличное значение Fтабл. (α = 0,05; df1= m-1 = 3-1 = 2; df2= n-m = 20-3 = 17) (Приложение Е). Fтабл.=3,59.

Fрасч. Fтабл., следовательно фондооснащённость предприятий существенно влияет на выпуск продукции.

Обобщая этапы однофакторного дисперсионного анализа составим таблицу (таблица 2.5.3).

83

Таблица 2.5.3 − Однофакторный дисперсионный анализ

Вариация

 

Сумма

 

 

Степень

Средний

Величина F-

 

 

квадратов

 

свободы,

квадрат

критерия

 

отклонений, D

Df

отклонений, S2

Fрасч.

 

 

Между

m

 

 

 

 

 

2

 

2

 

m-1

S2факт

 

 

 

 

группами

( y j y

)

nj

 

 

 

 

2

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

Fрасч

Sфакт

 

 

 

 

 

 

 

 

2

 

Внутри групп

 

 

 

 

 

 

 

 

 

 

m-n

2

 

 

m

 

n

 

 

 

 

S ост

 

Sост

 

( yij

y j )2

 

 

 

 

 

 

 

j 1

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая

 

n

 

 

 

 

n-1

-

-

 

 

 

 

( yi

 

)2

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

Рассмотрим решение двухфакторного комплекса Разложение общей суммы квадратов отклонений производится

 

m р

n j k

m

 

 

 

 

p

следующим образом

( yijk

 

)2

(

 

j

 

)2 nj (

 

k

 

)2 nk

y

y

y

y

y

 

j 1 k 1

i 1

j 1

 

 

 

 

k 1

m

p

 

 

 

 

 

 

m p njk

( y jk

y j yk y)2 njk

( yijk y jk )2 ,

j 1 k 1

 

 

 

 

 

 

j 1 k 1 i 1

где i – номер единицы совокупности, i=1…, n; j – номер группы по признаку х, j=1, …, m; k – номер группы по признаку z, k=1,…,p.

Обозначив суммы квадратов отклонений через D, перепишем предыдущее уравнение Dобщ Dфактх Dфактz Dфактxz Dост ,

где Dфакт х вариация у под влиянием фактора х;

Dфакт z – вариация у, обусловленная взаимодействием факторов z; Dфакт xz – вариация у, обусловленная взаимодействием факторов x и z; Dост – остаточная вариация у;

Общая факторная вариация у под влиянием обоих факторов может

быть записана: Dобщ Dфакт Dфакт Dфакт ,

 

 

х

z

xz

Число степеней свободы для каждой суммы квадратов отклонений

составит: df x m 1;

df z

p 1;

df xz

(m 1)( p 1) mp p m 1;

dfфакт df x

df z

df xz (m 1) (mp p m 1) mp 1; dfобщ n 1;

 

dfост dfобщ dfфакт (n 1) (mp 1) n mp.

84

Рассчитывая дисперсии на одну степень свободы Sфакт2 х , Sфактz , Sфакт2 zx и сопоставляя их с S2ост., также рассчитанной на одну степень свободы, оцениваем с помощью величины F – критерия существенность влияния на результативный признак каждого из факторов (таблица 2.5.4).

Таблица 2.5.4 − Двухфакторный дисперсионный анализ

Вариация

 

 

Сумма квадратов

 

 

 

 

 

Степень

Средний

 

Величина F-

 

 

 

отклонений D

 

 

 

 

 

 

свободы df

квадрат

 

критерия

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

отклонений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S2=D/df

 

 

 

 

 

 

 

Между

 

 

m

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

m-1

S2факт х

 

 

 

Sфакт2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группами по х

 

 

( y j y ) nj

 

 

 

 

 

 

 

 

 

 

 

 

 

F

 

 

х

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

расчх

 

 

S 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ост

Между

 

 

p

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

p-1

S2факт z

 

 

 

Sфакт2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

группами по z

 

 

( yk y) nk

 

 

 

 

 

 

 

 

 

 

 

 

 

Fрасч

 

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sост2

 

 

 

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

 

 

Взаимодейст-

 

 

m p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(m-1)(p-1)

2

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S факт xz

 

 

 

 

 

 

 

 

( y jk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

Sфакт

вие xz

 

y j

yk y) n jk

 

 

 

 

 

 

 

 

F

 

 

xz

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

jk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

расчяч

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sост

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Остаточная

 

 

nm p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n-mp

S ост

 

 

-

 

 

 

 

 

 

 

( yijk

y jk )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ijk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Общая

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n-1

S

 

 

 

-

 

 

 

 

 

 

 

( yi y)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обычные тесты для проверки гипотезы выглядят так:

 

 

 

 

 

 

 

Н 0 : у1

 

... у

 

 

 

 

 

 

 

 

 

 

 

Sфакт2

сравнивается

с

Fт абл. (; df1

df x ;

у2

т , Fрасчx

 

 

 

х

S

2

 

 

 

 

df2 dfост. ) ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ост

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н 0 : у1

 

... у

 

 

 

 

 

 

 

 

 

 

 

 

Sфакт2

сравнивается

с

Fт абл. (; df1

df z ;

у2

р , Fрасчz

 

 

 

 

z

 

S

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ост

 

 

 

 

 

 

 

 

 

 

 

 

 

df2 dfост. ) ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Н 0 : у11 у12

... у1 р ... ym p , Fрасчxz

 

Sфакт2

сравнивается с

Fт абл. (;

 

xz

 

 

S 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ост

 

 

 

 

 

 

 

 

 

df1 df xz ; df2

dfост. ) ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Во всех случаях, если Fрасч Fт абл.,

H 0

 

отклоняется.

 

 

 

 

 

 

 

 

Например.

Продолжая прежний пример,

введём в анализ ещё один

фактор, влияющий на выпуск продукции, – численность работающих (z)

(таблица 2.5.5).

Таблица 2.5.5 − Исходные данные

85

Стоимость

 

 

 

 

Численность работающих (z)

 

 

 

 

 

 

основных

200 350

350 500

Итого

производ-

Число

Выпуск

Число

Выпуск

Число

Выпуск

ственных

заводов,

продукции,

заводов,

продукции,

заводов,

продукции,

фондов,

(njk)

млн руб.

(njk)

млн руб.

(njk)

млн руб.

млн руб. (х)

 

(

 

 

jk)

 

(

 

 

 

jk)

 

(

 

 

 

jk)

 

у

 

у

 

 

у

 

1 3

3

1,07

2

2,65

5

1,70

3 5

3

2,23

7

4,63

10

3,90

5 7

2

8,50

3

12,73

5

11,04

 

nk

 

 

 

 

nk

 

 

 

 

 

N

 

 

 

 

 

 

 

у

k

 

 

у

k

 

 

у

 

 

 

 

 

 

 

Итого

8

3,36

12

6,33

20

5,14

1. Вычисляем сумму квадратов отклонений под

влиянием фактора

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(численность работающих)

Dфакт z = (

 

k

 

 

)2 nk =(3,36-3,135)2·8+(6,33-

y

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5,135)2·12=42,34.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Определяем сумму

 

квадратов отклонений под

воздействием

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

факторов x и z (таблица 2.5.6): Dфакт xz = ( y jk

y j yk

y)2 n jk =7,505 4.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

jk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.5.6 − Расчётные данные*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

 

 

 

 

 

)2

 

 

njk

 

(

 

 

 

 

 

 

 

 

 

)2 n

 

 

у

jk

y

j

y

y

у

jk

y

j

y

y

 

 

у

jk

y

j

y

y

jk

 

 

 

 

 

 

k

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

k

1,07-1,70-3,36+5,14=1,15

 

 

 

 

1,322 5

 

 

 

 

3

 

 

 

 

 

 

3,9675

 

 

 

2,65-1,70-6,33+5,14=-0,24

 

 

 

 

0,057 6

 

 

 

 

2

 

 

 

 

 

 

0,1152

 

 

 

2,23-3,90-3,36+5,14=0,11

 

 

 

 

0,012 1

 

 

 

 

3

 

 

 

 

 

 

0,0363

 

 

 

4,63-3,90-6,33+5,14=-0,46

 

 

 

 

0,211 6

 

 

 

 

7

 

 

 

 

 

 

1,4812

 

 

 

8,50-11,04-3,36+5,14=-0,76

 

 

 

 

0,577 6

 

 

 

 

2

 

 

 

 

 

 

1,1552

 

 

 

12,73-11,04-6,33+5,14=0,5

 

 

 

 

0,250 0

 

 

 

 

3

 

 

 

 

 

 

0,7500

 

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

20

 

 

 

 

 

 

7,5054

 

 

 

* у j берём из таблицы 2.5.2.

 

т

 

 

 

 

 

 

 

 

 

3. Dфакт x = ( y j y)2 nj =248,5935 (таблица 2.5.2).

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

4. Находим

Dфакт (суммы

квадратов

отклонений под

влиянием

факторов x и z ):

 

 

 

 

 

 

 

 

 

 

т

р

 

m p

 

 

 

 

D

( y j

y)2 n j + (

 

k

 

)nk + ( y jk

y j yk

y)2 n jk Dфакт

 

Dфакт

y

y

 

факт

j 1

k 1

 

jk

 

x

z

 

 

 

 

 

 

Dфактxz =248,593 5+42,340 0+7,505 4=298,438 9.

86

5. Рассчитаем остаточную вариацию: Dост Dобщ Dфакт =307,146298,438 9=8,707 1.

6. Оценим существенность влияния каждого из факторов и их взаимодействия на выпуск продукции. Результаты обобщим в таблица 2.5.7.

Таблица 2.5.7 − Двухфакторный дисперсионный анализ

Сумма квадратов

Степени свободы,

 

Средний квадрат

Величина F-

 

 

отклонений, D

df

отклонения, S2=D/df

критерия

 

 

Dфакт

x

= 248,5935

dfx=m-1=3-1=2

 

2

 

 

 

 

248,5935

 

 

 

 

124,297

 

 

 

 

 

 

 

S факт х =

 

 

 

 

 

 

=

Fрасч х =

 

 

 

 

 

 

=

 

 

 

 

 

 

 

2

 

 

 

 

 

 

0,6219

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=124,297

 

 

 

 

 

= 199,87

 

 

 

Dфакт

z

=42,34

dfz=p-1=2-1=1

 

 

S2

факт

z

=42,34

 

 

 

Fрасч z =

42,34

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,6219

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 68,08

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D

 

 

 

=7,5054

dfxz=

 

2

 

 

 

 

7,5054

 

 

 

 

 

 

 

 

 

3,7527

 

 

факт zx

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=dfx· dfz=2·1=2

S

факт xz =

 

 

 

=

 

 

Fрасч xz

=

 

 

 

=

 

 

 

 

 

 

2

 

 

 

0,6219

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=3,7527

 

 

 

 

 

= 6,03

 

 

 

Dфакт=298,4389

dfфакт= dfx+ dfz+

 

2

 

 

298,4389

 

 

 

 

59,6878

 

 

 

 

 

 

 

 

+dfхz=2+1+2=5

 

S

факт=

 

 

 

 

 

 

 

=

Fрасч=

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

0,6219

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=59,6878

 

 

 

 

 

=0,017

 

 

 

Dобщ=307,146

Dfобщ.=n-1=20-

S2общ.=

307,146

 

 

=

 

 

 

 

 

-

 

 

 

 

 

 

 

 

-1=19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=16,1656

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Dост=8,7071

dfост=dfобщ-

 

S2ост=

 

8,7071

=

 

 

 

 

 

 

 

 

-

 

 

 

 

 

 

 

 

-dfфакт=19-5=14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=0,6219

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Вторая

сравнения Fрасч z

Fрасч xz Fтабл

гипотеза Н0 : у1 у2 ... ур испытывается на основе

=68,08 с Fтабл. . (α=0,05; df1=dfz=1; df2=dfост=14)=4,60.

– гипотеза Н0 отклоняется, следовательно, достоверность

влияния фактора z также доказана.

3. Третье

Н0 :

 

11

 

12 ...

 

1р ...

 

m p испытывается

на основе

у

у

у

у

сравнения Fрасч xz =6,03 с Fтабл. (α=0,05; df1=dfxz=2; df2=dfост=14)=3,74.

Fрасч xz Fтабл

гипотеза Н0 отвергается, значит,

эффект от

взаимодействия факторов имеет место быть (таблица 2.5.7).

 

87

Если в исследование включено более двух факторов, то дисперсионный анализ ведётся по тому же принципу, что и для двухфакторного комплекса. Так, в случае трёхфакторного комплекса

Dобщ = Dост + Dфакт,

где Dфакт=Dфакт х1 + Dфакт х2 + Dфакт х3 + Dфакт х1 х2 + Dфакт х1 х3 + Dфакт х2 х3 + Dфакт х1 х2 х3 .

Доказав достоверность влияния отдельных факторов или целой группы факторов, на основе разложения общей дисперсии результативного признака можно оценить тесноту связи его с каждым из факторов

ху2

 

Dфакт

и со всеми учтёнными факторами у2, х ,...х

 

Dфакт

,

ухi

 

 

xi

Dобщ

Dобщ

 

 

i

1

р

 

 

 

 

 

 

у

 

 

 

у

 

 

 

 

 

где 2

коэффициент детерминации (0≤ 2 ≤1).

 

 

 

 

Задачи

11.1. Известны результаты выборочного обследования пробега автомобильных шин нового типа в различных условиях эксплуатации:

Условия

Пробег

шин,

Условия

Пробег шин,

эксплуатации

тыс. км.

 

п/п

эксплуатации

тыс. км.

Загородные

54,2

 

13

Загородные

56,6

 

 

 

 

 

 

Городские

70,5

 

14

Смешанные

60,5

Смешанные

58,9

 

15

Городские

70,3

 

 

 

 

 

 

Городские

71,8

 

16

Загородные

55,0

Смешанные

59,1

 

17

Смешанные

58,4

 

 

 

 

 

 

Городские

69,8

 

18

Городские

69,1

 

 

 

 

 

 

Загородные

58,8

 

19

Городские

72,0

 

 

 

 

 

 

Городские

58,9

 

20

Смешанные

59,0

 

 

 

 

 

 

Городские

68,7

 

21

Загородные

56,4

 

 

 

 

 

 

Смешанные

60,1

 

22

Городские

58,7

 

 

 

 

 

 

Городские

72,1

 

23

Смешанные

61,8

 

 

 

 

 

 

Смешанные

62,2

 

24

Городские

66,2

 

 

 

 

 

 

Установить, существует ли зависимость между условиями эксплуатации и величиной пробега шин, гарантируя результат с вероятностью 0,95.

11.2. По 25 рабочим механического цеха собраны данные о прохождении этими рабочими технического обучения и проценте выполнения норм выработки. Результаты обследования следующие:

 

 

88

 

 

 

 

 

 

 

 

Группа рабочих

Число

Процент выполнения норм выработки каждым

 

рабочих

рабочим

 

 

 

 

 

Не прошедшие

11

98,0; 102,0; 108,0; 103,2; 97,5; 100,0; 104,0; 100,8;

техническое обучение

107,2; 105,4; 99,2

 

 

 

 

 

 

 

 

 

Прошедшие

14

112,8;

118,4;

106,8;

103,1;

108,9;

111,4;

100,8;

техническое обучение

114,1; 110,8; 112,0; 107,9; 106,9; 118,7; 110,2

 

 

 

Используя метод дисперсионного анализа, установить, существует ли зависимость между процентом выполнения норм выработки и повышением квалификации, гарантируя результат с вероятностью 0,95.

11.3. За месяц известны данные о выработке рабочего за время работы в первую и во вторую смены:

Смена

Выработка рабочего, нормо-час

I

12,1; 11,1; 12,6; 12,9; 11,6; 13,1; 12,6; 12,4; 11,6; 17,3; 12,9; 11,6; 12,4

II

9,9; 11,4; 13,4; 10,4; 12,9; 12,6; 13,9; 13,4; 12,4; 9,9

Можно ли считать, что расхождение между уровнями выработки рабочего в первую и во вторую смены несущественно. С уровнем значимости = 0,05.

11.4. По следующим данным с использованием дисперсионного анализа установите, оказывает ли влияние продолжительность оборота средств в днях на среднюю прибыль:

Продолжитель

оборота

Число малых предприятий

Средняя прибыль, млн руб.

средств в днях

 

 

 

 

40

50

 

6

14,57

50

70

 

8

12,95

70

100

 

6

7,40

Итого

 

20

-

Dобщ = 208 ( = 0,05).

11.5. По приведённым данным с помощью дисперсионного анализа установить, существует ли влияние на среднюю прибыль средних запасов оборотных средств и оборачиваемости оборотных средств в днях.

Средний

Оборачиваемость оборотных средств в днях

 

 

запас

40 − 50

 

50 − 70

 

70 − 100

 

оборотных

Число

Средняя

Число

Средняя

Число

Средняя

средств, млн

предпри-

прибыль,

предпри-

прибыль,

предпри-

прибыль,

руб.

ятий

млн руб.

ятий

млн руб.

ятий

млн руб.

55

− 85

1

11,00

2

10,85

1

7,05

85

− 115

2

11,85

4

11,90

2

5,75

115 − 145

3

17,60

2

17,00

3

8,62

89

Dобщ = 450 ( = 0,05).

11.6. Имеются следующие данные по 20 коммерческим банкам.

Собственный

капитал,

Привлечённые

ресурсы,

Балансовая прибыль,

млрд руб.

 

млрд руб.

 

млрд руб.

12,0

 

27,1

 

8,1

70,4

 

56,3

 

9,5

41,0

 

95,7

 

38,4

120,8

 

44,8

 

38,4

79,3

 

26,7

 

13,4

50,3

 

108,1

 

30,1

70,0

 

50,2

 

37,8

52,4

 

26,3

 

41,1

99,8

 

53,5

 

9,3

27,3

 

24,4

 

39,3

72,0

 

65,5

 

8,6

22,4

 

76,0

 

40,5

39,3

 

106,9

 

45,3

70,0

 

89,5

 

8,4

22,9

 

84,0

 

12,8

119,3

 

89,4

 

44,7

49,6

 

93,8

 

8,8

88,6

 

91,3

 

32,2

43,7

 

108,1

 

20,3

90,5

 

55,7

 

12,2

Постройте группировку коммерческих банков по величине собственного капитала, выделив пять групп с равными интервалами. Рассчитайте по каждой группе балансовую прибыль. По данным группировки с помощью дисперсионного анализа установить, оказывает ли влияние величина собственного капитала на балансовую прибыль ( = 0,05).

11.7. По данным предыдущей задачи построить комбинационную группировку. В качестве группировочных признаков выбрать величину собственного капитала и привлечённые средства (выделить 3 группы). На основе полученной группировки с помощью дисперсионного анализа установить, оказывают ли влияние на балансовую прибыль величина собственного капитала и привлечённые средства ( = 0,05).

90

11.8. Имеются следующие данные по 15 промышленным предприятиям:

 

Стоимость

 

Затраты на 100 руб.

 

Предприятие

основных

фондов,

Прибыль, млн руб.

продукции, руб.

 

млн руб.

 

 

 

 

 

 

1

4,1

 

80

300

2

6,6

 

73

950

3

4,0

 

72

520

4

4,2

 

75

480

5

6,3

 

67

1 000

6

6,0

 

71

900

7

5,9

 

76

800

8

4,8

 

55

750

9

5,1

 

75

610

10

5,7

 

82

420

11

4,3

 

60

850

12

4,9

 

64

780

13

5,5

 

67

1 100

14

6,7

 

81

820

15

6,5

 

70

600

Постройте группировку промышленных предприятий по стоимости основных фондов, выделив 3 группы с равными интервалами. Рассчитайте по каждой группе прибыль. По данным группировки с помощью дисперсионного анализ установите, оказывает ли влияние величина стоимости основных фондов на величину прибыли.

11.9. По данным предыдущей задачи построить комбинационную группировку. В качестве группировочных признаков выбрать величину стоимости основных фондов (3 группы) и затрат на 100 руб. продукции (2 группы). На основе полученной группировки с помощью дисперсионного анализа установите, оказывают ли влияние на величину прибыли стоимость основных фондов и затрат на 100 руб. продукции ( = 0,05).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]