Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

matstatistika_1_2_3_RGR

.pdf
Скачиваний:
50
Добавлен:
08.03.2015
Размер:
1.8 Mб
Скачать

2.

α = 0,05 – ошибка 1 рода.

3.

χнабл2

8

(n

np

)2

(8 2 1).

= ∑

i

i

~ χ2

 

 

i =1

 

npi

 

 

4. Найдем из таблиц квантилей распределения χ2 (или вычисляем в MS Excel) критическую точку χкр2 = χ02,95 (8 2 1)=11,07. Критическая область правосторонняя:

d0

χкр2

d1

 

=11,07

Для расчета наблюдаемого значения критерия χ02 составим две вспомогательные таблицы (используем интервальный ряд 2 и значения функции Лапласа).

Расчет n pi

i

Ci 1

Ci

Ζi 1

Ζi

Φ(Ζi 1 )

Φ(Ζi )

pi

npi

1

85

91,125

-2,37

-1,78

-0,4912

-0,4625

0,0287

2,869

2

91,125

97,25

-1,78

-1,19

-0,4625

-0,3824

0,0801

8,0108

3

97,25

103,38

-1,19

-0,59

-0,3824

-0,2236

0,1588

15,881

4

103,375

109,5

-0,59

0,00

-0,2236

0,0000

0,2236

22,36

5

109,5

115,63

0,00

0,59

0,0000

0,2236

0,2236

22,36

6

115,625

121,75

0,59

1,19

0,2236

0,3824

0,1588

15,881

7

121,75

127,88

1,19

1,78

0,3824

0,4625

0,0801

8,0108

8

127,875

134

1,78

2,37

0,4625

0,4912

0,0287

2,869

––

––

––

––

––

––

0,9824

98,24

Расчет χнабл2

i

ni

npi

(ni npi )2

(ni npi )2 npi

1

4

2,869

1,279

0,446

2

8

8,0108

0,000

0,000

3

13

15,881

8,302

0,523

4

27

22,36

21,533

0,963

5

23

22,36

0,410

0,018

6

13

15,881

8,302

0,523

7

6

8,0108

4,043

0,505

8

6

2,869

9,803

3,417

––

––

––

χнабл2 = 6,394

41

Сравниваем наблюдаемое значение критерия χнабл2 =6,394 с критической

точкой χкр2 =11,07 . Так как χнабл2 < χкр2 , т. е. χнабл2 принадлежит области принятия нулевой гипотезы, гипотезу о нормальном распределении числа пассажиров одного авиарейса следует принять.

42

2. ПРИКЛАДНЫЕ РАЗДЕЛЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

2.1. Задание расчетно-графической работы № 2.

Общая сумма : 5 баллов

Тема 4: Однофакторный дисперсионный анализ

1.Дать экономическую интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

2.При уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа.

2.1.1. Основные формулы и таблицы

Исходные данные:

Уровни фактора А

 

Номер

 

 

испытания

a1

a2

am

1

x11

x12

x1m

2

x21

x22

x2m

n

xn1

xn2

xnm

1. Выдвигаем гипотезу H0 о том, что фактор А – незначим, т.е. не оказывает существенного влияния на результирующий признак, т.е. H0 :

a1 = a2 =... = am .

Альтернативная гипотеза H1 о том, что фактор А – значим, т.е. оказывает существенное влияние на результирующий признак, т.е. H1 : a1 a2 ... am .

2.Задаем уровень значимости α =0,05 или 0,1, или 0,01.

3.Рассчитываем критическое значение статистики критерия Фишера Fкрит = F(α;k1;k2 ) , используя для этого соответствующее приложение учебника

или встроенную в MS Excel функцию «=FРАСПОБР(α;k1;k2 )». Критическая область правосторонняя:

 

 

 

 

d0

Fкрит =...

 

 

d1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4. Вычисляем наблюдаемое значение статистики критерия Фишера:

 

 

 

 

 

 

S 2

 

 

 

 

 

F =

A

,

 

 

 

 

 

 

 

 

 

 

 

 

 

0

SR2

 

 

SSA

 

 

 

где

SA2 =

 

– несмещенная оценка дисперсии SSA , обусловленной действием

m 1

 

 

 

 

 

 

 

 

фактора А;

43

SR2 =

SSR

– несмещенная оценка остаточной дисперсии SSA .

m(n 1)

 

 

Дисперсии SSA и SSR находим по формулам:

m

SSA = n(xi x)2 – межгрупповая дисперсия или дисперсия, обусловлен-

i=1

ная фактором А;

SS

 

 

n

m

(x

x )2

– внутригрупповая или остаточная дисперсия;

R

= ∑∑

 

 

j=1i=1

ij

 

i

 

 

 

 

 

 

 

 

SS

 

 

=

n

m

 

x)2

– общая дисперсия;

общ

∑∑(x

ij

 

 

j=1i=1

 

 

 

 

 

 

 

 

 

SSобщ = SSA + SSR – проверка вычислений.

Общая выборочная средняя находится по формуле:

 

1

n m

1

m

x =

 

∑∑xij =

 

xi .

 

 

 

mn j=1i=1

m i=1

Групповые выборочные средние:

xi = 1 n xij .

n j=1

Если фактор А значим, то находим коэффициент детерминации:

R2 = SSA 100% .

SSобщ

Коэффициент детерминации показывает, на сколько процентов уровни фактора А объясняют вариацию результирующего показателя.

Для удобства расчетов можно построить вспомогательные таблицы: Таблица для вычисления средних

Уровни

 

Номер испытания

 

Сумма

Внутригрупповые

фактора

1

2

n

по стро-

выборочные

А

 

 

 

 

кам

средние

a

x

 

x

 

x

n

x =

1 n

1

 

11

12

 

 

1n

x1 j

 

 

x

 

 

 

 

 

 

 

 

 

j=1

1

n j=1 1 j

a2

x21

 

x22

 

x2n

n

 

1 n

 

 

 

 

 

 

 

 

 

x2 j

x2 =

 

 

x2 j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

n j=1

 

 

 

am

xm1

 

xm2

 

xmn

n

 

1 n

 

 

 

 

 

 

 

 

 

xmj

xm =

 

 

xmj

 

 

 

 

 

 

 

 

 

j=1

 

n j=1

 

 

 

 

 

 

 

 

 

 

 

1 m

 

 

 

 

 

Общая выборочная средняя

x =

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m i=1

 

 

Таблица для вычисления сумм квадратов (дисперсий)

 

 

 

 

SSA

 

(xi x)2

 

(x1 x)2

 

(x2 x)2

 

(xm x)2

Σ

 

 

 

44

 

 

(x1 j x1 )2

(x11 x1 )2

 

(x12 x1 )2

 

 

(x1n x1 )2

 

Σ

 

 

 

 

 

SSR

(x2 j x2 )2

(x21 x2 )2

 

(x22 x2 )2

 

 

(x22 x2 )2

 

Σ

 

 

Σ

 

 

 

 

 

 

 

 

 

 

 

 

Σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xmj xm )2

(xm1 xm )2

(xm2 xm )2

 

 

(xmn xm )2

 

Σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x1 j x)2

(x11 x)2

 

(x12 x)2

 

 

(x1n x)2

 

Σ

 

 

 

 

 

SSобщ

(x2 j x)2

(x21 x)2

 

(x22 x)2

 

 

(x2n x)2

 

Σ

 

 

Σ

 

 

 

 

 

 

 

 

 

 

 

 

Σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(xmj x)2

(xm1 x)2

 

(xm2 x)2

 

 

(xmn x)2

 

Σ

 

 

 

 

 

 

 

 

Таблица для расчета значений критерия Фишера

 

 

 

 

 

 

 

Источник из-

 

Число

Сумма

 

Средний

Критерий

Fкрит

 

 

 

Гипотеза

 

 

менчивости

 

степеней

квадратов

 

квадрат

Фишера

 

 

 

 

 

 

 

 

 

 

 

 

свободы

SS

 

 

MS

 

 

F0

 

 

 

 

 

 

 

 

 

 

 

Фактор А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

(между

 

m 1

SS

A

 

 

MS

 

= S

2

F =

SA

 

F(α;k ;k

2

)

???

 

 

 

 

 

 

 

 

 

 

 

 

 

A

A

0

 

SR2

1

 

 

 

 

группами)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Остаток

 

m(n 1)

SSR

 

 

MSR = SR2

 

 

 

 

 

 

 

 

 

 

(внутри групп)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итог

 

mn 1

SSобщ

 

 

 

 

 

 

 

 

 

 

 

 

 

2.1.2. Вычисления в MS Excel

Пример 5. Выполнение расчетов в MS Excel.

Задача. Известны итоговые результаты в баллах 20 студентов по дисциплине «Теория вероятностей и математическая статистика». Требуется установить, влияет ли базовое (среднее) образование на успеваемость студента.

Уровни фактора А – базовое (среднее)

 

Номер испытания

 

образование студента

1

2

3

4

5

Гимназия или лицей

100

100

98

99

95

Школа с углубленным изучением

100

97

99

91

89

предметов

 

 

 

 

 

Обычная школа

65

87

84

71

56

Техникум

41

68

56

47

71

Решение. Заносим исходные данные в MS Excel, как в таблице для вычисления средних (рис. 2.1). Вычисляем суммы квадратов (дисперсий), не забывая максимально автоматизировать при этом все расчеты (рис. 2.2).

45

Рис. 2.1. Расчет средних в MS Excel

Рис. 2.2. Расчет сумм квадратов

Теперь, когда вычислены дисперсии и сделана проверка, приступаем к расчету значений критерия Фишера. Определяем критическую точку. Для этого находим число степеней свободы:

νA = m 1= 4 1=3,

νR = m(n 1) = 4(5 1) =16,

νобщ = mn 1= 4 5 1=19.

Проверка: νобщ =νA +νR =3 +16 =19 .

Все расчеты заносим в таблицу в MS Excel (рис. 2.3).

Рис. 2.3. Расчет значений критерия Фишера

46

После проделанных расчетов можно выполнить проверку результата с помощью пакета анализа (пункт меню «сервис», затем выбираем «пакет анализа») (рис. 2.4.).

Рис. 2.4. Выбор однофакторного дисперсионного анализа

Рис. 2.5. Ввод данных для расчета однофакторного дисперсионного анализа

При введении данных в раздел пакет анализа «однофакторный дисперсиионный анализ» необходимо обратить внимание на расположение исходных данных в строках или столбцах (рис. 2.5). Для расчетов входной интервал выделяем вместе с названиями уровней фактора, не забывая при этом поставить отметку в графе «метки в первом столбце». Когда все данные правильно введены, нажимаем кнопку «ОК» и переходим на тот лист, на который будут выведены результаты расчетов (рис. 2.6).

47

Рис. 2.6. Результаты расчетов значений критерия Фишера с помощью пакета анализа

По рис. 2.6. видно, что все результаты, сделанные вручную, совпадают с результатами, рассчитанными автоматически. Таким образом, они верны.

2.1.3. Оформление полученных результатов

Пример 5. Оформление результатов проведенных расчетов по Теме 4.

1. Выдвигаем гипотезу H0 о том, что фактор А – незначим, т.е. базовое

(среднее) образование студентов не оказывает существенного влияния на успеваемость студента по дисциплине «теория вероятностей и математическая статистика», т.е. H0 : a1 = a2 = a3 = a4 .

Альтернативная гипотеза H1 о том, что фактор А – значим, т.е. оказывает существенное влияние на результирующий признак, т.е. H1 : a1 a2 a3 a4 .

2.Задаем уровень значимости α =0,05.

3.Рассчитываем критическое значение статистики критерия Фишера Fкрит = F(α;k1;k2 ) , используя для этого соответствующее приложение учебника

или встроенную в MS Excel функцию «=FРАСПОБР(α;k1;k2 )».

k1 =νA = m 1= 4 1=3,

k2 =νR = m(n 1) = 4(5 1) =16. Fкрит = F(0,05;3;16) =3,239

Критическая область правосторонняя:

d0

d1

 

Fкрит = 3,239

4. Вычисляем наблюдаемое значение статистики критерия Фишера:

 

S 2

F =

A

,

 

0

SR2

 

48

 

где SA2 =

 

SSA

– несмещенная оценка дисперсии SSA , обусловленной действием

 

 

 

 

 

 

 

 

m 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

фактора А;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SR2 =

 

SSR

 

– несмещенная оценка остаточной дисперсии SSA .

 

 

 

 

 

 

m(n 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проведем все расчеты с использованием вспомогательных таблиц.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 1. Расчет выборочных средних

 

 

 

 

 

 

 

 

Уровни

 

 

 

 

Номер испытания

Сумма по

 

Внутригрупповые вы-

 

фактора

 

 

 

 

 

 

 

 

 

 

 

 

 

 

строкам

 

борочные средние

 

А

 

 

 

1

 

 

2

 

3

4

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

= 492

 

 

= 492 =

 

 

 

 

a1

 

 

 

100

 

100

 

98

99

 

95

 

n

 

 

 

x1

 

 

 

 

98,4

 

 

 

 

 

 

 

 

 

j=1 1 j

 

 

 

 

5

 

 

 

a2

 

 

 

100

 

97

 

99

91

 

89

 

x2 j

= 476

 

x2 = 476 =95,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

5

 

 

 

 

 

a

 

 

 

 

65

 

 

87

 

84

71

 

56

 

x3 j

=363

 

x = 363 = 72,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

3

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a4

 

 

 

41

 

 

68

 

56

47

 

71

 

x4 j

= 283

 

x4 = 283 =56,6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j=1

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

Общая выборочная средняя

x =

1

(98,4 + 95,2 + 72,6 + 56,6) =80,7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2. Расчет дисперсий

 

 

 

 

 

 

 

 

 

SSA

 

 

 

 

 

 

 

(x1 j

x1 )2

 

 

2,56

 

2,56

 

0,16

 

0,36

 

 

11,56

 

 

 

(xi x)2

 

SSR

 

 

(x2 j

x2 )2

 

 

23,04

 

3,24

 

14,44

 

17,64

 

 

38,44

 

 

 

313,29

 

 

 

(x3 j

x3 )2

 

 

57,76

 

207,36

 

129,96

2,56

 

 

275,56

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

210,25

 

 

 

 

 

 

(x4 j

x4 )2

 

243,36

 

129,96

 

0,36

 

92,16

 

 

207,36

 

Итог:

 

65,61

 

 

сумма по столбцам

 

326,72+

 

343,12+

 

144,92+

112,72+

 

532,92=

 

1460,4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

580,81

 

 

 

 

 

 

(x

x)2

 

372,49

 

372,49

 

299,29

334,89

 

 

204,49

 

 

 

 

 

 

 

 

 

1 j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x2 j x)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1169,96

 

SSобщ

 

 

372,49

 

265,69

 

334,89

106,09

 

 

68,89

 

 

 

 

 

 

(x3 j x)2

 

 

 

 

 

 

 

 

 

 

 

 

 

5849,8

 

 

 

246,49

 

39,69

 

10,89

 

94,09

 

 

610,09

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x4 j x)2

 

1576,09

 

161,29

 

 

610,09

1135,69

 

 

94,09

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7310,2

 

 

 

 

 

 

сумма по столбцам

 

2567,56+

 

839,16+

 

1255,16+

1670,76+

 

977,56=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дисперсии SSA и SSR находим по формулам:

m

SS A = n(xi x)2 =5 (313,29 + 210,25 + 65,61+ 580,81) =5849,8 – межгрупповая

i=1

дисперсия или дисперсия, обусловленная фактором А;

49

n m

+ 2,56 +... + 92,12 + 207,36 =1460,4 – внутригрупповая

SSR = ∑∑(xij xi )2 = 2,56

j=1i=1

 

 

 

или остаточная дисперсия;

 

 

n m

 

 

 

SSобщ = ∑∑(xij x)2 =372,49

+ 372,49 +... +1135,69

+ 94,09 = 7310,2 – общая

j=1i=1

 

 

 

дисперсия; Проверка вычислений:

SSобщ = SSA + SSR =5849,8 +1460,2 = 7310,2 – верно.

Таблица 3. Расчет значений критерия Фишера

Источник

Число

 

Сумма

Средний

 

Критерий Фи-

Fкрит

Гипотеза

 

изменчи-

степеней

 

квадратов

квадрат

 

 

шера

 

 

 

вости

свободы

 

SS

 

MS

 

 

F0

 

 

 

Фактор А

 

 

 

MS

 

= S 2

=

 

2

 

 

 

 

 

(между

m 1= 3

 

5849,8

 

F0 =

SA

=21,36

3,329

отклонить

 

 

 

A

A

 

 

 

 

 

 

 

SR2

 

группами)

 

 

 

=1949,93

 

 

 

 

 

 

Остаток

m(n 1) =

 

 

MSR = SR2 =

 

 

 

(внутри

 

1460,2

 

 

 

групп)

16

 

 

=91,28

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mn 1=

 

7310,2

 

 

 

 

 

 

Итог

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, F0

> Fкрит (21,36 > 3,329), следовательно, с вероятностью

0,95 гипотеза H0 отклоняется, т.е. базовое (среднее) образование студента ока-

зывает существенное влияние на его успеваемость по дисциплине «теория вероятностей и математическая статистика».

Так как фактор А значим, то находим коэффициент детерминации:

R2 =

SSA

100% =

5849,8

100% =80,02%.

SSобщ

7310,2

 

 

 

Коэффициент детерминации показывает, что уровни фактора А объясняют вариацию результирующего показателя на 80,02%, т.е. базовое образование объясняет изменчивость успеваемости студента на 80,02%, оставшиеся 19,98% приходятся на другие факторы.

50