Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 283

.pdf
Скачиваний:
6
Добавлен:
30.04.2022
Размер:
360.06 Кб
Скачать

называются критическими точками. Для определения критических точек используют принцип практической невозможности событий, имеющих малую вероятность. При

этом задаются достаточно малой величинойa , называемой уровнем значимости критерия, и определяют критическую область как множество тех значенийq , вероятность которых принадлежать к области w0 равнялась бы a , т.е.

P{q Îw 0 } = a .

Если по данным выборки при данном уровне значимости получается, что q Îw 0 , то это может служить основанием для

отклонения гипотезы H 0 .

 

 

 

 

 

Рассмотрим

 

проверку

гипотезы

о

нормаль

распределении

X

генеральной

совокупностиX .

Пусть

распределение

неизвестно, но

есть

 

основание

предположить,

что

X имеет

нормальное

распределение, т.е.

выдвигается

гипотеза H 0

о

нормальности

СВ

X .

Статистический

критерий, с

помощью которого

проверяется

нулевая гипотеза, называется критерием согласия. Имеется несколько критериев согласия. Обычно в них используются

статистики,

имеющие

 

таблицы

распределений,

подготовленные

заранее:

статистику

с

нормальным

нормированным распределением, статистику c2 и статистику

Фишера. Рассмотрим критерий согласия Пирсона(критерий

согласия c2 Пирсона, c 2 - «хи квадрат»).

 

 

 

 

Пусть для X получена

выборка объемаn ,

заданная в

виде статистического ряда с равноотстоящими вариантами:

 

 

 

 

 

 

 

 

 

 

 

хi

 

х1

 

х2

 

хm

 

ni

 

n1

 

n2

 

nm

 

19

Найдем

 

 

по

 

данным

 

 

выборке

 

величиныxB

и

s B .

 

Предполагая,

 

 

что

X

 

 

имеет

 

нормальное

 

 

распределение,

 

вычислим величины

 

n¢i :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n ×h

 

 

æ xi -

 

ö

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

n¢i =

 

 

 

xB

j(u) =

 

×e

-u2/2

,

 

 

 

 

 

 

 

 

 

 

×j ç

 

 

 

 

 

÷,

 

 

 

 

 

 

 

 

 

 

 

 

 

s B

 

 

 

s B

 

2p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

è

 

 

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

 

называемые теоретическими частотами, в противоположность

 

чему ni

здесь называют эмпирическими частотами.

 

 

 

 

 

В качестве статистики q выбирают СВ c 2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- n¢i ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c 2 = å(ni

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

n¢i

 

 

 

 

 

 

 

 

 

 

 

 

 

Она

подчиняется

распределению c 2

 

с

числом

степеней

 

свободы

v = s - r -1 ,

 

 

где

s - число различных значений xi ;

 

 

r - число параметров, от которых зависит распределение. Для

 

нормального закона

 

таких параметров два:

a =

 

= M ( X )

и

 

 

xB

 

s = s =

DB ×

 

 

n

 

, т.е.

r = 2 ,

и v = s - 3 . Если эмпирическое и

 

n

-1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

теоретическое

 

 

распределение

 

совпадают, то

 

c 2 = 0 .

По

 

данному уровню значимости а и числу степеней свободы v

в

 

таблице

распределения c2

 

находят

 

критическое

значение

 

c2 крит.

и

 

 

 

 

 

 

 

 

определяют

 

 

 

критическую

 

:

обл

c2 < c2 крит., w

0

=

{

c 2

: c 2 ³ c 2крит. .

 

Затем

 

 

 

 

 

 

вычисляют

 

 

 

 

 

 

 

 

 

 

 

 

 

 

}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

наблюдаемое значение c2 ,

т.е.

c 2

набл. по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

c2

набл.

= å(ni - n¢i ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

n¢i

 

 

 

 

 

 

 

 

 

 

 

 

 

20

Если

окажется,

что

c2 набл. < c2 крит. ,

то

нулевую гипотезу

H 0 о

том,

что

X

имеет

нормальное

распределение,

принимают. В этом случае опытные данные выборки хорошо

согласуются

с

гипотезой

о

нормальном

 

распределении

генеральной совокупности.

 

 

 

 

 

 

 

 

 

Пример 6. При

уровне a = 0, 05

проверить гипотезу о

нормальном распределении генеральной совокупности, если

известны эмпирические и теоретические частоты:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni

 

6

 

12

16

40

 

13

 

8

 

5

 

n¢i

 

4

 

11

15

43

 

15

 

6

 

6

 

Решение. Число различных вариантm равно 7, значит степеней свободы распределения c2 равно 7-3=4. По таблице критических точек распределения c2 , по уровню значимости

a = 0, 05

и

числу

степеней

свободы4

находим

c 2 крит. =9,5.

Вычислим c 2

набл. , для чего составим расчетную таблицу.

 

 

 

 

 

 

 

 

 

1

2

 

3

 

4

 

5

6

i

ni

 

n¢i

 

ni - n¢i

 

(ni - n¢i)2

(ni - n¢i)2

 

 

 

 

 

 

 

 

 

n¢i

 

 

 

 

 

 

 

 

 

1

6

 

4

 

2

 

4

1

2

12

 

11

 

1

 

1

0,09

3

16

 

15

 

1

 

1

0,061

4

40

 

43

 

-3

 

9

0,21

5

13

 

15

 

-2

 

4

0,27

6

8

 

6

 

2

 

4

0,7

7

5

 

6

 

-1

 

1

0,17

21

c2 набл. = 2, 5

 

 

Так

как c2 набл. < c2крит. то

нулевая гипотеза

о

нормальности генеральной совокупности принимается.

Пример 7. Дано статистическое распределение выборки:

xi

1,6

3,0

4,4

5,8

7,2

6,6

10,0

ni

3

7

15

35

22

13

5

Решение.

1.Найдем методом произведений выборочные: среднюю, дисперсию и среднее квадратичное отклонени. Воспользуемся методом произведений, для чего составим таблицу 1.

 

 

 

 

 

Таблица 1

xi

ni

ui

niui

niui 2

ni (ui +1)2

 

 

 

 

 

 

1,6

3

-3

-9

27

12

3,0

7

-2

-14

28

7

4,4

15

-1

-15

16

0

5,8

35

0

0

0

35

7,2

22

1

22

22

88

8,6

13

2

26

52

117

10,

5

3

15

45

80

0

 

 

 

 

 

 

n = åni

 

åni ×ui = 2

åni ×ui2 =189

åni (ui +1)2 = 33

 

 

 

 

 

 

22

В качестве ложного нуля принимаем=5,8С

– варианта с

наибольшей

частотой 35.

Шаг

 

выборки

h = x2 - x1 = 3, 0 -1, 6 =1, 4 .

Тогда

условные

варианты

определяем по формуле ui =

xi -C

=

xi - 5,8

.

 

 

 

 

 

 

 

 

h

1, 4

 

 

 

Подсчитываем

условные вариантыui и

заполняем

все

столбцы.

Последний столбец служит для контроля вычислений по тождеству:

2 2

åni (ui +1) = åniui + 2åniui + n

x = h1 ×u + C1 ; y = h2 ×v + C2 ; s x = h1 su ; s y = h2sv Контроль:

339 =189 + 2 ×25 +100 .

Вычисления произведены верно. Найдем условные моменты.

 

åniui

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

M 1* =

 

 

 

25

 

 

 

M 2* =

åniui

 

189

 

 

 

 

=

 

= 0, 25;

 

 

=

 

=1,89.

n

 

 

 

100

 

100

 

 

 

 

 

 

 

n

 

 

 

Вычисляем выборочную среднюю:

 

 

 

 

 

 

 

 

 

 

 

 

= M 1 *×h + C = 0, 25 ×1, 4 + 5,8 = 6,15.

 

 

 

 

xB

 

Находим выборочную дисперсию:

 

 

 

 

 

 

 

 

é

 

 

 

 

 

2

ù

 

2

é

 

- (0, 25)

2

ù

 

2

= 3,58.

dB = ëM 2 * -(M1*)

 

û ×h

 

= ë1,89

 

û ×1, 4

 

Определяем выборочное среднее квадратическое отклонение:

s B = dB = 3, 58 =1, 89.

2.Строим нормальную кривую.

Для облегчения вычислений все расчеты сводим в таблице 2.

23

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2

xi

ni

x -

 

=

 

xi

-xB

 

xi

-6,15

j (u i )

 

 

x

ui =

=

 

 

 

 

i B

 

 

 

 

 

 

¢

 

 

 

 

 

s

 

 

1,89

 

 

ni =74,07×j(ui )

 

 

 

=xi -6,15

 

 

 

 

 

 

 

 

 

 

 

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,6

3

-4,55

 

 

-2,41

 

 

0,0219

2

 

3,0

7

-3,15

 

 

-1,67

 

 

0,0989

7

 

4,4

15

-1,75

 

 

-0,92

 

 

0,2613

19

 

5,8

35

-0,35

 

 

-0,18

 

 

0,3925

30

 

7,2

22

1,05

 

 

0,56

 

 

 

0,3410

25

 

8,6

13

2,45

 

 

1,30

 

 

 

0,1714

13

 

10,0

5

3,58

 

 

2,04

 

 

 

0,0498

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

 

 

 

n = ån¢i =100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заполняем первые три столбца.

В четвертом столбце записываем условные варианты по формуле, указанной в «шапке» таблицы. В пятом столбце находим значения функции

j(u) = 1 ×e-u2 / 2 . 2p

Функция j (ui ) четная, т.е.

j(-ui) = j(ui) .

Значения функции j (ui ) в

зависимости от аргументаui

(берутся положительные ui ,

т.к. функция j (ui ) четная)

находим из таблицы.

Теоретические частоты теоретической кривой находим по формуле

n¢i = n × pi = n ×h × 1 ×j(ui) = nh j(ui) = s B s B

= 100 ×1, 4 j(ui) = 74, 07j(ui) 1,89

24

И заполняем последний столбец. Отметим, что в последнем

 

столбце

частоты n¢i

округляются

до

целого

числа

и

ån¢i = åni =100 .

В системе координат(xi ; yi = n¢i) строим нормальную

(теоретическую) кривую (рис.2) по выравнивающим частотам n¢i (они отмечены кружками). Полигон наблюдаемых частот построен в системе координат (x 'i ; yi = n i ) .

Рис. 2

3. Проверяем гипотезу о нормальностиX при уровне значимости a = 0, 05 .

Вычислим c 2набл. , для чего составим расчетную таблицу 3.

25

 

 

 

 

 

Таблица 3

ni

n¢i

ni - n¢i

(ni - n¢i)2

(ni - n¢i)2

ni 2

 

ni 2

 

 

 

 

¢

 

 

n¢i

 

 

 

 

 

n i

 

 

 

 

1

2

3

4

5

6

7

 

3

2

1

1

0,5

9

4,5

7

7

0

0

0

49

7

 

15

19

-4

16

0,84

225

11,84

35

30

5

25

0,83

1225

40,83

22

25

3

9

0,36

484

19,36

13

13

0

0

0

169

13

 

5

4

1

1

0,25

25

6,25

100

100

 

 

c 2набл. = 2, 78

 

102,78

 

 

 

 

 

 

 

 

 

Суммируя числа пятого столбца, получаем c2 набл. = 2, 78 . Суммируя числа последнего столбца, получаем 102,78. Контроль: c2 набл. = 2, 78

åni 2 - åni = 102, 78 -100 = 2, 78 . n¢i

Совпадение результатов подтверждает правильность вычислений.

Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариантов) 7. v =7-3=4.

По таблице критических точек распределенияc 2 , по

уровню значимости a = 0, 05

и числу степеней свободы v =4

находим c2 кр =9,5.

 

 

 

 

Так как c2

набл. < c2кр. , то нет оснований отвергать нулевую

гипотезу. Другими словами,

расхождение эмпирических и

теоретических частот незначимое. Следовательно,

данные

наблюдений

согласуются

с

гипотезой

о

нормальности

распределения генеральной совокупности.

 

 

26

 

 

4. Найдем

доверительный

 

интервал

для

оценки

неизвестного MO M(X), полагая что

X

имеет

нормальное

распределение,

среднее

 

 

квадратическое

отклонение

s = s X = s B =1,89 и доверительная вероятность g = 0,95 .

 

 

 

Известен объем выборки:

n = 100 , выборочная средняя

 

 

= 6,15 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из соотношения 2F(t) = g

получим F(t) = 0, 475 .

По

таблице находим параметр t =1, 96 .

 

 

 

 

 

 

 

Найдем точность оценки

 

 

 

 

 

 

 

 

 

 

d =

 

ts

=

1, 96 ×1,89

= 0,37 .

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

100

 

 

 

 

 

 

 

 

Доверительный интервал таков:

 

 

 

 

 

 

 

 

 

 

-d < M (X ) <

 

+ d

 

 

 

 

 

 

 

xB

xB

 

 

 

или 6,15 - 0,37 < M ( X ) < 6,15 + 0,37 Û 5, 78 < M ( X ) < 6,52 .

 

 

 

Надежность

g = 0,95

указывает,

что

если

произведено

достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен.

 

4. Элементы теории корреляции

 

Корреляционный

анализ – широко

известный

и

эффективный

метод

статистики, позволяющий

по

совокупности значений показателей выявлять и описывать связи между показателями.

Если каждому значению величиныX соответствует несколько значений величины Y , но число этих значений, как и сами значения, остается не вполне определенным, то такие связи называются статистическими. Например, уровень

27

производительности труда на предприятиях тем выше, чем больше его электровооруженность. Вместе с тем, нет никаких оснований утверждать об однозначности этой зависимости.

 

 

Если изменение одной из переменных сопровождается

 

изменениями

 

условного

 

 

среднего

значения

друг

переменной

величины, то

 

такая

зависимость

является

корреляционной.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Под

условным

средним

 

 

 

подразумевают

среднее

 

yx

 

арифметическое

значение Y ,

 

соответствующих

 

значению

 

 

X = x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Например, пусть при x1 = 2 величина Y приняла значения

 

 

y1 = 5 , y2 = 6 ,

y3 =10 . Тогда условное среднее равно

 

 

 

 

 

 

 

 

 

=

(5 + 6 +10)

= 7 .

 

 

 

 

 

 

 

 

 

 

 

 

y2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

Корреляционной

зависимостью Y

от X

 

 

называют

 

функциональную

зависимость

 

условной

средней

 

 

от x :

 

 

yx

 

 

 

= f (x) . Это уравнение называют уравнением регрессииY

 

 

yx

 

на X , а ее график – линией регрессии Y на X .

 

 

 

 

 

 

 

Корреляционный

анализ

 

рассматривает

две

основные

 

задачи.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Первая задача теории корреляции– установить форму корреляционной связи, т.е. вид функции регрессии (линейная, квадратичная и т.д.)

Вторая

задача

теории

корреляции–

оценить

тесноту

(силу) корреляционной связи.

 

 

 

 

Теснота

корреляционной

связи(зависимости)

Y

на

X оценивается по

величине рассеивания

значенийY

вокруг

условного среднего. Большое рассеивание свидетельствует о слабой зависимости Y от X , малое рассеивание указывает на наличие сильной зависимости.

28