Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая статистика в технологии машиностроения

..pdf
Скачиваний:
24
Добавлен:
15.11.2022
Размер:
8.19 Mб
Скачать

Если какому-либо значению х предшествует некоторый у, то говорят, что эта пара дает инверсию. Если некоторому значе­ нию хт предшествует п значений у, то это значит, что хт имеет п инверсий. Например, в нашей последовательности х х дает две ин­ версии, х 2 — то же две инверсии, х 3 — пять инверсий и х4 — шесть инверсий. Всего инверсий в нашей последовательности будет

« = 2 + 2 + 5 + 6 = 15.

Нулевая гипотеза принимается, если число и будет лежать внутри некоторых предельных или критических значений, вычис­ ляемых для принятого уровня доверительной вероятности. Ра­ счет критических значений для и производится из следующих соображений. Если объемы выборок п > 10 и т > 10, то число инверсий и распределяется приблизительно по нормальному закону со средним значением (математическим ожиданием)

й =

(128)

и дисперсией

 

° 1 = ^ ( т + п + 1 ).

(129)

Поэтому предельные значения и определяются границами

и tau^ u ^ u - \ - tau,

(130)

где t зависит от принятого уровня доверительной вероятности q и вычисляется по таблице значений Ф (f) (см. приложение 1) по формуле

9 = 1 — 2Ф (0,

откуда

 

Ф(/) = -Ц=4.

(131)

Например для q = 0,05

 

ф (/)= 1 г^ ® Ё == 0,4525.

 

Этому значению Ф (t) по таблице приложения 1 соответствует

* = 1,96.

и будет лежать

Таким образом, если наблюденное значение

внутри границ, определяемых неравенством (130), или не выходить за пределы критических областей:

«и — tau;

(132)

и ^ и + tau,

то нулевая гипотеза принимается, в противном случае она отвер­ гается. Так как и имеет приближенно нормальное распределение

только при выборках объема и •> 10 и т > 10, то для использо­ вания критерия Вилькоксона необходимо брать выборки объемом не менее 12.

Пример 32. С двух станков, настроенных на обработку одной и той же детали, взяты текущие выборки объема п = т = 15. Результаты измерения деталей выбо­ рок приведены в табл. 25, где через х обозначены отклонения измеряемого размера от номинала в мкм для выборки со станка № 1, а через у — отклонения в мкм измеряемого размера для выборки со станка № 2.

Требуется определить, можно ли считать точность обработки двух станков одинаковой. Другими словами, нужно проверить нулевую гипотезу о том, что распределения погрешностей обработки двух станков описываются одинаковыми функциями распределения.

Расположим данные табл. 25 в общую последовательность в порядке возра­ стания результатов измерения (табл. 26).

Станок

Обозна­ чение

Таблица 25

Результаты измерения деталей выборок

Порядковый номер обработанных деталей

1 2 3 4 5 6 7 8 9 10 и 12 13 14 15 X

S

1

X

14

20

27

13

23

17

14

9

10

19

17

13

11

4

5

14.4

6,3

№ 2

У

4

18

3

10

8

20

10

И

16

10

13

20

15

21

8

12.5

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 26

 

Таблица значений х и у в последовательности возрастания

 

 

 

 

 

 

 

 

 

их величин

 

 

 

 

 

 

 

 

У

У

 

 

 

У

 

У

 

 

У

У

У

 

X

У

X

У

X

3

4

4

 

5

8

 

8

9

 

10

10

10

 

10

11

И

13

13

 

 

 

 

У

У

 

 

 

 

У

X

У

 

У

X

У

X

X

13

14

14

 

15

16

 

17

17

 

18

19

20

 

20

20

21

23

27

Число инверсий для х будет равно

 

 

 

 

 

 

 

 

 

 

 

 

ц = 2 + 2 + 4 + 7 + 8 + 9 + 9 + 9 + 9 + 1 1 + 11 +

 

 

 

 

 

 

 

 

+

1 2 + 1 4+ 1 5 + 15=

137.

 

 

 

 

 

По формулам (128) и (129) находим

°и= У ^ 1 Г ~ (15+15+ 1)™ 24,

Задаваясь уровнем значимости q = 0,05 и принимая во внимание, что при <7=0,05 t = 1,96, определим критические значения для и:

112,5 — 1,96-24 л* 66;

112,5+ 1,96.24 л * 158.

Полученное значение инверсии и = 137 не выходит за пределы критической области. Поэтому наша нулевая гипотеза не опровергается и, следовательно, нет основания считать, что станки существенно отличаются по точности.

Глава V

КОРРЕЛЯЦИОННЫЕ СВЯЗИ

1. ПОНЯТИЕ 0 СТОХАСТИЧЕСКИХ И КОРРЕЛЯЦИОННЫХ СВЯЗЯХ

В различных исследованиях как производственного, так и ла­ бораторного характера часто приходится изучать связи между различными количественными или качественными признаками. Если какая-либо физическая величина определяется как одноз­ начная функция одной или нескольких величин

у = f (х, 2,

и),

 

 

 

т. е. когда величина у вполне определяется значениями х,

z,

., и,

то такую связь величины у с величинами х, z,

., и

мы

назы­

ваем функциональной. Функциональная связь может существовать и между случайными величинами. Но между случайными величи­ нами может существовать и связь другого рода, которая прояв­ ляется в том, что одна из случайных величин реагирует на изме­ нения другой изменениями своего закона распределения. Такая связь называется стохастической (вероятностной), или стати­ стической, так как она обнаруживается лишь при массовом изу­ чении признаков.

Стохастическая связь между двумя случайными величинами обычно появляется тогда, когда имеются общие случайные фак­ торы, влияющие как на одну, так и на другую величину, наряду с другими, неодинаковыми для обеих величин, случайными фа­

кторами. Например,

если

 

 

X

/(^1»

^2» Яз

&пи ^1> ^2»

 

У

ф (^ 1 > ^ 2» Я3. •>

^ 1» ^ 2>

•> ^п)у

то величины х и у будут связаны между собой стохастически. Это значит, что каждому заданному значению х будет соответст­ вовать не одно определенное значение у , а целое распределение у% которое изменяется с изменением х.

Стохастические связи могут быть весьма сложными, но наибо­ лее простым и имеющим важное практическое значение видом сто­ хастической связи является так называемая корреляционная связь. Корреляционная связь между двумя случайными переменными

величинами выражается в том, что на изменения одной случайной величины другая случайная величина реагирует изменениями своего математического ожидания или среднего значения. Таким образом, понятие корреляционной связи является более узким, чем понятие стохастической связи, так как математическое ожи­ дание является только лишь одним из параметров распределения и еще не определяет закона распределения в целом.

Если имеются две статистические случайные величины х, у и если различным значениям х соответствуют определенные сред­

ние для у, которые будем называть условными средними ух,

то связь между ух и х называется корреляционной связью у с х. Корреляционная связь может быть прямолинейной или криво­

линейной. В общем виде связь ух с х может быть выражена урав­ нением

Ух = Нх).

Это уравнение называют уравнением регрессии у на х, или

корреляционным уравнением.

2. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ И КОРРЕЛЯЦИОННОЕ ОТНОШЕНИЕ

При изучении корреляционных связей возникает три основ­ ных вопроса: наличие связи, форма связи и сила связи. Для по­ лучения ответа на эти вопросы необходимо сначала вычислить коэффициент корреляции и корреляционное отношение.

Для вычисления коэффициента корреляции предварительно составляются корреляционные таблицы 27 и 28 результатов наблюдений. Таблицы имеет следующую структуру: по горизон­ тали вверху выписываются наблюденные значения случайной ве­ личины х, по вертикали слева — значения у.

 

 

 

Таблица 27

 

 

 

Таблица 28

 

Корреляционная

таблица

 

 

Корреляционная

таблица

 

Значения

Значения х

 

Значения

Значения х

 

 

 

 

 

 

 

У

1

2

3

4

У

1

2

3

4

 

 

1

1

1

1

1

3

3

1

2

2

1

 

2

1

3

3

1

3

1

2

3

1

3

3

1

4

1

2

1

4

1

3

3

1

5

 

1

2

5

1

3

3

1

Вкаждом столбце корреляционной таблицы против значений х

иу указываются их частоты.

По характеру таблицы можно ориентировочно судить о нали­ чии или отсутствии корреляционной связи между у их. Например,

94

ё табл. 27 она обнаруживается, а в табл. 28 ее нет, так как у Изме­ няется одинаково при всех значениях х.

Имея корреляционную таблицу, подобную табл. 27, и обозна­ чив через пху частоту некоторой пары значений х и у, вычисляют

величину Сху:

 

_ I in x y ( x - X ) ( y - Y )

(133)

^ XU -

которая равна частному от деления на общее число наблюдений суммы произведений отклонений значений хм у от их средних X

и Y на соответствующие частоты. Эта величина Сху носит назва­ ние ковариации х и у. Частное от деления величины Сху на про­ изведение средних квадратических отклонений величин х и у, которые обозначим через ах и оуу называется коэффициентом корреляции х и у и обозначается через гху:

 

 

 

г _ С х у

 

 

 

(134)

 

 

 

ху

Ох-Оу

 

 

 

 

 

 

 

 

 

 

 

Для

упрощения и облегчения

вычислений

ковариации

Схуу

а также

ох и оу можно

пользоваться

следующими

формулами:

 

 

r

2 №

v ^ )

- X Y - ,

 

 

(135)

 

 

 

 

п

 

 

 

 

 

 

 

 

а, =

] /

^

 

.

 

 

(136)

 

 

 

 

 

 

- X 2;

 

 

 

 

 

 

 

 

- У 2,

 

 

 

(137)

где пх и ту — частоты соответственных значений х

и у.

 

 

Корреляционное отношение г\у

вычисляется по формуле

 

 

 

 

Т1y = %L,

 

 

 

(138)

 

 

 

 

° У

 

 

 

 

 

где оу — среднее

квадратическое

отклонение

значений

yt

от

 

средней

Y\

 

 

отклонение

значений

частной

ОуХ— среднее

квадратическое

 

средней ух от общей средней

F, т. е.

 

 

 

 

 

 

«ь- /Е Н Ж .

 

 

(139)

Основные свойства коэффициента корреляции и корреляцион­ ного отношения. 1. Если коэффициент корреляции гху равен плюс или минус единице, т. е.

Гх у = ±1,

то х и у связаны точной прямолинейной связью вида

у = а + Ьх

или

х= с + dy.

2.Если гху = 0, между х и у не может существовать прямо­

линейной корреляционной связи, но криволинейная возможна. 3. Чем ближе гху к ±1, тем точнее и теснее прямолинейная корреляционная связь между х н у . Она ослабевает с приближе­

нием гху к нулю.

4. Если корреляционное отношение г]v = 0, то между у и х нет корреляционной связи.

5.Если г\у — 1, то у связано с х однозначной связью, т. е. всякому значению х соответствует одно определенное значение у.

6.Чем ближе г\у к единице, тем теснее связь у ох, чем ближе

кнулю, тем эта связь слабее.

7. Если •Цу = \ гху\, то регрессия у на х точно линейна и обратно: если регрессия у на х точно линейна, то г\у ~~ I гух |*

3, ПРЯМОЛИНЕЙНАЯ КОРРЕЛЯЦИОННАЯ СВЯЗЬ

Если на основании анализа коэффициента корреляции и корре­ ляционного отношения установлено наличие прямолинейной кор­ реляционной связи между у и л*, то эту связь можно выразить в виде следующего уравнения:

yx - Y = rxy^ - ( x - X ) = b ( x -

} 0,

(140)

где Ъ = гху ~~ называется коэффициентом

регрессии у

на х ,

а уравнение (140) — уравнением регрессии^у на х.

Так как в уравнении (140) величины Ь, у , X являются постоян­ ными, то после подстановки их числовых значений уравнение примет вид

Ух = а + Ьх.

(141)

Вычисление коэффициента корреляции и корреляционного от­ ношения удобно производить с помощью вспомогательных таб­ лиц. Построение этих таблиц покажем на примере.

Пример 33. Вычислить коэффициент корреляции и корреляционное отноше­ ние для данных, сведенных в корреляционную табл. 27, и составить уравнение регрессии у на х.

Для удобства выполнения необходимых вычислений составим табл. 29. В этой таблице в столбце 1 записываются частоты ту значений у, а в строке 1 —

частоты пх значений х. По столбцу 1 и строке 1подсчитываются суммы, которые должны совпасть.

В столбце 2 записываются произведения туу , а в столбце 3 — произведе­ ния ту >у2, для образования которых необходимо перемножить значения столбца 2 на соответствующие значения у. В строке 2 записываются произведения пх ,

96

Корреляционная таблица с данными для расчета коэффициента корреляции

 

 

Значения х

 

 

Номера столбцов

 

Значения у

1

2

3

4

1

2

3

 

ти

 

 

 

 

 

 

 

ти«

 

 

 

 

 

 

 

 

1

1

1

1

1

1

2

2

1

 

3

6

12

3

1

2

4

12

36

4

1

2

1

4

16

64

5

1

2

3

15

75

о

1

Пх

4

4

4

3

£ (1 )= 1 5

2

пх -х

4

8

12

12

2 (2)=36

сх

н

 

 

 

 

 

 

а

3

Пх-Х2

4

16

36

48

Ц ( 3) = 104

яз

сх

4

£ п^-г/

8

12

16

14

2 (4)=50

0>

о

5

*2

8

24

48Г

56

2 ( 5 ) = 136

Я

 

6

Ух

2

3

 

4,7

 

о ю II

2 = 1 3 8

а в строке 3 — произведения х2, для образования которых надо перемножить значения строки 2 на соответствующие значения х.

В каждой клетке строки 4 записывается сумма произведений частот пху

на соответствующие значения у. Например, для значения х = 1 и м е

е м :^ ^ - У=

= 1 • 1 + 2 -2 + 1 .3

=

8, для значения

х = 2: ^ п ху- у= 1 • 2 + 2 -3

+ 1 • 4 = 12,

для значения х =

3:

# = 1 * 3 +

2 -4 + 1 -5 = 16 и т. д. В строке 5 записы­

ваются произведения значений строки 4 на соответствующие значения х. В строке 6 вычислены ух путем деления значений строки 4 на значения строки 1, т. е.

Ух

Yin*yy

Пх

Пользуясь данными табл. 29, легко вычислить статистические характери­

стики распределений х и у, а также значения Сху и гху:

^

36

 

15

у _ Ъ тУу 50

= з . з з ;

15

^ху- £№«•») _*F_!f_2,4.3,3-,,075;

7

И. С. Солонин

97

ах =

%пх-х2 X2

У2

| / J ^ _ 2 , 4 2 = 1,08;

j / i j - 3 , 3 3 2= 1,20;

С х у

1,075

0,826.

r x y Ox•оу

1,08-1,20

Близость коэффициента корреляции к единице указывает на довольно тесную прямолинейную корреляционную связь между у и х .

Используем этот же пример для вычисления корреляционного отношения %, которое вычисляется по формуле (138), но для использования этой формулы необ­ ходимо сначала вычислить о' по формуле (139).

Для удобства вычислений а-

составим табл.

30.

 

 

 

ух

 

 

 

 

Таблица 30

 

Исходные данные для

вычисления о-

 

 

 

 

 

 

 

 

ух

 

 

пх

Ух

 

У х - *

СУх - У ) 2

м * * - * ) 1

1

4

2

 

—1,33

1,760

7,04

2

4

3

 

—0,33

0,109

0,436

3

4

4

 

0,67

0,450

1,80

4

3

4,7

 

1,37

1,88

5,64

 

15

 

14,916

Пользуясь

данными

табл. 30,

вычислим

о-

:

 

 

= /

 

- / H g S - M a

 

 

 

 

 

Корреляционное отношение

 

 

 

 

 

 

 

аих

_ 0,99

 

 

 

 

 

 

*]«, = ■On

1,2

=

0,826.

 

Таким образом, мы получили, что т]^ = гху. Это указывает на наличие точной линейной регрессии у на х . Составим уравнение линейной регрессии у на х, пользуясь формулой (140):

й - 3,33 = 0,826-Ь2° (ж-2,4);

ух = 0.92л: + 1,13.

Вычислим по этому уравнению теоретические значения ух для значений х и сопоставим их с наблюденными значениями ^ из табл. 29:

х

1 2

 

3

4

у’х

.2

3

4

4,70

. 2,05

2,97

3,89

4,81

На рис. 28 дано графическое изображение линейной связи у с х.

Если значения х и у выражены многозначными числами, то для упрощения вычислений параметров уравнения регрессии у на х , коэффициента корреляции, корреляционного отношения и статистических характеристик распределений можно переменные х и у заменить на

х'

у’

(142)

 

Сх

 

где ах и ау — новые начала отсчетов, в качестве которых рекомендуется прини мать значения х и у с наибольшими частотами;

Сх и Су — величина интервала по х и у.

По вычисленным значениям X , Y ,

х , сг« ,

о- ,

С^ ху

можно перейти к деи-

 

 

 

 

 

 

 

J

ух

J

 

 

 

 

ствительным значениям этих величин по форму

Ух

 

 

 

 

 

лам:

 

 

 

 

 

 

 

 

 

 

 

 

х= ах + схХ'\

 

 

(143)

5

 

 

 

 

r

 

 

 

 

 

<Гч

J

7 = ау +

 

 

 

 

 

 

 

cyY

 

 

(144)

 

 

 

 

 

 

 

AN.<

К

 

*Q II

 

X*

А

 

 

(145)

 

 

 

<cQ

II

 

 

A

 

 

(146)

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=c -a'- ;

 

 

 

 

 

 

 

 

a-

 

 

(147)

 

 

 

 

 

 

Ух

 

 

У

Ух

 

 

 

 

 

 

 

 

'xy =

cx ‘ Cy ' C x y

 

 

(148)

 

 

 

 

 

 

 

Рис.

28.

График

 

линейной

 

 

 

 

 

 

 

 

 

Для вычисления коэффициента

корреляции

корреляционной связи у с х:

гху и корреляционного отношения ч\у достаточно

а

— теоретическая;

 

б — эмпи­

вычислить С ху1 а х,

а у

 

о- , так

как

 

 

рическая

линия

регрессии

 

 

 

 

Ух

 

 

 

 

 

 

 

 

 

гху

:

.

Сх.у

 

Сх ‘СуСХу

"*У

 

 

 

(149)

 

У

 

 

 

°х°у

 

 

 

 

 

 

 

с х ,(7х ' с у ' а у

 

 

 

 

 

 

 

 

а-

с -О-

О-

 

 

 

 

 

 

 

 

 

Чу’-

Ух

У

Ух

Ух

 

 

 

 

(150)

 

 

 

 

 

 

v

ai/

 

 

 

 

 

 

Если при наблюдениях получено небольшое значение гху и возникает вопрос, не случайно ли значение гху отличается от нуля и не равен ли действительный коэффициент корреляции нулю, то этот вопрос разрешается сравнением числен­ ного значения гХу с ог.

Приближенно можно считать, что среднее квадратическое

отклонение ог

коэффициента корреляции гху численно равно

 

ar = t1— l* L .

(151)

V n — l

 

Когда действительное значение коэффициента корреляции гХу равно нулю, то

1

(152)

аг- у ^ л ’

 

Поэтому, если

— \ r Xy \ V " n ^ l Ss3,

(153)

то можно считать гху значащим и связь реальной, если же

\ r Xy \ V " i T - i < Z ,

(154)

то гху отличается от нуля с большой вероятностью лишь случайно и связь наблю­ дениями не доказывается.

4. КРИВОЛИНЕЙНАЯ КОРРЕЛЯЦИОННАЯ СВЯЗЬ

Если коэффициент корреляции гху очень мал и прямолиней­ ная связь у с х отсутствует, то возможна криволинейная связь. Для криволинейных корреляционных связей мерой силы связи является корреляционное отношение, которое определяется ра­ венствами:

для связи у с х:

для связи х с у:

ху

Если у с х связаны однозначной связью, то r\y = 1; если связи между ними нет, то ч\у = 0. Аналогичные свойства относятся и к цх. Корреляционная связь между у и х будет тем теснее, чем ближе ть, к 1, и тем слабее, чем х\у ближе к 0.

Наиболее часто наблюдающейся в различных технических исследованиях криволинейной корреляционной связью является параболическая связь, которая выражается уравнением параболы /2-го порядка. Рассмотрим случай, когда уравнение регрессии у

на х имеет вид параболы второго порядка:

 

Ух = а + Ъх + сх2,

(155)

где a, by с — постоянные коэффициенты;

ух— частные средние значений у у соответствующие раз­ личным заданным значениям х.

Для определения коэффициентов а, 6, с составляются три урав­ нения:

па + Ъ2 пхх + с 2 пхх2= 2 пхух\

а £ пх-х +

b 2 пх-х2 + с 2

пхх3 =

£

пх-хух\

(156)

а S

+

bYl Пх-Х3+ с 2

rtjc*4 =

2

ПхХ3‘Ух>.

 

где п — общее число наблюденных значений х\

 

пх — частота

каждого значения

х.

 

 

 

Решение этих трех

уравнений дает значение коэффициентов а,

Ь, с.

 

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]