Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая статистика в технологии машиностроения

..pdf
Скачиваний:
24
Добавлен:
15.11.2022
Размер:
8.19 Mб
Скачать

Способ длины и числа серий. Пусть имеется последователь­ ность, в которой наблюдается случайное чередование т элемен­ тов, состоящее из п г элементов первого рода и п 2 элементов вто­ рого рода. Если обозначить элементы первого рода буквой а, а элементы второго рода буквой 6, то такую последовательность можно представить в виде чередования букв а и 6, например:

a a a b b a a b a a b b b b a a b b a b .

Данная последовательность состоит из 10 элементов а и 10 эле­ ментов Ьут. е. п 1 10, /г2 = 10 и т = п 1 + п 2 = 10 + 10 = 20.

Совокупность следующих друг за другом одинаковых элемен­ тов называется серией. Число элементов, входящих в серию, на­ зывается длиной серии. В нашем примере последовательность со­ стоит из 10 серий, в том числе имеется 5 серий из элементов а и 5 серий из элементов Ь. Эти серии расположены в следующей по­ следовательности: серия а состоит из трех элементов, серия b — из двух, серия а — из двух, серия b — из одного элемента и т. д.

Следовательно, длины этих серий равны: 3, 2,

2, 1 и т. д. Обо­

значим

буквой К наибольшую длину

серии

любого элемента,

а буквой R — общее число серий элементов а и 6. В нашем при­

мере К = 4, R =

10. Для величин К и R в случайных выборках

из совокупностей

с непрерывным распределением найдены за­

коны из

распределения. С помощью

этих законов вычислены

критические значения К и R в случайных выборках объема п =

= Юч-200 при доверительном уровне вероятности q =

0,05. Эти

критические значения К и R используются в качестве крите­

риев для проверки гипотезы «случайности» выборки.

 

 

Критические значения наибольшей длины серии К

 

в случайных выборках объема п при доверительной вероятности

 

 

 

q = 0,05:

 

 

 

 

К

5

б

7

8

9

10

11

12

п

10

14

22

34

54

86

140

230

Из приведенных данных следует, что, например, в выборке объема п = 10, если она случайна, появление серии длиной К = 5 или более имеет вероятность q = 0,05. Такую же вероятность имеет появление серии длиной К ^ 6 для выборок объема п = = 1 l-f-14. Так как вероятность q = 0,05 очень мала, а маловероят­ ные явления практически осуществляются очень редко или почти не осуществляются, то появление в выборке объема п такой длины серии Ку какая приведена выше или более этого значения, укажет на то, что данная выборка является не случайной.

Критические значения чисел серий R в случайной выборке объема п при доверительной вероятности q = 0,05:

R

3

6

11

15

19

24

33

42

51

60

70

79

88

п

10

20

30

40

50

60

80

100

120

140

160

180

200

Например, в выборке объема п = 10, если она случайна, можно встретить общее число серий R ^ 3 только с вероятностью

q == 0,05, а в выборке объема п = 41-4-50 с такой же вероятностью можно встретить R С 19. Поэтому, если в действительности в вы­ борках объема п встретится такое общее число серий R, какое ука­ зано выше для соответствующего п или менее этого числа R, то в силу принципа практической невозможности маловероятных яв­

лений надо

считать наблюденное число серий, а следовательно,

и выборку

не случайными.

Таким образом, если обозначим наблюденное значение длины серии в выборке буквой Кн, а наблюденное значение общего чи­ сла серий RH, т о д л я принятия гипотезы случайности выборки не­ обходимо наличие следующих двух условий одновременно:

КН< К \ RH> R ,

где К и R — табличные значения критерия для соответствую­ щих значений п.

Для того чтобы гипотезу случайности отвергнуть, достаточно наличие хотя бы одного из двух условий:

К н ^ К , R H^ R .

Сама процедура проверки гипотезы «случайности» выборки из генеральной совокупности с непрерывным распределением заклю­ чается в следующем. Берется выборка объема п и значения ее чле­ нов xi (например, действительных размеров) записываются в по­ рядке извлечения экземпляров выборки. Затем определяется ме­ диана наблюденного ряда значений xt и производится разбивка наблюденного ряда значений на два класса: на большие медианы и меньшие медианы. Значения xi, большие или равные медиане, обозначают буквой а, значения xt, меньшие медианы,- буквой Ъ. Таким образом, вся последовательность наблюденного ряда зна­ чений Х[ разбивается на элементы а и Ь, где

а = х* Ss Me, b = X/ < Me.

Составив последовательность из элемента а и Ь, определяют наибольшую длину серии Кн и общее число серий RH. Затем срав­ нивают Кн и RHс табличными значениями этих критериев и по ре­ зультатам сравнения принимают или отвергают нулевую гипотезу. Нулевая гипотеза всегда заключается в том, что выборка предпо­ лагается «случайной».

Пример 27. С автомата, обрабатывающего ролики диаметром D = 20_оло мм, взята текущая выборка объема п = 20. Действительные размеры роликов в по­ рядке их изготовления имеют следующие значения: 19,89; 19,92; 19,87; 19,86; 19,89; 19,90; 19,95; 19,84; 19,90; 19,88; 19,91; 19,88; 19,93; 19,92; 19,84; 19,86; 20,0; 19,92; 19,94; 19,96.

Необходимо установить, является ли данная выборка случайной. Другими словами, выяснить, не было ли смещения центра распределения размеров в пе­ риод отбора пробы.

Для проверки гипотезы случайности выборки воспользуемся критериями К и R. С этой целью сначала определим медиану наблюденного ряда значений раз­ меров. После расположения этого ряда в возрастающем порядке оказалось, что М е = 19,90 мм. Теперь представим наблюденный ряд значений размеров Df

ег

впорядке изготовления роликов иа станке в виде последовательности элементов

а= Me и b = Z)/ < Me:

 

babbbaabababaabbaaaa.

 

В полученной последовательности наибольшая длина серии равна Кн =

4,

а общее число серий RH=

12. По приведенным ранее критическим значениям

длины серии К и чисел серии R имеем для п = 15 22 /С = 7, а для п =

20

R = 6. Так как Кн < К и

> R, то наша гипотеза случайности выборки может

быть принята.

 

 

5. ПРОВЕРКА ГИПОТЕЗЫ РАВЕНСТВА ДВУХ ВЫБОРОЧНЫХ СРЕДНИХ

Предположим, что из одной и той же генеральной совокупности

взяты две выборки, которые для величины х дают средние Х\ и Хъ отличные одна от другой. Требуется узнать, случайно ил_и_не слу­ чайно они отличаются друг от друга. Этот вопрос имеет важное зна­

чение при проведении опытов. Если расхождение между Х\ и Х%_ будет существенно, то это может указать на ошибки в опытах или в методике их выполнения, тогда как случайность их расхож­ дения указывает на отсутствие таких ошибок.

Подобный вопрос возникает и при исследовании влияния раз­ личных факторов на изучаемый признак. Если опыты с факто­

ром А и без него дали отличные друг от друга Х\ и Хг, то при слу­ чайном отличии значений их очевидно, что фактор А не влияет на исследуемый признак и, наоборот, влияет при существенном

расхождении между Х\ и Хг. Наконец, может возникнуть на прак­ тике и такой вопрос: принадлежат ли две выборки одной и той же генеральной совокупности. И этот вопрос можно разрешить,

сравнивая выборочные средние Х\ и Хг и оценивая их расхожде­ ние. Если выборки взяты из одной и той же генеральной совокуп­

ности, то расхождение между Х\ и Х2 будет случайно, и, наоборот, оно будет существенно, когда выборки не будут принадлежать одной и той же совокупности.

Рассмотрим два возможных случая: 1) выборки берутся из нор­ мальной генеральной совокупности и 2) выборки берутся из сово­ купности, которая не подчиняется закону нормального распре­ деления или когда закон распределения генеральной совокупности неизвестен.

Для первого случая оценка расхождения двух выборочных сред­ них производится при помощи критерия t Стюдента. Если выборки

берутся из нормальной совокупности,

то величина

t =

(115)

X

 

подчинена распределению Стюдента и может быть оценена при по­ мощи таблицы вероятностей P ( \ t \ ^ s t1) (см. приложение 5); S- вычисляется по формуле

 

/Zi

^2 — 2

 

Kr'ij

 

 

Принимая во внимание, что

 

 

 

 

 

 

 

X)2 = sa

и

2 (л; — X)2= s*-n,

 

 

выражение (116) можно заменить следующим:

 

 

 

nl'sl H~ n2‘s2

 

+ *4

(117)

 

rti 4“ ^2 — 2

nx-n2

 

 

 

Подставляя значение S- из выражения

(117) в формулу (115),

окончательно получим

 

 

 

 

 

 

t =

\ X i - X t \

 

П1 -П2 (П 1 + fly — 2)

(118)

y~nv sl + nr sl

 

 

«1 + л2

 

 

 

 

 

где n\ и пг — объем выборок; Х\

и Х 2;

s?

и st — их средние

и

дисперсии.

 

 

 

 

 

 

 

При оценке полученного значения t по таблице приложения 5

необходимо принимать k = п1 +

п2 — 2.

Таблица Р (| /| ^

/х)

дает вероятность случайных значений i,

которые численно не ме­

нее наблюденного значения tx. Если эта вероятность будет очень мала (практически, когда Р ^ 0 ,0 5 ), то наша нулевая'гипотеза о несущественном, случайном расхождении между выборочными средними должна быть забракована. Если же вероятность Р ( 11\ ^ гз> /х) будет достаточно велика (практически, когда Р >> 0,05), то гипотеза однородности выборочных средних может быть при­ нята.

Рассмотренный метод сравнения и оценки расхождения вы­ борочных средних пригоден для малых выборок, когда объем их я < 25. При этом необходимо отметить, что применение критерия связано с предположением о равенстве дисперсий выборок. Это последнее допущение должно быть предварительно обосновано. В противном случае показания критерия t могут привести к оши­ бочным заключениям. Методика проверки равенства дисперсий выборок будет изложена ниже.

Если объем выборок я >» 25, то критерий t вычисляется по фор­ муле

t =

l * i -x,i

(119)

 

Пример 28. С автомата, обрабатывающего втулки D = 20+0,2 мм,

было

взято в разное время две выборки по 5 шт. каждая. Результаты измерения диа­ метров втулок приведены в табл. 23.

Распределение диаметров втулок предполагается нормальным. Поскольку выборки взяты из продукции одного и того же станка, можно предполагать, что

Результаты измерения диаметра втулок

JVBвыборки

 

 

№детали

 

 

X

 

1

2

3

4

5

 

 

 

 

 

Выборка

1

20,05

20,08

20,1

20,1

20,09

20,084

0,0004

Выборка

2

20,10

20,15

20,05

20,08

20,10

20,096

0,0013

о\ = 02- Пусть теперь наша гипотеза заключается в том, что генеральные средние

в моменты взятия выборок были равны между собой, т. е. Xoi = ЛогДругими словами, настройка станка в момент взятия пробы № 1 и № 2 не изменилась.

В результате вычислений средних арифметических и дисперсий выборок по­ лучено

Х1 =

20,084;

Х 2 = 20,096;

sf = 0,0004;

sf =

0,0013.

Определим

t:

 

 

 

 

 

 

 

,

-

20,096 — 20,084

т /

5-5 (5 +

5 — 2)

Л со

I =

■■■.

■----■■■ . ■■- - •

I/

------- =" ■,--g--------

= 0 ,0 0 .

 

^0,0004-5+ 0,0013-5

Г

5 +

5

 

 

Из таблицы приложения 5 находим, что при &=

5 +

5 — 2 = 8 вероятность

Р ( \ 11^ /1) =

0,58. Эта вероятность не мала, она значительно больше довери­

тельного уровня

Р = 0,05, поэтому наша гипотеза может быть принята.

Пример 29.

При одних и тех же условиях было обработано по 25 шт. втулок

разверткой d =

6 мм и разверткой d =

10 мм. Результаты измерений двух пар­

тий втулок показали, что средняя величина разбивки отверстий (разность между

диаметром

отверстия

и

диаметром

развертки) составляет

для d = 6 мм

Х \ = 10,4

мкм, для

d — 10 мм Хч =

9,8

мкм. Дисперсии

величин разбивок

соответственно равны:

=

3,8 мкм2\ s%=

4,76 мкм2.

 

Необходимо установить, влияет ли диаметр развертки на величину раз­ бивки отверстий, если предварительными опытами установлено, что рассеива­ ние величин разбивки подчиняется нормальному закону распределения. Наша нулевая гипотеза будет состоять в том, что размер развертки не влияет на вели­ чину разбивки.

Вычислим величину t по формуле (112):

 

 

10,4 — 9,8

= 1,03.

Т

/ 3,8 ,

4,76

 

V

25 “Г

25

 

v

По таблице приложения 5 этому значению t соответствует Р = 0,31. Эта вероятность не мала, следовательно, наша нулевая гипотеза верна, т. е. можно считать, что размер развертки в пределах от d = 6 мм до d = 10 мм не ока­ зывает существенного влияния на величину разбивки отверстий.

Случаи выборок не из нормальной совокупности. Если выборка взята из генеральной совокупности, распределение которой не сле­ дует закону нормального распределения, то оценка расхожде­ ния двух выборочных средних возможна лишь приближенная.

Для этой цели также определяется величина /, причем t вычисляется так же, как и в предыдущем случае по формуле (118) или (119) в зависимости от объема выборок.

Если окажется, что / ^ . 8, то с большой вероятностью (которая, однако, остается неопределенной) можно считать, что средние Х \ и Х 2 различаются суще­

ственно друг от друга и, наоборот, при t < 3 расхождение между Х \ и Х 2 с большой вероятностью можно считать несущественным, случайным.

в. ПРОВЕРКА ГИПОТЕЗЫ РАВЕНСТВА ДВУХ ВЫБОРОЧНЫХ ДИСПЕРСИЙ

Пусть имеются две выборки из нормальной совокупности. Объем каждой выборки равен п х и п2. Дисперсии этих выборок

соответственно равны s\ и si. Можно ли считать при наличии

некоторых различий между величинами s? и si, что данные вы­ борки принадлежат одной и той же генеральной совокупности? Или можно поставить вопрос так: произведено два опыта, из ко­ торых один опыт производился с фактором А, а другой — без него. Каждый опыт повторялся п раз. В результате обработки статис­ тических данных получено, что дисперсия признака х в опытах

с фактором А равна величине sh, а без него — s§. Оказывает ли существенное влияние исследуемый фактор А на признак х? Для ответа на поставленные вопросы необходимо произвести срав­ нение дисперсий и оценить, является ли существенным их раз­ личие. Сравнение дисперсий производится по их отношению:

т = 4 -

(12°)

S2

 

В числителе всегда ставится наибольшее значение, из двух на­ блюденных дисперсий. Для этого отношения найден закон рас­ пределения его в бесконечной совокупности случайных незави­ симых выборок из нормальной совокупности. По этому закону вычислены значения Т (в зависимости от k 1 — n 1 — 1 и k 2 — = п2 — 1), которые можно встретить в выборках из нормальной совокупности для различных уровней доверительной вероят­ ности, сведенных в таблицы. Таблица значений Т для доверитель­ ной вероятности q = 0,05 приведена в приложении 6.

Для проверки нашей гипотезы необходимо вычислить наблю-

денное

s\

определить k x = n x — 1

значение Тн = — , а затем

и k 2 =

S2

 

n2 — 1. гДе ni и п2 — объемы выборок, и найти для этих

значений ki и k 2 табличное значение

Т

Если окажется, что наблюденное значение Тн равно или больше

табличного Т (Тн ^ Т), то такое значение Тн в выборках из нор­ мальной совокупности можно встретить лишь с вероятностью не более той, которая принята в качестве доверительного уровня. Если пользоваться данными таблицы приложения 6, то такой вероятностью является Р — 0,05. Так как эта вероятность очень мал^ то по принципу практической невозможности маловероятнъйс явлений надо считать, что наблюденное значение Тн отли-

86

чается от табличного не случайно, а существенно, и поэтому наша гипотеза должна быть забракована. Если же окажется, что тн< < 7 \ то гипотеза принимается.

Пример 30. С двух автоматов, обрабатывающих одинаковые детали, взято две выборки п1 = ^2 = 10. При этом оказалось, что s\ = 400 мклi2 и s| =

= 325 мкм2. Ранее было установлено, что рассеивание размеров деталей, обра­ ботанных на автоматах, следует нормальному закону распределения.

Можно ли считать, что оба станка обеспечивают одинаковую точность обра­ ботки? Предположим, что оба станка дают одинаковую точность и наблюденное расхождение между дисперсиями случайно. Для проверки нашей нулевой гипо­ тезы определим критерий Тн\

По таблице приложения 6 для Р = 0,05 при k ± = k 2 = 9 находим Т = 3,23, следовательно, Тн < Т. Поэтому надо считать нашу гипотезу верной, а наблю­ денное различие в значениях дисперсий выборок случайным.

Случай выборок не из нормальной совокупности. Если выборки берутся из совокупностей, незначительно отличающихся от нор­ мальных, то для сравнения дисперсий можно пользоваться кри­ терием Т . Но если совокупность имеет распределение, значи­ тельно отличающееся от нормального, то можно сравнивать дисперсии только для больших выборок. В этом случае за критерий оценки может быть взято отношение

1*1 — Sal

(121)

 

Если это отношение ts ^ 3, то расхождение между дисперси­ ями существенно; если ts < 3 — расхождение несущественно.

7. ПРОВЕРКА ГИПОТЕЗЫ РАВЕНСТВА РЯДА ДИСПЕРСИЙ

Пусть имеется m выборок не равных объемов /г/, взятых из од­ ной или пг генеральных совокупностей, имеющих нормальные рас­ пределения. При этом дисперсии этих совокупностей имеют оди­

наковые значения, т. е. о\ = о\ = (Тз = • • • = oh = а2, а ма­ тематические ожидания могут быть и не равны друг другу.

Дисперсии выборок s?, si, ., sm, вычисленные по фор­ муле (9), несколько отличаются друг от друга по величине. Тре­ буется проверить гипотезу о том, что это различие дисперсий выборок носит случайный характер, и, следовательно, дисперсии

генеральных совокупностей а?, из которых взяты выборки, равны

между

собой, т. е. а? =

ol = • • • = о2т = а2.

При

нашей гипотезе

величина

 

 

т

{ 122)

N т

где N = Jj nt\ следует

считать

несмещенной оценкой а2. Если

1

 

 

 

проверяемая гипотеза справедлива, то случайная величина

т

 

 

 

Е®?(п-1 )

_

s*(N — m)

i= 1

 

 

а2

 

а2

будет иметь распределение %2 с (N т) степенями свободы.

 

 

 

 

 

s?

при

нашей

Очевидно, что распределение отношения —

гипотезе зависит лишь от nL.

 

величина

 

 

Бартлет показал,

что

случайная

 

 

 

 

 

т

 

 

 

 

 

Q

 

/=1

 

 

 

(123)

где

 

 

 

 

 

 

 

 

(

т

 

 

 

 

 

 

 

 

 

 

 

 

 

2

N — от

 

 

 

 

 

 

(= 1

 

 

 

имеет

распределение,

близкое к

распределению

%2

с

— 1) = k

степенями

свободы,

если

только щ ^

3.

 

Для вычисления Q пользуются следующей формулой, в кото­ рой сделан переход от натуральных к десятичным логарифмам:

 

 

2,3026

(N — tn) lg s2 —

0 fes?

 

 

Q =

 

 

i=l

 

 

(124)

 

 

2 n t —

 

 

 

 

3 — 1)

l

 

 

 

 

 

 

1=1

 

 

 

Задаваясь

доверительным

уровнем

вероятности,

например,

q = 0,05

и

пользуясь

таблицей

приложения

13,

определяют

верхний

критический предел

%2

при (т — 1) =

k степеней сво­

боды. Если Q <С х2»то гипотеза принимается, если Q >> %2, то ги­ потеза бракуется.

Для вычисления Q рекомендуется составлять вспомогатель­

ную табл.

24.

выборок равны, т. е.

пх = п2 = • • 'Пк = п,

Если

объемы

то формула (124) принимает вид

 

 

 

2,3026т (я — 1)

 

 

Q =

т +1

(125)

3т (я — 1)

Вспомогательная таблица для вычисления

№ выбор­ ки

4

 

1

1

!«*?

nt

71,-1

/

2»/ 2 (»/-ч

где s2 вычисляется по формуле

»* = -5 -Х 1й

('26)

т1=1

Однако при равном объеме выборок проверку гипотезы од­ нородности дисперсий проще производить упрощенным приемом [5], основанным на вычислении критерия G:

G

(127)

Критические значения G для 5%-ного уровня значимости в за­

висимости от объема выборок п и числа

выборок т приведены

в приложении 14.

GH меньше табличного

Если найденное по данным выборок

G (GH< G), то гипотеза однородности дисперсий генеральных совокупностей, из которых были взяты выборки, принимается. Если GH>> G, то гипотеза бракуется.

Пример 31. С четырех автоматов, настроенных на обработку одних и тех же деталей, взято по одной текущей выборке объема п1 = п2 = п3 = д4= 10.

Дисперсии выборок имеют следующие значения: s\ = 100 мкм2, ^ = 300 мкм2>

S3 = 200 Л€/слг2, = 400 мкм2. Требуется установить, одинакова ли точность

автоматов, т. е. одинаково ли рассеивание случайных погрешностей обработки на этих автоматах, если предварительными исследованиями установлено, что это рассеивание подчиняется закону нормального распределения.

Для решения поставленной задачи необходимо проверить гипотезу однород­ ности выборочных дисперсий. Проверку этой гипотезы произведем при помощи критерия Q Бартлета и критерия G.

Для вычисления критерия Q по формуле (125) нужно вычислить s2, lg s и

£ i g S?.

По формуле (126) имеем

 

 

 

 

 

 

 

S2 =

(100

+

300 +

200 +

400) =

250.

 

 

 

 

 

4

 

 

 

IglOO =

2;

lg 300 =

2,48;

lg 200 = 2.30;

lg 400 = 2,60;

2

lg sj =

2 +

2,48 +

2,30 +

2,60 =

9,38;

lg 250 = 2,398;

 

2,3-4(10 — 1) ^2,398 —

4,37 4 ir

 

 

 

 

 

 

 

 

 

 

 

 

4 + 1

 

= T05 = 4-16-

 

 

 

3-4(10— 1)

 

 

По таблице приложения 13

для k =

3 и доверительной вероятности Р = 0,05

X2 = 7,8. Так

как Q <

%2, то

гипотеза однородности дисперсии принимается,

т. е. наблюденные значения s? отличаются друг от друга случайно. Это подтвер­ ждается и критерием G:

г 400 па ° н= Тооо = 0,4‘

По таблице приложения 14 для доверительной вероятности q = 5% G = 0,5. Так как GH < G, то гипотеза подтверждается.

8. ПРОВЕРКА ГИПОТЕЗЫ 0 ПРИНАДЛЕЖНОСТИ ДВУХ ВЫБОРОК К ОДНОЙ И ТОЙ Ж Е ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

Пусть имеются две серии независимых испытаний однородных величин х и у. При этом наблюденные значения xt и yt дают раз­

личные значения средних (X ф Y) или обнаруживают различные рассеивания (S* =+ Sv). Возникает вопрос, можно ли считать эти расхождения существенными или они носят случайный ха­ рактер. Например, с двух станков, настроенных на обработку одних и тех же деталей, взяты две текущие выборки. Средние и дисперсии этих выборок отличаются друг от друга. При этом за­ кон распределения генеральных совокупностей, из которых взяты выборки, неизвестен. Требуется проверить, обеспечивают ли оба станка одинаковую точность обработки.

Нулевая гипотеза в данном случае будет заключаться в том, что функции распределения х н у тождественны, т. е. выборки при­ надлежат одной и той же генеральной совокупности. Для проверки этой нулевой гипотезы может быть использован критерий Вилькоксона, основанный на числе инверсий. Под инверсиями в дан­ ном случае понимается следующее. Наблюденные значения х

иу в двух выборках располагают в общую последовательность

впорядке возрастания, например, в виде

Ух У2 * 1 * 2 Уз Vi Уъ Уз *4.

где x lt

., хА— члены первой выборки, а у и

у0 — члены

второй выборки.

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]