Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая статистика в технологии машиностроения

..pdf
Скачиваний:
24
Добавлен:
15.11.2022
Размер:
8.19 Mб
Скачать

Тогда

уравнение

(70) примет

вид

 

 

 

 

 

 

 

*2

 

 

 

<P(z) =

 

ы

dt =

 

 

 

 

 

1^2л

 

 

 

 

 

1

Jе

 

 

 

 

 

 

К2я

 

 

Так

как

—L_

J

е z

dt =

Ф(/), то

окончательно получим

 

 

\Г2л

 

 

 

 

Ф(г) =

т

Л

г

( ^ ) - Ф ( ^ ) !

=

- ф ( «~? + * )]. (72)

Так как среднее значение для х равно X, а для у рав­ но Y = Ь ~^а , то среднеезна-

Рис. 21. Композиция законов нормального распределения и равной вероятности

чение для закона композиции будет

Z = X + Y = X + А ± £ .

Дисперсия закона композиции

 

= +

(Ь-а)2

 

12

На рис. 21 приведены кривые распределения по закону компо­ зиции нормального распределения и распределения равной ве­ роятности при различных значениях отношения:

I

ЗсГдс К

Вид этих кривых показывает, что с уменьшением X они прибли­ жаются к нормальной кривой распределения. Поэтому когда а) ^ ах, то кривая распределения композиции мало отли­ чается от нормальной кривой и для практических целей часто может приниматься нормальной.

Глава I I I

ВЫБОРОЧНЫЙ МЕТОД

1. ОСНОВНЫЕ ПОНЯТИЯ ИОПРЕДЕЛЕНИЯ ТЕОРИИ ВЫБОРОК

Одной из основных задач математической статистики является разработку методов изучения массовых явлений или процессов на основе сравнительно небольшого количества наблюдений или опы­ тов. Эти методы имеют свое научное обоснование, свою теорию, которая носит название теории выборок. При изучении основных положений этой теории приходится встречаться с рядом новых понятий и определений, с которыми необходимо предварительно познакомиться.

Генеральная совокупность и выборка из нее. Группа предметов, объединенных каким-либо общим признаком или свойством каче­ ственного или количественного характера, носит название стати­ стической совокупности. Например, партия деталей представляет собой статистическую совокупность. Признак, по которому де­ тали объединяются в совокупность, может быть количественным (размер) или качественным («брак», «не брак»). Следовательно, одни и те же предметы могут образовывать несколько совокуп­ ностей в зависимости от того, по какому признаку они объеди­ няются в совокупность: количественному или качественному.

Предметы, образующие совокупность, называются ее членами. Общее число членов совокупности составляет ее объем. Если сово­ купность содержит конечное число членов, полученных в резуль­ тате испытаний, то она называется эмпирической.

Эмпирическая совокупность может состоять из очень большого числа членов, изучение или обследование которых представляет весьма трудоемкую задачу. В математической статистике для обсле­ дования большой совокупности прибегают к выборкам из нее.

Выборкой называется часть членов совокупности, отобранных из нее для получения сведений о всей совокупности. В этом случае совокупность, из которой извлекается выборка, называется гене­ ральной совокупностью.

Число членов, образующих выборку, составляет ее объем. Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы члены выборки правильно его представляли. Это требование коротко формулируют так: выборка должна быть репрезентативной (представительной).

Виды выборок. По способу

образования выборки делятся

на? повторные и бесповторные.

Повторная выборка образуется

путем последовательноп/извлечения из генеральной совокупности нескольких членов с возвратом каждого из них после соответствую­ щего обследования обратно в генеральную совокупность. При из­ влечении следующего объекта из совокупности не исключена воз­ можность снова вынуть этот же объект. Если из генеральной

42

совокупности произведено п таких извлечений объекта, то говорят, что образована повторная выборка объема п. Например, из партии в 1000 шт. деталей последовательно извлекается 10 деталей в сле­ дующем порядке: извлекается первая деталь и измеряется, затем она возвращается в совокупность, последняя перемешивается, за­ тем извлекается вторая деталь, производится ее измерение, снова деталь возвращается в совокупность, последняя перемешивается, извлекается следующая деталь и т. д. Извлеченные таким способом 10 деталей составят повторную выборку объемом в 10 шт.

Бесповторная выборка образуется путем извлечения некоторого числа членов генеральной совокупности для необходимого обсле­ дования без возврата этих членов в совокупность. Например, если из партии в 1000 шт. деталей сразу или последовательно будет извлечено 10 деталей без возвращения их обратно, то будет обра­ зована бесповторная выборка объемом в 10 шт.

Выборки, кроме указанных, делятся также на преднамеренные и случайные, мгновенные и общие, малые и большие.

Выборка считается преднамеренной, если отбор объектов для нее из генеральной совокупности производится с определенной тенденцией, приводящей к повышению или понижению вероят­ ности выявления изучаемого признака качества.

Выборка считается случайной, если все объекты генеральной совокупности имеют равную возможность попасть в выборку. Для образования случайных выборок пользуются либо отбором по

жребию, либо

путем

тщательного перемешивания

предметов

в ящике и отбора их наудачу из разных мест ящика.

выборка

Мгновенной

(или

текущей) выборкой называется

малого объема, взятая из числа единиц потока продукции, изготов­ ленных к моменту отбора в короткий промежуток времени, в кото­ ром проявление систематических погрешностей пренебрежимо мало.

Общей выборкой называется выборка, состоящая из серии мгно­ венных выборок.

Малой выборкой считается выборка, объем которой меньше 25 членов. Если объем выборки больше 25 членов, то она считается большой. В производственных исследованиях обычно большая выборка состоит из 50—100 или более членов, а малая выборка из 5—10 членов.

2. ЗАДАЧИ ВЫБОРОЧНОГО МЕТОДА

Выборочный метод позволяет решить две основные задачи, имеющие большое практическое значение. Первая задача заклю­ чается в установлении закона распределения изучаемой случай­ ной величины и параметров этого распределения по данным вы­ борки, вторая — в статистической проверке гипотез, выдвигае­ мых при различных производственных исследованиях. Второй задаче будет посвящена специальная глава.

Остановимся подробнее на первой задаче. На основании за­ кона больших чисел можно утверждать, что если генеральная со­ вокупность подчиняется определенному закону распределения, то и выборка из этой совокупности, если объем ее достаточно ве­ лик, будет подчиняться этому же закону. Утверждение будет тем точнее, чем больше объем выборки.

Всякую эмпирическую совокупность можно рассматривать как выборку большого объема из генеральной совокупности, подчиняющейся определенному теоретическому закону распре­ деления. Следовательно, по характеру эмпирического распределе­ ния можно установить с определенной точностью и надежностью близкое ему теоретическое распределение. Зная закон, которому подчиняется данное распределение, можно использовать его для решения практических задач.

В ряде случаев тип закона можно установить заранее. Для этого необходимо проанализировать средствами теории вероят­ ностей изучаемый процесс и подвести его, с некоторым приближе­ нием, к той или иной теоретической схеме. Например, основы­ ваясь на теореме Ляпунова, можно считать, что суммарная ве­ личина случайных погрешностей обработки при работе на настроен­ ных станках при отсутствии действия какого-либо доминирую­ щего фактора подчиняется закону нормального распределения. То же можно сказать о суммарной погрешности измерения, о сред­ ней высоте микронеровностей на обработанной поверхности и мно­

гих

других технических

величинах,

подверженных

колеба­

ниям под действием большого количества случайных

факто­

ров.

 

 

 

 

В этих случаях, когда закон распределения заранее может

быть

установлен, задача

сводится к

нахождению неизвестных

значений его параметров, т. е. к его параметризации. В случае нормального распределения задача сводится к установлению сред­

него арифметического значения изучаемой величины Х 0 и ее среднего квадратического отклонения а 0.

Оценка параметров распределения генеральной совокупности может быть практически осуществлена только на основании дан­ ных выборки из этой совокупности.

Беря выборку из генеральной совокупности и вычисляя ее

статистические характеристики X и s, можно с некоторым при­ ближением считать, что они по своим величинам будут близки

к

соответствующим

параметрам

генеральной совокупности Х 0

и

ст0, т. е. являться

их оценками.

Но для того чтобы эти оценки

достаточно правильно и близко характеризовали параметры генеральной совокупности, необходимо, чтобы они удовлетворяли трем требованиям: были бы состоятельными, несмещенными и эффективными.

Оценка называется состоятельной, если вероятность отклоне­ ния ее от оцениваемого параметра на величину, меньшую как угод-

но малого положительного числа е, стремится к единице при не­

ограниченном увеличении числа п

наблюдений, т. е.

Р [ | 0' — 0 1<d е] —»1

при

е > 0

и л —»оо,

где 0 — некоторый параметр

генеральной

совокупности;

0' — оценка этого параметра.

Оценка называется несмещенной, т. е. в ней отсутствуют си­ стематические погрешности, если математическое ожидание этой оценки равно оцениваемому параметру;

МО' = 0.

Если МО' > 0 , то оценку называют положительно смещенной; если МО' < 0 , то отрицательно смешанной.

Примером состоятельной и несмещенной оценки математичес­ кого ожидания является средняя арифметическая. Примером состоятельной, но смещенной оценки теоретической дисперсии о2 может служить эмпирическая дисперсия s2. Аналогичным обра­ зом при оценке величины о с помощью s мы получим состоятель­ ную, но при малом п значительно смещенную оценку о. Так как

т

S Uix i - x ? С* -г 1=1________

то с увеличением п вероятность Р (| s2 о2| < е) —►1 и, следо­ вательно, s2 является состоятельной оценкой, но математическое

ожидание Ms2 = ~ ~ о2 не равно а 2 и при конечном п дает пре­

уменьшенное значение оцениваемого параметра о2, поэтому, оценивая а2 по s2, мы допускаем систематическую ошибку, рав-

° 2

нук> — . однако при больших п она пренебрежимо мала.

Для того чтобы получить несмещенную оценку теоретической дисперсии о2 по эмпирическим данным, необходимо эмпирическую

дисперсию s2 умножить на

— тр, т. е.

 

т

_

т

__

2

-*)*/<

^(Xi -Xy -fi

s2 _ _J_____________П__ = _1_________

п п — 1 п — 1

Практически эту поправку вносят при вычислении оценки ди­ сперсии в тех случаях, когда п < 30 .

Состоятельных несмещенных оценок может быть несколько. Например, для оценки центра рассеивания нормального распреде­

ления, наряду со средней арифметической X, может быть взята

медиана Me. Медиана так же, как и X, является несмещенной состоятельной оценкой центра группирования. Из двух состоя­ тельных несмещенных оценок 0' и 0 " для одного и того же пара-

45

метра 0 естественно отдать предпочтение той, у которой дисперсия меньше.

Такая оценка, у которой дисперсия будет наименьшей относи­ тельно 0, называется эффективной. Например, из двух оценок центра рассеивания нормального распределения эффективной

оценкой является X, а не Me, так как дисперсия X меньше ди­ сперсии Me. Сравнительная эффективность Me при большой вы­ борке приближенно равна

Практически это означает, что центр распределения генераль­

ной совокупности Х 0 определяется по медиане Me с той же точ­ ностью при п наблюдениях, как при 0,6366 п наблюдениях по

средней арифметической X.

При разрешении задач, осуществляемых посредством выбороч­ ного метода, важное значение приобретают свойства выборочной средней и выборочной дисперсии, которые приведены ниже без доказательств.

3.СВОЙСТВА ВЫБОРОЧНЫХ СРЕДНИХ ИДИСПЕРСИЙ

1.Если объем выборки достаточно велик, то на основе закона больших чисел с вероятностью, как угодно близкой к достовер­

ности, можно утверждать, что средняя арифметическая X и ди­ сперсия s2 выборки будут как угодно мало отличаться от генераль­

ной средней Хо и генеральной дисперсии а2, т. е.

Х 0 ^

X, сто ^ s2, если п —>оо, где п — объем выборки.

2.

Ошибка вычисления генеральной средней Х 0 по средней X

выборки зависит от ее объема п и равна

S

(73)

Vh '

Ошибка вычисления среднего квадратического отклонения гене­ ральной совокупности по среднему квадратическому отклонению выборки зависит от ее объема и равна

(74)

IГЧп

3. Если случайная величина х в генеральной совокупности имеет нормальное распределение со средней Хо и дисперсией а2,

то и средние арифметические х выборок из этой совокупности будут подчинены также нормальному распределению со сред-

а2

ней X ^

Хо и дисперсией с£ =

, каков бы ни был объем вы­

борок /г, лишь бы число выборок было достаточно велико.

4. Когда дисперсия ol генеральной совокупности не известна, тогда для больших значений п с большей вероятностью малой ошибки можно дисперсию выборочных средних вычислять при­ ближенно по равенству

 

ст2-

S 2

(75)

 

Т ’

 

 

 

где s2 — дисперсия

большой выборки

объема п, вычисляемая

по формуле

(9):

 

 

 

т

 

 

 

S f‘ (xt-X)*

 

 

s2 —

 

'Оо.

5. Приведенная выше связь дисперсии выборочных средних с дисперсией генеральной совокупности ol в виде соотношения

действительна для повторных выборок. Для бесповторных вы­ борок эта связь выражается зависимостью

где п — объем

выборки;

N — объем

генеральной совокупности.

Если N по сравнению с п очень велико, что практически всегда имеет место, то для бесповторных выборок можно пользоваться

для вычисления о\ формулой (75), при этом ошибка будет весьма

ничтожной.

Из свойств выборочных средних и дисперсий следует, что точ­ ность вычислений средних арифметических и дисперсий или сред­ них квадратических отклонений генеральной совокупности по дан­ ным выборки из нее зависит от объема выборки, причем точность возрастает с ростом объема выборки. Однако практически не всегда бывает возможным или легко осуществимым взятие больших вы­ борок или проведение большого числа наблюдений. Часто на прак­ тике приходится ограничиваться взятием небольших выборок или ограничиваться малым числом наблюдений. В этих случаях важно сделать оценку точности и надежности приближенных ра­ венств

X о ^ X ; о о ^ s,

где Х 0 — среднее арифметическое значение случайной величины генеральной совокупности;

X — то же в выборке объема п из генеральной совокупности; а0 — среднее квадратическое отклонение генеральной со­

вокупности;

s — среднее квадратическое отклонение выборки.

4. ОЦЕНКА ТОЧНОСТИ ВЫЧИСЛЕНИЯ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ ПОДАННЫМ ВЫБОРКИ

Обозначим точность приближенного равенства X Q^ X бук­ вой е. Тогда определение точности вычисления генеральной сред­ ней по данным выборки сведется к определению вероятности а,

т. е. вероятности того, что истинное значение Х 0 находится в пре­ делах X ± е, где е > 0, т. е.

Р (X — е < Х 0 < Х + е) = а.

Для определения вероятности а пользуются распределением величины t:

(76)

Ох

Если генеральная совокупность имеет нормальное распределе­ ние, то величина t при любом п следует закону распределения Стюдента, который имеет следующее выражение:

 

*+i

 

 

Sk(t) = с ( 1 + 4 )

2

(77)

где

S* (/) — дифференциальная

функция

распределе­

 

ния t;

 

 

г( Ц 1 )

С= --------- 7*-г~---- постоянный множитель, зависящий только

^г ( т )

от числа степеней свободы k = п 1 . Символом Г (k) здесь обозначена гамма-функция (интеграл

Эйлера):

оо

Г{к)= J

О

Из выражения (77) следует, что распределение Стюдента за­ висит только от переменной t и параметра k = п — 1. Поэтому когда задана вероятность а, то можно найти такое положительное число /а, которое будет зависеть только от а и п по равенству

сс= Р (—ta< / < / „ ) =

j s*(/)d/= 2 js*(/)d/.

(78)

 

О

 

Учитывая, что t =

, левую часть этого равенства

мо

жно преобразовать так:

 

 

« = Р ( - / g< l-X -g/ ° l < ta) = Р ( X - /0<т*<Х ,< X + /„<*).

Следовательно,

 

 

 

 

_

_

_

la

(79)

а = Р(Х — taox< Х 0< Х +

taox) = 2 j Sk (t) dt.

 

 

 

0

 

Полагая taox = e,

получим

 

 

 

_

_

_

la

 

a = P{X — e < X 0< X +

e) = 2

 

 

 

 

0

 

Таблица значений ta, определяемых этим равенством, приве­ дена в приложении 2. При помощи этой таблицы можно определить одно из трех значений: вероятность а, точность е или объем вы­ борки п, задаваясь предварительно значениями каких-либо двух из этих величин.

Пример 10. По выборке объема п = 15 найдено X = 20,4 и s = 0,8. Опре­

делить истинное значение

генеральной средней Х 0.

Генеральная средняя

определяется доверительными границами

 

X — е < Х0 < X + е,

где

 

s

 

е tgPx ta

 

 

Vn

Зададимся надежностью а = 0,98; тогда по таблице приложения 2 при k = = п — 1 = 14 находим

 

 

/а = 2,62.

 

 

Поэтому

 

 

 

 

 

 

 

 

8 = 2,62

0,8

= 0,54.

 

 

 

 

КТ5

 

 

 

Следовательно,

 

 

 

 

 

 

(20,4-0,54) <

Х0 <

(20,4+0,54),

 

 

 

19,86 <

XQ <

20,94.

 

Пример 11.

Установить,

какой объем

п выборки необходимо

взять, чтобы

определить по этой выборке генеральную среднюю с точностью е =

± 2 о- и ве­

роятностью а =

0,95.

 

 

 

2. По таблице приложения 2 для

Так как е =

/ца-, то, следовательно, ta =

а = 0,95 находим значение

ta = 2,

которому

соответствует k =

60. Но k =

= п — 1, следовательно, п =

61.

Стюдента можно заменить

нормальным

Если л < 20, то распределение

и тогда

 

 

 

 

 

 

 

P ( - t a < t < t Q) =

20> (/а).

(80)

4 И. С. Солонин

49

Р ( - /а < / < /а) = Р (X - е < Х0 < X + е) = а, следовательно,

а = 2Ф (/а).

Так как

taV-x-ia

то обозначив - ^ г =

Кл

получим

8 = *а°х = Ях -

Решая уравнение (82) относительно п, получим

 

Ф 2

_1

{2

п:

а

г'2

ду

 

 

 

(82)

(83)

(84)

Пример 12. Определить, какой должен быть объем выборки /г, если жела­

тельно вычислить Х 0 с вероятностью а = 0,95 и точностью ё = 0,1s.

Согласно таблице приложения 1 для а = 2Ф (/а) = 0,95, ta = 1,96. Следо­ вательно, при е = qxs = 0,1s по формуле (84) имеем

1,962

0= 384.

Все изложенное об оценке точности и вероятности вычисле­ ния генеральной средней по выборочной средней является спра­ ведливым только для случаев, когда выборки берутся из генераль­ ной совокупности, имеющей нормальное распределение случай­ ной величины х или когда распределение х в генеральной сово­ купности не очень сильно отличается от нормального. Если же распределение х в генеральной совокупности сильно отличается от нормального, то в этом случае вероятность а и точность е

приближенного равенства X Х 0 можно определить только для больших выборок с помощью формул (81) и (82), но полученные значения а и е не будут точными, а будут носить лишь прибли­ женный характер.

5. ОЦЕНКА ТОЧНОСТИ ВЫЧИСЛЕНИЯ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПО ДАННЫМ ВЫБОРКИ

На практике иногда необходимо найти неизвестное среднее квад­ ратическое отклонение генеральной совокупности а 0 по среднему квадратическому отклонению s малой выборки, когда ее объем п < 25 . Для малых выборок s вычисляется по формуле

S (*<-*)»

S

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]