Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Железнов, Ю. Д. Статистические исследования точности тонколистовой прокатки

.pdf
Скачиваний:
10
Добавлен:
20.10.2023
Размер:
7.8 Mб
Скачать

Т а б л и ц а

3. Результаты расчета теоретического закойа

 

 

распределения

 

 

 

 

 

 

 

 

 

Плотность

 

Час гости

 

Средне­

 

 

относительная

абсолютная

 

 

нормаль-

интервальное

(х —к) •10-2

(* —X)

ного рас-

 

*

 

 

значение

у -

а

пределе­

 

пР.i

пр)

x i

 

 

ния

p i

p i

0,098125

—10,295

—2,059

0,0478

0,0356

0,04

3,56

4

0,134375

—6,67

1,334

0,1647

0,1194

0,13

11,94

13

0,170625

—3,045

—0,609

0,3312

0,2400

0,20

24

20

0,206875

0,58

0,116

0,3961

0,2872

0,25

28,72

35

0,243125

4,205

0,841

0,2803

0,2032

0,19

20,32

19

0,279375

7,83

1,566

0,1182

0,0857

0,06

8,57

6

0,315625

11,455

2,291

0,02898

0,0210

0,01

2,1

1

0,351875

15,08

3,016

0,004

0,0020

0,02

0,2

2

ъ

0,9942

99,42

100

Эксцесс

ц4

2213-10"8

„ „ с

 

 

е = -Ь 1 -3 =

625. ш-8 —3 = 3,5 —3 = 0,5.

 

 

Идеальному нормальному распределению соответствует, как

известно,

А — 0, е = 0.

 

 

 

 

 

Для уточнения степени отклонения эмпирического распреде­ ления от нормального по полученным значениям А и е необхо­ димо определить доверительный интервал для этих характеристик. Вычисление доверительных интервалов будет предметом изучения в следующих параграфах.

Вычислим теоретический закон распределения по характери­ стикам х и о опыта.

Расчеты приведены в табл. 3.

По данным табл. 3 построены эмпирическая и теоретическая кривые распределения (см. рис. 8).

Рис. 8. Гистограмма; эмпи­ рическая (/), теоретическая <2) и интегральная (3) кри­ вые распределения

20

3. Оценка параметров распределения

При анализе качества тонколистового проката количество замеров не всегда бывает достаточным для определения законов распределения. Но если заранее известен закон распределения, то для определения важнейших числовых характеристик распре­ деления нужно небольшое количество замеров.

Как показывают исследования, проведенные авторами в этой области [4 ], закон распределения разнотолщинности близок к нор­ мальному. Поэтому задача обработки результатов опыта сводится

к определению двух параметров распределения: х и а. Естественно, вычисление параметра распределения на основе

ограниченного числа измерений будет содержать элемент случай­ ности. Полученное таким образом значение параметра называется оценкой параметра.

Статистическая оценка дает хорошие приближения оценивае­ мых параметров, если она несмещенная, эффективная и состоя­ тельная [5].

Если S* есть статистическая оценка неизвестного параметра S распределения, то ее можно рассматривать как случайную вели­

чину с возможными значениями S1S2. • •Sn. Последние являются эмпирическими параметрами разных выборок, извлеченных из генеральной совокупности.

Условие М (S*) = S показывает, что данная оценка является несмещенной, где М (S*) — математическое ожидание оценки S*.

Для получения хорошего приближения несмещенность оценки недостаточна. Дело в том, что дисперсия оценки D (S*) может быть большой. Тогда значение оценки по одной выборке будет сильно отличаться от математического ожидания М (S*) и, сле­ довательно, от самого оцениваемого параметра.

Поэтому к оценке необходимо предъявить требование минимума дисперсии, т. е. D (S*) = min.

Оценка, удовлетворяющая этому условию, называется эффек­ тивной. Если при увеличении объема выборки, т. е. при п —» сю, статистическая оценка по вероятности стремится к оцениваемому параметру, то она называется состоятельной [5]. Для этого доста­ точно удовлетворения условия

lim D(S*) = 0.

Л - » со

Все эти оценки являются точечными, так как они представляют собой точки на числовой оси.

Теперь покажем методику вычисления оценок для математи­ ческого ожидания и дисперсии случайных величин. Пусть имеется случайная величина X с математическим ожиданием т и диспер­ сией D [1 ].

Требуется определить состоятельные и несмещенные оценки для параметров хг и Dr.

21

В качестве оценки математического ожидания примем среднее арифметическое х, которое обозначим через хв:

х„ = *„ =

причем

.. г , 1=1

Л1[хв] = —

X

х(

i=i

(28)

пх

= — = х Г)

где хг — математическое ожидание генеральной совокупности. Следовательно, оценка х является несмещенной. Она является

и состоятельной, так как при увеличении п оценка хпсходится по

вероятности с хг.

Дисперсия этой оценки вычисляется по формуле

D (х) = — Dr.

п

Эффективность оценки зависит от закона распределения. Если случайная величина X подчинена нормальному закону распреде­

ления, то значение дисперсии D (х) будет минимальным. Следова­ тельно, оценка х является и эффективной.

Что же касается оценки дисперсии D r, то надо отметить, что статистическая оценка ее является состоятельной [5], так как

Пш D B = Dr, но не является несмещенной, потому что математи- я->со

ческое ожидание выборочной средней не равно оцениваемой гене­ ральной дисперсии:

M[DB] =

(29)

Умножая DBна дробь

,

можно получить «исправленную

дисперсию» S2:

_

 

 

)2

 

£

(X/ — Хв)2

-

 

^ (XI — ;

 

S2 = — " . DH= —

. — -------------- =

*'=1 it— 1

(30)

Исправленная дисперсия теперь является несмещенной оцен­ кой генеральной совокупности. Действительно, из (30) получим, что

М

п — 1

п

п — 1

Dг

 

п — 1

п

 

И

 

M [S2] = Dr.

 

(31)

 

 

 

22

Следовательно, для оценки среднеквадратичного отклонения можно использовать исправленное среднеквадратичное отклоне­ ние [5], т. е.

[

У Ж - i ) 2

<32>

-

- n i l

В некоторых задачах, связанных с управлением процессом, помимо определения числового значения искомого параметра, необходимо оценить его точность и надежность. Точность оценки определяется доверительными интервалами, а ее надежность— доверительными вероятностями.

Допустим, случайная величина и выборочные средние подчи­ нены нормальному закону распределения. Пусть требуется выпол­ нение следующего соотношения:

Р (| хв —~х |< 6) = а,

где а — заданная надежность (доверительная вероятность).

На основании вычисления вероятности заданного отклонения имеем

P ( \ x - x \ < b ) = 2 F ( ~ y

В последнем выражении запишем х = хв, тогда а = а (хв) =

_ а

~7 т ’

врезультате получим

Р QxB- x \ < b) = 2 F U ^ - ) = 2F(y),

(33)

fij/- п

где у

Тогда б = у. С учетом последнего формула (33) примет

V п

следующий вид:

Р \\xB- x \ < y = y j = 2F(y).

Раскрывая указанный модуль, получим:

р (хв — у ~ < х < х в + у - ~^j = 2F (у) = а.

(34)

Последнее равенство показывает, что с доверительной вероят­

ностью а можно утверждать, что неизвестный параметр х с точ­ ностью б входит в доверительный интервал

23

Число у определяется следующим образом. Так как 2F (у) — а,

то F (у) = — По таблице функции Лапласа находим аргумент у,

которому соответствует величина а/2.

Аналогично определяются доверительные интервалы для дис­ персии.

Пример

Случайная величина генеральной совокупности распределена по нормальному закону. Среднеквадратичное отклонение сг = 0,05.

Найти доверительные интервалы для оценки неизвестного мате­

матического ожидания х по выборочному среднему хв.

Объем выборки п = 49, надежность (доверительная вероят­ ность) а = 0,9, среднее арифметическое имеющейся совокупности

*в = 0,20796.

Ре ш е н и е . Вычислим точность

6

уо

=

1Гп

где у — аргумент функции Лапласа.

Вследствие симметричности этой функции аргумент опреде­

ляется из соотношения 2F (у)

= 0,9.

 

Из таблицы функции Лапласа находим у = 1,64:

1,64 0,05

1,64-0,05

0,0117.

]/"49

7

 

Зная выборочную среднюю, можно определить доверительные границы: 0,20796— 0,0117 ^ х ^ 0,20796 + 0,0117.

4. Характеристики многомерных распределений

Выше нами были рассмотрены распределения одного признака. Однако очень часто в прикладных задачах приходится иметь дело со случайными явлениями, возможные значения которых опре­ деляются двумя, тремя, п числами. Такие случайные величины называются соответственно двумерными, трехмерными, п-мерными.

Например, если качество прокатанного листа определяется его продольной Ah и поперечной б/i разнотолщинностью, то мы имеем дело с двумерной случайной величиной (Ah, 6h), если контроли­ руется и форма листа, то имеем трехмерную случайную величину

(Ah, б/i, 6Ф).

Функция распределения системы трех случайных величин определяется вероятностью совместного выполнения трех нера­

венств X < х, Y <С у, Z <i z, т. е.

 

F(x, у, z) = P ( X < x , Y < y , Z < г).

(35)

34

Иr(X,U)

Рис. 9. Нормированная плот­

ность распределения систе­ мы двух случайных вели­ чин

Плотность распределения системы, например, двух случай­ ных величин, определяется по равенству

W ( х , у ) =

d*F (х, у)

(36)

дхду

 

 

Геометрически функция w (х , у) описывает некоторую поверх­ ность в пространстве (рис. 9). Эта поверхность называется поверх­ ностью распределения. Если известна плотность распределения системы двух случайных величин w (х, у), то по нижеследующим формулам можно определить плотность распределения случайных величин, входящих в систему:

 

со

 

w (*) =

| w (х, у) dy,

(37)

 

00

 

и (у) =

j w(x,y)dx.

(38)

Однако по известным w (х) и w (у) не всегда удается определить плотность распределения w (х, у) системы. Для определения w (х, у) необходимо еще знать зависимость между х и у. Такую зависимость можно охарактеризовать с помощью условных законов распре­ деления. Что такое условный закон распределения?

Чтобы ответить на этот вопрос, рассмотрим такой пример: система случайных величин X и А представляет собой длину волны и амплитуду волнистости холоднокатаного листа. Если нас инте­ ресует амплитуда волнистости А безотносительно к ее длине волны X, то плотность распределения w (А ) есть безусловный закон распределения амплитуды волнистости листа. Этот закон распределения мы можем исследовать, рассматривая все листы, измеряя амплитуды их волнистости. Но если нас интересует закон распределения амплитуды волнистости с вполне определенной длиной волны X, то будем измерять не все листы, а только определенную группу с длиной волны X. В этих условиях мы по­ лучим условный закон распределения амплитуды волнистости

25

(коробоватости) при длине волны к с плотностью w (A/к). Этот условный закон w {Aik) отличается от безусловного w {А).

Теперь, зная условный закон распределения одной из величин и закон распределения второй величины, входящей в систему, можно определить закон распределения системы по формуле [1 ]

 

w(*. y) = w(я) w(y |я)

]

ИЛИ

W(я, у) = W(у) W(я |у).

I

Из системы (39) можно также определить условные законы рас­ пределения, если известны безусловные распределения.

Нужно отметить, что через условные распределения можно определить зависимость и независимость случайных величин.

Если непрерывная случайная величина X не зависит от Y, то

w (х \у) ■— W(х),

(40)

а если зависит, то

(41)

w(x\y)+w (я)

Здесь же нужно отметить, что зависимость

и независимость

случайных величин всегда взаимны.

 

Для независимых непрерывных случайных величин всегда

w(x, y) = w(x)w(y).

(42)

Для простоты рассмотрим числовые характеристики для си­ стемы двух случайных величин. Основными числовыми характе­ ристиками распределения системы двух случайных величин яв­ ляются начальные и центральные моменты порядка к, s [11. На­ чальный момент порядка к, s определяется выражением

СО

00

 

a*. s = М [яV I = 1 1

* V ш(*• У) dx йУ<

(43)

а центральный момент того же порядка формулой

0 0

00

 

p*,s = Л4 [я * ^ ] = 1

1 (x —x)k (y — yfw{x,y)dxdy,

(44)

0 0 — 00

где w (х, у) — плотность распределения системы.

Для системы двух случайных величин обычно применяются

только

первые и вторые моменты. Первый начальный и второй

центральные моменты представляют собой

математическое ожи­

дание

и дисперсию случайных величин X

и Y:

 

* = «1, о = М [х'у] = М [я],

(45)

 

 

 

 

У — «о. 1 = М [ху'] = М [у],

 

 

hi, о =

м Iх2] = D (я), |

(46)

 

 

 

 

Po,2 =

jW [i/s] ==D(y). j

 

26

5. Корреляционный анализ

Как показывают исследования в области производства тонко­ листового проката, качество тонких листов и полос на выходе со стана зависит от множества факторов, взаимозависимость между которыми определять детерминированно нельзя вследствие их случайной природы. Поэтому приходится находить эту зависимость на основании результатов наблюдения с помощью корреляцион­ ного анализа.

Для описания зависимости двух случайных величин поль­ зуются корреляционным моментом kxy (второй смещенный цен­ тральный момент) и коэффициентом корреляции гху. Корреля­ ционный момент k (х , у) непрерывных случайных величин X и Y вычисляется по формуле

COV (X, у) = kxy = М[(Х — X) (у — I/)] =

СО СО

(47)

СО — СО

Корреляционный момент (ковариация) характеризует степень зависимости и независимости X и Y. Если случайные величины X -и Y независимы, то kxy = 0, если же эти величины зависимы, то kxy Ф 0. Здесь зависимость между X и К отличается от детерми­ нированной (функциональной). При обработке результатов экс­ перимента мы встречаемся со «стохастической», т. е. вероятно­ стной зависимостью. Поясним это. Если величина Y связана с ве­ личиной X функционально, то зная значение X, можно точно опре­ делить величину К, а при вероятностной зависимости, зная ве­ личину X, определить точно Y невозможно, а можно указать только ее закон распределения, при некотором значении X. Ка­ чественно вероятностная зависимость может быть сильной (тес­ ной) или слабой. С увеличением тесноты связи вероятностная за­ висимость стремится к функциональной. Следовательно, функ­ циональная зависимость является частным случаем вероятностной и является ее предельным состоянием.

Количественно теснота вероятностной связи определяется коэффициентом корреляции. Коэффициент корреляции отличается от корреляционного момента тем, что он является безразмерным. Это достигается путем деления на произведение среднеквадратич­ ных отклонений случайных величин, входящих в систему, т. е.

(48)

где гху — коэффициент корреляции;

ох, °у — среднеквадратичное отклонение величин X и К.

27

У

Рис.

10.

Положительная

Рис. 11.

Отрицательная

Рис.

12.

 

Отсутствие

корреляция случайных ве­

корреляция

случайных

корреляционной связи

личин

X

и Y

величин

X и

Y

между

X

и

У

Если величины X и У независимы, то, как было указано ранее, гху — 0, так как kxy — 0. Такие величины называются некорре­ лированными, хотя некоррелированность не всегда означает не­ зависимость случайных величин [1 ].

Коэффициент корреляции характеризует степень тесноты ли­ нейной зависимости между случайными величинами X и К. В слу­ чае функциональной зависимости между X и К

Y = kX + b

(49)

коэффициент корреляции гху — ± 1 . Эти значения являются пре­ дельными. Следовательно, для стохастической зависимости — 1 < <Сгху<С 1- Когда гху > 0, имеет место положительная корреля­ ция и при увеличении X величина У также увеличивается. На рис. 10 показана положительная корреляция величин X и У; «ели гху < 0, то имеет место отрицательная корреляция (рис. 11). При гху = 0 корреляционная связь между этими величинами ■отсутствует (рис. 12).

6. Регрессионный анализ. Обработка результатов пассивного эксперимента

Теперь определим форму кривой так, чтобы с достаточным при­ ближением все распределение масс вероятностей концентрирова­ лось плотно около этой линии.

Как было указано в предыдущем параграфе, стохастическую зависимость между X и У можно искать в виде

 

Y — f (X),

(50)

-а между У и X в виде

 

 

Х = ф ( К ) .

(51)

Выражение (50)

называется уравнением

регрессии У на X,

а выражение (51) —

уравнением регрессии X

на У. Графики этих

функций называются линией регрессии. Линии регрессии могут быть линейными и нелинейными. Здесь мы будем рассматривать только линейную регрессию.

28

При линейной регрессии линии, описываемые уравнениями (50) и (51), являются прямыми. Тогда эти уравнения можно напи­ сать в виде

У =

РУх* +

ь

(52)

и

 

ь.

 

х =

РхуУ +

(53)

Как видно из уравнения (52), задача состоит в определении не­ известных рху и b с условием, что данная прямая будет как можно ближе к экспериментальным точкам (хъ у г), (х2, г/2), . . (хп, уп). Эти параметры можно определить по методу наименьших квадра­

тов:

П

2 (PvxXt + ь— yt)2 = тin.

(54)

i=i

Из условия экстремума можно найти:

п п п }

п 2 х‘У‘ — 2 xi £ yt

 

i = l

i= l

 

t= l

 

Рих — ■■'• п

- ■■/

п

\2

 

i=i

 

2 * * )

(55)

 

\i=i

i

 

2

Е

— 2

*/ Е xiyi

 

« Е * М Е * 1 - )2

'

Перестановкой индексов в первой формуле можно определить

Р х у

Иногда уравнения линии регрессии, если известен коэффи­ циент корреляции, удобно определить в следующем виде:

У - У

=

гху% Ц Х - Х ) ,

(56)

 

 

4#

 

X - X

=

rxyg - ( Y - Y ) .

(57)

Определим доверительный интервал для коэффициента корре­

ляции гху.

область

при

уровне q (%)

значимости можно

Критическую

определить как

 

 

 

 

 

 

 

Гкр=

 

где

tq— уровень

q

(%) значимости

t — распределения

 

 

Стьюдента:

 

 

I

1 - г \

:

для

среднеквадратичного отклонения.

ог =р -уг= — *- оценка

29

Соседние файлы в папке книги из ГПНТБ