Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Конспект часть 1 (1)

.pdf
Скачиваний:
14
Добавлен:
07.03.2015
Размер:
397.42 Кб
Скачать

для дискретных величин

n m

 

K xy = å å(xi mx )(y j my )pij (x, y) .

(7.20)

i =1 j =1

Здесь pij (x,y) = p((x = xi ),(y = y j )) - вероятность того, что случайная система

XY примет значения (xi,yj).

Для независимых величин корреляционный момент равен нулю. Отличие от

нуля корреляционного момента двух случайных величин является признаком

наличия зависимости между этими величинами.

Корреляционный момент характеризует не только зависимость величин, но и их рассеивание. Если одна из величин весьма мало отклоняется от своего мате-

матического ожидания, то есть почти не случайна, то и корреляционный момент

будет мал, какой бы тесной ни была связь X и Y. Поэтому для характеристики свя- зи между величинами X и Y переходят от корреляционного момента Kxy к безраз-

мерной величине rxy.

rxy =

Kxy

,

(7.21)

σ xσ y

 

 

 

где σх, σy средние квадратичные отклонения величин X и Y. Эта характеристика называется коэффициентом корреляции величин X и Y.

Для независимых случайных величин коэффициент корреляции равен нулю.

Случайные независимые величины называются некоррелированными. Однако не-

коррелированные величины могут быть зависимыми. Коэффициент корреляции характеризует только степень тесноты линейной зависимости между двумя вели- чинами. Линейная вероятностная зависимость случайных величин заключается в том, что возрастании одной случайной величины другая имеет тенденцию возрас-

тать или убывать по линейному закону. Эта тенденция к линейной зависимости

может быть более или менее приближаться к функциональной. Если имеется

строгая функциональная зависимость типа y = a + bx ,

то коэффициент корреляции rxy = ±1, при этом знак «+» или «-» совпадает со зна-

ком коэффициента b.

В общем случае, когда величины Х и Y связаны произвольной вероятностной

зависимостью, коэффициент корреляции может иметь значение в пределах

-1< rxy <+1

53

Полной характеристикой системы нескольких случайных величин служит закон

распределения, который может быть задан функцией распределения или плотно- стью распределения. Функцией распределения системы n случайных величин

(X1, X2, …, Xn) называется вероятность совместного выполнения n неравенств ви- да Xi<xi:

F(x1,x2,...,xn ) = P((X1 < x1)(X2 < x2 )...(Xn < xn )).

(7.22)

Плотностью распределения системы n непрерывных случайных величин называется n-я смешанная производная функции F(x1,x2, … ,xn), взятая один раз

по каждому аргументу:

 

 

nF(x ,x

2

,...,x

n

)

 

 

f (x1,x2

,...,xn ) =

1

 

 

.

(7.23)

x1x2

...¶xn

 

 

 

 

 

 

 

 

Вероятность попадания случайной точки (X1, X2, …, Xn) в пределы n-мерной

области D выражается n-кратным интегралом:

 

P((X1, X2,¼, Xn) Ì D) = ò...òf (x1,x2,...,xn )dx1 dx2 ...dxn .

(7.24)

D

 

Закон распределения системы случайных величин, заданный функцией рас- пределения или плотностью распределения, является полной характеристикой системы. Очень часто такая полная характеристика не требуется. Приближенное описание может быть достигнуто при использовании числовых характеристик.

Минимальное число характеристик, с помощью которых может быть охаракте-

ризована система n случайных величин X1, X2, …, Xn, сводится к следующему: 1) n математических ожиданий

m1, m2, … ,mn ,

характеризующих средние значения величин;

2) n дисперсий

D1, D2, … ,Dn ,

характеризующих их рассеяние;

3) n(n-1) корреляционных моментов

Kij n n (xis - mi )(x jk - m j ), i ¹ j ,

= å å

s =1k =1

характеризирующих попарную корреляцию всех величин, входящих в систему. Все корреляционные моменты обычно представляют в виде матрицы порядка n´n:

54

æK

11

K

12

...

K

1n

ö

ç

 

 

 

÷

çK

21

K22

...

K2n

÷

ç

 

 

 

...

...

÷ .

ç ... ...

÷

ç

 

Kn2

...

 

 

÷

èKn1

Knn ø

Эта матрица симметрична, то есть элементы, расположенные симметрично по

отношению к главной диагонали, равны. Kij=Kji. На главной диагонали стоят дис-

персии случайных величин

K11 = D1 , K22 = D2 , ... , Knn = Dn .

Обычно заполняется только половина матрицы:

æD

K

12

...

K

1n

ö

ç

1

 

 

 

÷

ç

 

D2 ...

K2n

÷

ç

 

... ...

...

÷ .

ç

 

÷

ç

 

 

 

...

 

 

÷

è

 

 

 

Dn ø

В случае, когда все случайные величины X1, X2, …, Xn не коррелированы, все

элементы корреляционной матрицы, за исключением диагональных элементов,

равны нулю:

æD

0

ç

1

D2

ç

 

ç

 

...

ç

 

ç

 

 

è

 

 

...

0

ö

...

0

÷

÷

...

...

÷ .

÷

...

 

÷

Dn ø

Такая матрица называется диагональной.

Для наглядности суждения о коррелированности случайных величин исполь- зуют нормированную корреляционную матрицу, составленную не из корреляцион-

ных моментов, а из коэффициентов корреляции:

rij =

Kij

,

(7.25)

si s j

 

 

 

где si =

Di

,

s j =

D j

.

Все диагональные элементы этой матрицы равны единице.

æ1

r

ç

12

ç

1

ç

...

ç

ç

 

è

 

...

r

ö

...

1n

÷

r

÷

 

2n

÷ .

... ...

÷

...

1

÷

ø

æ1

0 ...

0

ö

ç

0

1 ...

0

÷

ç

÷

ç

0

... ...

...

÷ .

ç

÷

ç

0

0 ...

1

÷

è

ø

Для независимых случайных величин нормированная корреляционная матрица является единичной матрицей, в которой на главной диагонали находятся едини- цы, а остальные элементы равны нулю:

55

Лекция 12. ВЫЯВЛЕНИЕ ГРУБЫХ ПРОМАХОВ

Ближайшей задачей экспериментатора является получение интересующих ре-

зультатов с заданной точностью. Однако данные, полученные непосредственно считыванием с приборов во время проведения опытов или косвенно путем пере-

счета опытных значений, могут содержать различные по своей природе ошибки, вносящие некоторую погрешность в окончательный результат. В дальнейшем бу- дем считать, что первичные данные могут содержать только случайные ошибки и

грубые промахи, систематические ошибки отсутствуют.

Случайные ошибки вызываются большим числом случайных факторов, дей-

ствие которых в каждом опыте различно и не может быть заранее учтено. Можно предположить:

1)ошибки измерений могут принимать непрерывный ряд значений;

2)при большом числе наблюдений ошибки одинаковой величины, но разного

знака, встречаются одинаково часто;

3)частота появления ошибок уменьшается с увеличением величины ошибки.

Большие ошибки встречаются реже, чем мелкие.

При этих допущениях распределение величины случайной ошибки подчиня- ется закону Гаусса, т.е. имеет нормальное распределение с плотностью

 

 

1

 

( )2

 

f ( ) =

 

 

 

 

 

e 2σ2 .

 

 

 

 

σ

 

2π

 

 

 

 

 

 

При повторении измерений при одних и тех же видимых условиях значения

исследуемой величины должны с некоторым разбросом группироваться относи- тельно истинного значения; с увеличением количества измерений среднее ариф- метическое будет сходиться по вероятности к математическому ожиданию (истин- ному значению) исследуемого параметра. При этом среднее арифметическое, рассчитываемое по формуле (3.17), может рассматриваться в качестве оценочно- го (приближенного) значения искомой величины.

Пусть β - вероятность того, что отличается от истинного значения х не более,

чем на х

P(x x < x < x + x) = β .

(8.1)

56

Вероятность β называется доверительной вероятностью. Интервал значений

[x x,x + x] называется доверительным интервалом. Таким образом, для ин-

тервальной оценки случайной величины нужны два числа:

1)доверительная вероятность, т.е. вероятность того, что истинное значение результата измерения находится в определенном интервале;

2)доверительный интервал, т.е. интервал значений, в котором с доверитель-

ной вероятностью находится истинное значение.

Указание только величины ошибки без указания доверительной вероятности

не имеет смысла.

Знание доверительной вероятности позволяет оценить степень надежности результата. Чем выше требуемая степень надежности того, что измеряемая вели-

чина будет находиться в определенном интервале, тем шире должен быть задан интервал, в котором заключено истинное значение измеряемой величины.

Если распределение случайной ошибки полностью соответствует нормально-

му закону, то с доверительной вероятностью β истинное значение находится в

диапазоне

β= 0,68 ; x = x ± σ ,

β= 0,95 ; x = x ± 2σ ,

β= 0,997 ; x = ± 3σ .

Втехнических измерениях обычно ограничиваются доверительной вероятно-

стью β=0,95.

При проведении экспериментов обычно наблюдаются следующее явление: при небольшом числе измерений результаты незначительно отличаются от сред-

него значения, с увеличением числа замеров появляются большие расхождения.

Это объясняется нормальным законом распределения, согласно которому веро-

ятность появления малых отклонений значительно больше, чем вероятность по- явления больших отклонений.

Вероятность появления погрешностей, по абсолютной величине превышаю- щей 2σ, равна 0,95 , поэтому, если сделаем 20 измерений, то можно ожидать одно из таких значений. Если сделать всего два измерения, то, как правило, таких больших отклонений не наблюдается.

Подсчет выборочных дисперсий производится простым суммированием квад-

ратов отклонений, поэтому величины S2 и S 2 при малых выборках обычно меньше, чем оцениваемая по ним величина дисперсии генеральной совокупности

57

t < tкр(1)

σ2. Если в описании распределения ошибок будем использовать величины S2 и

S 2 вместо σ2, то не получим нормального закона распределения. Поэтому тео-

рия, основанная на законе распределения Гаусса, применима только к испытани-

ям с большим числом измерений. Для выборок с малым числом измерений она дает большие погрешности.

Для малых выборок английским химиком Госсетом предложено распределе- ние (t-распределение). Свою работу он опубликовал под псевдонимом «Стью- дент», поэтому t-распределение называют распределением Стьюдента.

Вместо дисперсии генеральной совокупности мы используем выборочную

дисперсию S 2 . В качестве параметра распределения Стьюдента используется

величина

 

 

t =

 

x mx

.

 

 

(8.2)

 

 

 

 

 

 

 

 

 

 

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Плотность вероятности

распределе-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ния параметра t зависит от величины t и

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

числа степеней свободы ν, ν=n-1. Кривые

f(x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

f (t) напоминают кривые нормального рас-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

пределения, но при малых ν (или n) они

 

 

 

 

 

 

 

 

 

 

 

x

значительно

медленнее сближаются с

Рис.8.1. Графики плотности

осью абсцисс. Общий вид кривых показан

на рис.8.1. При увеличении количества

распределения случайных величин,

имеющих нормальное распределение

измерений

распределение

Стьюдента

(1) и распределение Стьюдента (2)

приближается к нормальному распреде-

лению.

Значения плотности и функции распределения Стьюдента выражаются через гамма-функции, для вычисления которых необходимо численное интегрирование.

Поэтому обычно пользуются статистическими таблицами, в которых в зависимо-

сти от числа степеней свободы ν для нескольких значений уровня значимости α приводятся значения параметра tкр(1), для которого вероятность появления значе-

ний

равна доверительной вероятности β=1-α (односторонний критерий) или tкр(2), для которого вероятность выполнения условия - tкр(2) < t < tкр(2) равна β (двух- сторонний критерий.

58

Распределение Стьюдента широко используется для решения многих практи-

ческих задач. В первую очередь с помощью его определяется доверительный ин-

тервал случайной величины. Допустим, что были проведены n независимых изме- рений случайной величины Х, в результате чего получены значения х1, х2, ...,хi, хn. По этим данным, используя формулы (3.17) и (3.21) рассчитываются среднее

арифметическое x и выборочное среднее квадратичное отклонение S . Затем по

числу степеней свободы ν=n-1 и выбранному значению уровня значимости α=1-β

по таблице распределения Стьюдента определяется параметр t. Так как отклоне-

ние истинного значения (математического ожидания) случайной величины mx от среднего арифметического x может быть как положительным, так и отрицатель- ным, то в этом случае необходимо пользоваться двухсторонним критерием. Если

в таблице указан односторонний критерий, то значение параметра t надо взять из таблицы для уровня значимости α2 .

Обозначая ожидаемую величину ошибки как δ = x mx , из (8.2) получим

 

 

 

 

 

 

 

δ =

tS

 

 

,

(8.3)

 

 

 

 

 

n

 

 

 

 

 

откуда найдем интервал, внутри которого с доверительной вероятностью β нахо-

дится истинное значение случайной величины:

mx =

 

± δ .

(8.4)

x

Для относительной характеристики погрешности определения истинного зна-

чения mx вычисляют коэффициент вариации:

Vx =

 

δ

 

100% .

(8.5)

 

 

 

 

 

x

 

 

 

Распределение Стьюдента можно использовать для отсева промахов при об-

работке результатов экспериментов. Грубые промахи могут появиться вследствие

ошибок экспериментатора, выхода из строя измерительной аппаратуры, наруше- ния режима установки и т.д. Признаком ошибок такого рода является несоответ-

ствие наблюдаемых значений с физической сущностью исследуемого процесса (несоответствие полученных характеристик агрегатному состоянию вещества,

нарушение законов сохранения массы, энергии, количества движения и т.д.) или значительное отклонение данных от их среднего значения. При усреднении экс-

периментальных данных грубые промахи могут существенно исказить конечный результат, поэтому они должны быть исключены из совокупности обрабатывае-

мых значений. С другой стороны, если будем отбрасывать значения, которые в

59

действительности имели место и заметно отличаются от среднего только в силу

случайных колебаний, то также внесем погрешность в расчет окончательного зна- чения.

Сначала отбраковка ошибочных результатов производится на основании тща- тельного анализа режима работы исследуемой установки, оценки с точки зрения

физической сущности процесса допустимого диапазона ожидаемых результатов и

соблюдения с заданной точностью законов сохранения. При выявленных наруше- ниях работы испытываемого оборудования и аппаратуры сомнительные измере-

ния отбрасываются независимо от их величины.

На грубую ошибку указывает также существенное отклонение одного или не- скольких значений от общей массы результатов. Вопрос о том, насколько суще-

ственным должно быть отклонение результата от среднего значения, чтобы его считать грубой ошибкой, является в некоторой степени предметом соглашения о вероятности ошибки, с которой данный результат признается грубым промахом и исключается из анализируемой совокупности.

Для отбраковки грубых промахов t-распределение преобразуется в r-

распределение. Параметром этого распределения является величина

 

 

 

xi

 

 

 

 

ri =

 

 

x

 

.

(8.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

 

 

S

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

Если с заданной степенью доверительной вероятности β=1-α величина ri по- падает в доверительный интервал, то нет основания считать величину xi грубым промахом и ее следует оставить в ряду результатов. В противном случае с веро- ятностью β можно признать, что величина xi попала в этот ряд из-за грубой ошиб-

ки и ее следует исключить. Вероятность ошибки исключения равна α.

Проверку на наличие промахов следует начинать со значения xi, имеющего

наибольшее отклонение по модулю от среднего значения. Если величина xi будет исключена из совокупности результатов эксперимента, то изменится среднее зна-

чение и среднее квадратичное отклонение . Поэтому необходим повторный пере- счет этих значений.

Существуют таблицы, в которых приведены численные значения r-

распределения для различных уровней значимости α и степеней свободы ν=n-2.

Отсев грубых промахов и вычисление доверительного интервала производит-

ся в следующей последовательности:

60

1. Вычисляются среднее арифметическое x и среднее квадратичное отклоне-

ние S .

2. Определяются величины отклонений результатов от среднего di = xi x .

3.Выбирается результат с максимальным di.

4.Для него рассчитывается параметр ri.

5.Задается величина уровня значимости α для выявления грубых промахов.

6.По числу степеней свободы ν=n-2 и принятому α по таблице находят крити- ческое число rmax.

7.Сравнивают найденное значение rmax с рассчитанным ri. При ri > rmax резуль- тат хi признается грубым промахом и с вероятностью ошибки α исключается из

совокупности. Далее считая, что было произведено n-1 измерение, обработка ре-

зультатов возвращается к п.1. При ri < rmax переходят к п.8.

8.Вычисляется коэффициент вариации.

9.Задается величина уровня значимости α для доверительного интервала.

10.По числу степеней свободы ν=n-1 и принятому α из таблицы находят зна- чение параметра t.

11.Рассчитывается величина вероятного отклонения δ.

11. Рассчитывается доверительный интервал.

61

Лекция 13. СТАТИСТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

В ряде случаев необходимо оценить доверительный интервал генеральной дисперсии Dx или sх2 (теоретической величины) по выборочной дисперсии. Дока- зано, что если результаты измерения случайной величины Х (x1, , xn) распреде- лены по нормальному закону, то сумма

 

 

 

 

 

 

n æ

 

 

 

 

 

ö2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ç

xi - x

 

÷

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U = åç

sx

÷

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i =1è

ø

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеет распределение c2 с n=n-1 степенями свободы.

 

 

 

 

 

 

 

 

Сделаем некоторые преобразования.

 

 

 

 

 

 

 

 

 

 

 

n æ

 

ö2

 

 

 

 

 

n

 

 

 

 

 

 

2

 

 

n

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ç xi - x

÷

 

 

 

1

 

 

(xi - x )

(n -1) =

n -1

 

(xi - x )

 

n -1

 

 

2

U = åç

 

 

÷

=

 

 

 

å

 

 

 

 

 

 

 

 

 

å

 

 

 

 

=

s2x

Sx .

 

 

 

 

 

 

 

 

n -1

 

 

n -1

i =1è sx

ø

 

 

 

s2x i =1

 

 

s2x i =1

 

 

 

 

Отсюда искомая величина

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(n -1)

 

x2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

S

 

 

 

 

 

 

 

 

 

 

 

 

 

 

sx

=

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В таблицах распределения c2 для ряда уровней значимости a и числа степе-

ней свободы n приводятся критические значения параметра c2кр. Эти значения по-

казывают, что случайная величина U, распределенная по закону c2, с вероятно-

стью a будет больше табличного значения c2кр.

Предположим, что было произведено 10 измерений. Число степеней свободы

n=10-1=9. Из таблицы

находим,

что

для

a=0,95

c2кр=3,325; для

a=0,05

 

 

 

 

c2кр=16,92. Таким образом, с вероятностью 95% величина U>3,325; c веро-

ятностью 5% U>16,92. Отсюда с вероятностью 90% величина U находится в ин-

тервале 3,325<U<16,92. Поэтому с вероятностью 90%

 

 

 

 

 

 

 

(n 1)

 

 

2

2

(n 1)

 

 

2

9

 

 

2

2

9

 

 

2

 

 

2

2

 

2

 

 

 

 

 

 

 

 

 

 

Sx

< sx <

 

 

Sx ;

 

 

Sx

< sx <

 

 

Sx ; 0,53Sx

< sx < 2,71Sx .

16,92

 

3,325

 

16,92

3,325

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если необходима 95% уверенность в том, что случайная величина находится

в указанном интервале, надо выбрать соответствующие уровни значимости: для a=0,975 c2кр=2,700; для a=0,025 c2кр=19,02.

9

 

 

x2 < s2x <

9

 

 

x2 ; 0,47

 

x2 < s2x < 3,33

 

x2 .

S

S

S

S

19,02

2,7

 

 

 

 

 

 

 

 

 

 

62

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]