Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Основы теории эксперимента / Теория и методы экспpdf.pdf
Скачиваний:
238
Добавлен:
17.04.2015
Размер:
1.32 Mб
Скачать

Нулевая гипотеза в данном случае заключается в том, что É*: - исследуемая генеральная совокупность не противоречит предлагаемому теоретическому закону распределенияÉ. При этом альтернативная гипотеза обычно формулируется как : случайная величина имеет любое другое распределение, отличное от предлагаемого.

Сравнение экспериментального материала с некоторым видом теоретического распределения осуществляется с помощью различных критериев согласия: хи-квадрат (Пирсона), Колмогорова-Смирнова и др.

 

 

 

5.11.1.

Критерий Пирсона

 

 

 

 

 

 

 

Для проверки согласованности распределений, полученных по

выборке с некоторой теоретической плотностью распределения.

 

 

 

Для стандартного нормального распределения теоретическая

вероятность попадания случайной величины в интервал

1… … =

 

>

 

= …

J

 

 

uº

.

 

,

 

 

 

 

 

 

 

 

 

определяется по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

Отличие

оценки закона

распределения

 

P

от

 

теоретического

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

закона распределения Р* можно охарактеризовать величиной

 

 

 

 

 

R Ù

>

= >,

 

 

 

 

 

 

 

 

 

величины >

>

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Где

, -

оценка

и

теоретическая

вероятность случайной

 

для i-ого интервала;

- весовые коэффициенты, которые с

большим весом учитывают

отклонения для меньших

 

 

 

 

 

 

 

Ù

,

 

следующим образом:

 

 

 

 

 

 

 

Ù

 

 

 

 

Пирсон выбрал весовые коэффициенты

 

 

 

 

>

 

 

 

 

 

Пирсон показал, что при таком

выборе

 

закон распределения

 

 

 

>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

основном числом разрядов

слабо зависит от n и P(x), а определяется в

Ù

 

 

 

 

 

 

 

 

k (количеством интервалов). Следовательно,

106

 

 

-

 

 

 

,

-

3i

 

 

,

-

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

= >

 

3i

 

 

 

 

 

R

>

= >

R

 

 

 

 

R

 

= >

 

 

 

 

 

,

 

 

,

 

 

 

 

,

 

 

 

 

T

 

 

 

T

 

 

 

T

 

 

 

 

 

 

 

 

 

 

при идеальном соответствии экспериментальных

Очевидно, что >

 

 

 

 

>

 

 

 

 

 

>

 

 

 

 

данных нормальному закону, экспериментальное> >, значение критерия Пирсона будет равно нулю, т.к. .

Алгоритм использования критерия Пирсона заключается в следующем:

1.Выдвигается нуль-гипотеза: «Отличие экспериментальных данных от нормального закона распределения не существенно» и альтернативная гипотеза: «Отличие экспериментальных данных от нормального закона распределения существенно, т.е. экспериментальные данные не подчиняются закону нормального распределения».

2.По результатам экспериментальных измерений и предположению нормального закона их распределения определяется расчетное значение критерия Пирсона.

3.Определяют число степеней свободы m, задаются уровнем значимости¤α и определяют теоретическое значение критерия Пирсона .

4.Если L ¤, то нуль-гипотеза о нормальном законе

распределения экспериментальныхS =§ данных принимается с доверительной вероятностью В противном случае нульгипотеза отвергается и принимается альтернативная.

5.11.2. Критерий Колмогорова

Наряду с критерием согласия Пирсона применяются и другие критерии, например, Колмогорова, Романовского и др.

Колмогоров доказал, что независимо от функции распределения вероятностей при неограниченном возрастании числа независимых наблюдений вероятность неравенства^v C y

стремится к пределу

107

;

 

> y = R =- # -uzu

 

табулированы.

 

Значения этой вероятности-T#;

 

Суть критерия согласия Колмогорова заключается

в следующем.

Устанавливается максимальная величина модуля разности между

статистической и теоретической функциями распределения

вероятностей

 

 

*

" = "Œ

и определяется

величина

^ Œ

 

где n – число независимых наблюдений, и по таблице находится

вероятности

 

.

 

y ^v

 

Величина этой вероятности

 

свидетельствует о том, что

за счет

> y

 

 

 

 

вероятность максимального

случайных причин

 

 

 

 

 

 

> y

 

расхождения> y между функциями распределения будет не

меньше .

Если вероятность мала, гипотезу следует отвергнуть, при больших значениях вероятности эту гипотезу следует считать, как не противоречащую опытным данным.

5.11.3. Критерий однородности статистического материала

Критерий однородности еще носит название критерий принадлежности выборок к одной генеральной совокупности.

Суть этого критерия сводится к следующему. В практике обработки результатов наблюдений не всегда эти результаты получены в одном эксперименте. Однородные результаты, т.е. результаты одной физической величины могут быть получены при проведении различных экспериментов и, может быть, даже в различных условиях. И задача сводится к решению вопроса, являются ли эти результаты однородными и можно ли их обрабатывать совместно? Если это отобразить визуально, то получим картину, показанную на рис. 5.11.1. Если говорить на языке теории множества, задача сводится к установлению критерия, по которому можно установить, принадлежат ли подмножества Вi, i=1, 2, …,7 одному и тому же множеству, называемому генеральной совокопностью.

108

Генеральная

совокупность

В3

В2

В4 В5

В1

В6

В7 В8

В9

Рис.5.11.1 – К определению критерия однородности

Теперь перейдем к математической постановке задачи. Предположим, что проведено s последовательных экспериментов, состоящих соответственно из n1, n2,…,ns единичных наблюдений. При этом числа nj не случайны, а рассматриваются как заданные. В каждом эксперименте наблюдается некоторый переменный признак, и результаты каждого ряда наблюдений разбиваются по значению этого признака на r групп. Количество результатов наблюдений в i- ой группе j-го ряда обозначим υij. Тогда полученные данные могут быть расположены в таблице вида:

Таким образом, таблица представляет результат s независимых рядов наблюдений, каждому из которых соответствует один столбец.

Задача сводится к проверке гипотезы о том, что s выборок, представленных столбцами таблицы, извлечены из одной и той же совокупности, или, говоря иначе, эти данные являются однородными.

Таблица 5.11.1.

Признак

Ряд 1 2 3 … s

Сумма

1

υ11

υ12

υ13

……… υ1s

υ1@

2

υ21

υ22

υ23

……… υ2s

υ2@

3

υ31

υ32

υ33

……… υ3s

υ3@

.

……………………………………

.

.

……………………………………

.

.

…………………………………….

.

r

υr1

υr2

υr3 ……… υrs

υr@

 

 

 

 

Сумма

υ@1 υ@2

υ@3 …υ@s

N

109

i
pi = 1

Такая гипотеза эквивалентна (равносильна) гипотезе о том, что

существует

´

постоянных

G I Ý и таких, что i

pi = 1, и

вероятность принадлежности отдельного результата к i-ой группе во всех s последовательностях равна рi.

Для проверки этой гипотезы воспользуемся распределением Пирсона и запишем его в виде

 

2

 

(υij υi@υ@ j /n)2

 

υij2

 

χ

 

= n

 

 

= n

 

 

1 ,

 

υ

υ

υ

υ

 

 

i, j

 

i@ @ j

 

i @ @ j

 

 

 

 

 

ij

 

 

имеющим (r-1)(s-1) число степеней свободы.

Эту зависимость можно распространить и на случай, когда рассматривается s независимых выборок по n1, n2, …,ns элементов,

разбитых на одинаковое число r

 

групп, и с помощью метода

минимума χ2 , примененного к выражению

χ

 

=

(υ n p )2

2

ij

n p

 

 

j i

 

 

 

i, j

 

j i

 

 

 

 

 

pi определяется некоторое число t

неизвестных параметров.

Известно, что закон Пирсона имеет предельное распределение с

(r-1)s-t степенями свободы, и в общем случае имеем дело с

гипотезой о том, что все s

выборок извлечены из одной и той же

совокупности без дальнейшего уточнения вида распределения этой совокупности, так что параметрами являются сами вероятности.

Благодаря соотношению имеем t = r 1 параметров, так что

получаем (r 1)(s 1) степеней свободы.

Распределение Пирсона (распределение χ2) можно использовать также для проверки гипотезы о том, что заданные или имеющиеся s выборок извлечены (принадлежат) одной и той же совокупности заданного типа, например, имеющих распределение Гаусса, Пуассона или какое-то другое.

В этом случае применение метода минимума χ2 показывает, что параметры распределения вероятностей отыскиваются так же, как и в случае одной выборки с групповыми частотами, равными суммам

110

строк υi@, i=1,2, …, r в приведенной выше таблице. В частном случае при r=2 таблицу можно записать в виде, приведенном ниже.

υ1

υ2

…… υs

υj

 

 

 

j

n1-υ1 n2-υ2 …. ns-υs

n-υj

 

 

 

j

 

 

 

 

n1

n2

….. ns

N

В этом случае получаем s последовательностей наблюдений, в каждом из которых некоторое событие, скажем, Е осуществляется соответственно υ1, υ2,…,υs раз, и надо установить, есть ли основания полагать, что событие Е во всех этих наблюдениях имеет одну и ту же постоянную, хотя и неизвестную, вероятность р ? Оценкой для этой вероятности может служить частота события Е во всей совокупности данных

p =1q = n1 υ j

j

и тогда распределение вероятностей по Пирсону запишется в виде

 

2

 

(υ j nj p )2

 

1

υ 2j

 

p

χ

 

=

 

=

 

 

n

 

 

nj p q

p q

nj

q

 

 

j

 

 

 

j

 

 

с s-1 степенями свободы. Величина

Q =

 

n 1

χ 2

n(s 1)

 

 

 

называется коэффициентом расхождения.

Рассмотрим случай, когда s=2, т.е. имеется две независимые выборки и нужно установить, принадлежать ли они одной и той же совокупности? Для этого случая таблицу можно представить в виде

µ1

υ1

µ1

+υ1

µ2

υ2

µ2

+υ2

.

.

 

.

.

.

 

.

µr

υr

µr

+υr

 

 

 

m

n

m+n

111

Здесь имеется r-1 степеней свободы, и распределение Пирсона запишется в виде

χ 2 = mn

 

1

µi

+ υi 2 .

µi

 

i

+υi m

n

 

 

 

 

Обозначив в этом выражении

µi

= ωi ,

m

= ω ,

µi +υi

m + n

получим удобную для расчета зависимость

 

 

 

1

 

µiωi

 

 

χ

2

=

 

mω

 

 

 

 

.

 

ω(1ω)

 

 

 

 

 

i

 

 

В качестве примера рассмотрим, например, доходы по возрастным группам рабочих и служащих, и мастеров в промышленности некоторой страны, приведенных ниже в таблице.

 

 

Рабочие и служащие

 

Мастера

 

Доход,

 

Возрастная группа

 

 

 

 

сотни дол.

 

40-50

50-60

 

Возрастная группа

 

 

µi

υi

ωi

40-50

50-60

 

 

 

 

 

 

µi

υi

ωI

< 1

 

7831

7558

0,509

71

54

 

0,568

1-2

 

26740

20685

0,564

430

324

 

0,570

2-3

 

35572

24186

0,595

1072

894

 

0,545

3-4

 

20009

12280

0,619

1609

1202

 

0,572

4-5

 

11527

6776

0,629

1178

903

 

0,566

>5

 

6919

4222

0,621

158

112

 

0,585

Итого

 

108598

75707

0,589

4518

3489

 

0,564

 

χ2=840,62 при 5 ст. св.

 

χ2=4,27 при 5 с.с

 

 

Р<0,001

 

 

Р=0,51

 

Откуда следует: нет оснований считать, что выборки по мастерам не принадлежат к одной генеральной совокупности, т.е. они являются однородными. Этого сказать нельзя по первой группе-рабочих и служащих. Эти выборки неоднородны.

112

6.Анали з результатов экспери мента

6.1.Характеристика видов связей между рядами

наблюдений

На практике боль шинство измерений связаны с установлением зависимости одних величин от изменения других. В таком случае

целью эксперимента

является

получение

ф ункциональной

зависимости

Для

этого должны

одновременно

определяться значени я

и соответствующие им

значения , а

задачей эксперимента является построение математи ческой модели исследуемой зависимости. Другими словами, р ечь идет об установлении связи между двумя рядами наблюдени й.

Из всего многообразия связей обычно выделяют следующие два вида: функциональны е связи (или зависимости) – при изменении одной величины дру гая изменяется так, что каждому значению соответствует совер шенно определенное (однозначн ое) значение yi

 

 

 

а)

б)

в)

Рис.6.1. Функциональная и стохастическая связь

Однако, на практи ке такой вид связей встречается достаточно редко. Влияние отд ельных случайных факторов может быть достаточно мало, но в совокупности они могут существенно влиять на результаты экспер имента. В этом случае отмечаем наличие стохастической (вероят ностной) связи между переменными.

113

Стохастические связи характеризуются тем, что переменная y реагирует на изменение другой переменной (переменных) Х изменением своего закона распределения. В результате зависимая переменная принимает не одно конкретное значение, а несколько из возможного множества значений; повторяя испытания, будем получать другие значения функции отклика, и одному значению х в различных реализациях будут соответствовать различные значения у.

На рис.6.1. б) – кривая зависимости, проходящая по центру полосы экспериментальных точек (математическому ожиданию), которые могут и не лежать на искомой кривой y=f(X), и занимают некоторую полосу вокруг нее. Эти отклонения вызваны погрешностями измерений, неполнотой модели и учитываемых факторов, случайным характером самих исследуемых процессов и т.п.

Анализ стохастических связей приводит к различным постановкам задач статистического исследования зависимостей, которые упрощенно можно классифицировать следующим образом:

1) Задачи корреляционного анализа – исследование наличия

взаимосвязей между отдельными группами переменных;

 

2) Задачи регрессионного анализа – задачи, связанные

с

установлением аналитических зависимостей между переменным у и одним или несколькими переменными х12,…,хк , которые носят количественный характер;

3) Задачи дисперсионного анализа – задачи, в которых переменные х12,…,хк носят качественный характер, а исследуется и устанавливается степень их влияния на у.

Стохастические зависимости характеризуются формой, теснотой

связи, численными значениями коэффициентов уравнения регрессии.

(Þ /

 

 

Форма связи устанавливает вид функциональной зависимости

 

и характеризуется уравнением регрессии. Если уравнение

(Þ 0* ªT 0 "

 

связи линейное, имеем линейную многомерную зависимость:

 

-

(6.1)

где в01,…,вк – коэффициенты уравнения.

Следует отметить, что задача выбора функциональной зависимости – неформальная. Решение о выборе той или иной математической модели остается за исследователем. Только

114