Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая обработка результатов эксперимента

..pdf
Скачиваний:
31
Добавлен:
15.11.2022
Размер:
1.31 Mб
Скачать

Так как τminpасч = 1,565 < 1,649 = τкр(0,05;30), то для величины τminpасч

выполнено неравенство (3.5). Таким образом, можно утверждать, что значение xmin не нужно исключать из исходной совокупности.

Так как τкр(0,05;30) = 1,649 < τmaxpасч = 1,696 < 2,283 = τкр(0,01;30), то для величины τmaxpасч выполнено неравенство (3.6). Поэтому значение

xmax можно было бы исключить из первоначальной совокупности данных, если бы в пользу этого были какие-либо дополнительные аргументы. Так как в условиях задачи таких аргументов нет, то значение xmax остается в выборочной совокупности. На основании полученных результатов делаем окончательный вывод, что в табл. 3.3 ложных значений величины X не обнаружено.

Аналогичную процедуру исключения ложных данных необходимо выполнить для значений случайной величины Y:

1. Упорядочим значения случайной величины Y:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Y

0

0

3

3

4

4

5

5

6

6

7

7

7

7

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

Y

8

8

9

9

10

10

10

10

12

14

14

15

15

15

15

Найдем минимальное и максимальное значения случайной величины Y:

ymin = 0;

 

ymax = 15.

 

 

 

 

 

2. Вычислим опытные значения τpminасч и τpmaxасч

 

для величины Y.

Найдем среднее значение y

случайной величины Y и оценку

 

 

S

ее среднего квадратичного отклонения: y = 8,2;

 

 

= 4,25. По форму-

S

лам (3.1) получим:

 

 

 

 

 

 

 

 

 

 

τpminасч =

| ymin

 

|

=

|08,2|

1,93;

y

 

 

 

 

 

 

 

S

 

 

 

4,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

31

τpmaxасч

=

| ymax

y

|

=

|158,2|

1,60.

 

 

 

 

 

4,25

 

S

 

 

 

 

 

3. Проверим выполнение неравенств (3.5)–(3.7).

Для этого вычислим величины τкр(0,05;m) и τкр(0,01;m) для случайной величины Y при m = 30. Получим, что τкр(0,05;30) = 1,649,

аτкр(0,01;30) = 2,283. Таким образом, оказывается, что для величины

τminpасч выполнено неравенство (3.6), а для величины τmaxpасч – неравенст-

во (3.5). Поэтому можно утверждать, что нет необходимости исключать значение ymax из первоначальной совокупности, а значение ymin можно было бы исключить, если бы в пользу этого были какие-либо дополнительные аргументы. Так как в условиях задачи таких аргументовнет, точисло ymin также оставляем в выборочнойсовокупности.

В результате проведенной процедуры можно утверждать, что

втабл. 3.3 значений случайных величин X и Y ложных данных нет. Решение примера 3.1 завершено.

Так как предполагается, что величины X и Y зависимы, то следу-

ет заметить: если бы в результате проведения процедуры исключения ложных данных какие-либо значения одной из этих величин были признаны ложными, то ложными следовало бы признать и соответствующие значения другой величины.

После исключения ложных данных остается выборочная совокупность объемом n, где n ≤ m.

Оставшиеся n данных этой совокупности необходимо проверить на их случайность и независимость.

3.2. Процедура проверки опытных данных на их случайность и независимость

При проведении статистического исследования возможны случаи нарушения условий проведения эксперимента, не относящиеся к наличию в выборочной совокупности ложных данных.

Например, эксперимент считается нарушенным, если внутри ка- кой-либо из исследуемых совокупностей опытных данных обнару-

32

живается закономерность, связывающая эти данные. Это может произойти, если на измеряемые величины оказывают влияние посторонние неслучайные факторы. Поэтому прежде, чем применять методы статистического анализа, исследователь должен убедиться в отсутствии такого влияния. Случайность и независимость опытных данных – необходимоеусловиерепрезентативности выборочнойсовокупности.

Наблюдения принято считать статистически независимыми, если результаты, полученные в результате отдельного наблюдения, не связаны с данными предыдущих и последующих наблюдений. Но необходимы критерии, которые позволяют установить случайность и независимость данных в выборочной совокупности.

Для статистической проверки случайности и независимости результатов наблюдения обычно применяют следующие критерии:

1)критерий серий, основанный на использовании медианы вы-

борки;

2)критерий «восходящих» и «нисходящих» серий.

Рассмотрим способы проверки данных из выборочной совокупности на их случайность и независимость по этим критериям.

3.2.1. Критерий, основанный на использовании медианы выборки

Критерий, основанный на использовании медианы выборки, позволяет заметить монотонное смещение среднего выборочного значения в ходе эксперимента. Такое «уплывание» при нарастании объема выборочной совокупности свидетельствует с некоторой вероятностью, что последовательно получаемые опытные значения исследуемой величины не являются случайными и их смещение относительно медианы является следствием какой-тоскрытой закономерности.

Изложим основные этапы проверки опытных данных на их случайность и независимость с помощью этого критерия при уровне значимости α = 0,05.

Первый этап. Пусть x(1), x(2), …, x(n) – вариационный ряд случайной величины X, т.е. последовательность значений величины X, упо-

33

рядоченная по возрастанию. Здесь n – это число наблюдений, оставшихся после исключения ложных результатов.

Второй этап. Находим выборочное значение медианы xmed(n) по следующей формуле:

x n

,

если n нечетное,

 

 

 

+1

 

 

 

 

 

 

2

 

 

 

xmed(n) = x

n

+x

+1

(3.9)

 

 

 

n

 

 

 

2

 

 

2

 

, если n четное.

 

 

2

 

 

 

 

 

 

 

Здесь через А обозначена целая часть числа А, т.е. ближайшее к А целое число, не превосходящее А.

Третий этап. Теперь рассмотрим исходную (неупорядоченную) выборку x1, x2, …, xn с исключенными ложными данными. Вместо

каждого числа xi ставим «+» (плюс), если xi > xmed(n), и «−» (минус), если xi < xmed(n). Значениям xi = xmed(n) никакого знака присваивать не

будем.

В общем случае полученная последовательность плюсов и минусов характеризуется числом серий ν(α;n) и длиной τ(α;n) самой длинной серии.

Под серией понимают последовательность подряд идущих плюсов или подряд идущих минусов. В частности, какая-то из серий может состоять только из одного плюса или только из одного минуса, и тогда ее длина равна единице.

Четвертый этап. Рассмотрим гипотезу о случайности и независимости данных в рассматриваемой выборочной совокупности (при уровне значимости α = 0,05).

В этих предположениях для случайных величин νрасч(n) и τрасч(n) проверяем выполнение следующей системы неравенств:

 

 

 

 

1

 

 

 

 

 

 

 

νрасч(n) >

 

(n+1)

1,96

n1

кр(0,05;n),

2

 

 

 

 

 

 

 

 

 

 

(3.10)

 

τ

расч

(n)3,3ln(n)+1

кр

(0,05;n).

 

 

 

 

 

 

 

 

 

34

Если хотя бы одно из условий системы (3.10) окажется невыполненным, то предположение о независимости результатов наблюдения отвергается с вероятностью α = 0,05 совершить ошибку первого рода.

Смысловое содержание системы неравенств (3.10) заключается

в следующем. Если νрасч(n) ≤ νкр(0,05;n), т.е. если расчетное число νрасч(n) серий не будет превосходить критическую величину

νкр(0,05;n) числа серий, то данные исследуемой выборочной совокупности следует признать неслучайными и зависимыми при заданном уровне значимости α = 0,05. То же утверждение имеет место, ес-

ли τрасч(n) > τкр(0,05;n), т.е. если расчетная длина τрасч(n) самой длинной из серий превосходит критическую величину τкр(0,05;n), вычис-

ляемую по формуле (3.10), либо равна ей.

Приведем пример проверки экспериментальных данных на их случайность и независимость.

Пример 3.2. Пусть имеются две совокупности значений случайных величин X и Y (см. табл. 3.3).

Отметим, что так как в процессе проведения процедуры исключения ложных данных таковых обнаружено не было, то в нашей задаче n = m, как для случайной величины X, так и для случайной величины Y.

Пользуясь описанными выше правилами, проверим на случайностьи независимость совокупность значений случайной величины X:

1.Упорядоченные значения величиныX приведеныв примере3.1.

2.Так как число n = 30 значений случайной величины X является четным, то согласно формуле (3.9) получаем:

 

1

 

 

 

 

 

 

 

xmed =

 

xn

+xn

 

 

= 0,5 (6+6) = 6.

2

+1

 

 

 

 

 

 

 

 

2

2

 

3. На основании табл. 3.3 согласно изложенной выше процедуре построим последовательность плюсов и минусов:

35

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

X

+

+

+

+

 

+

 

 

+

+

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

16

 

17

 

18

 

19

 

20

 

21

 

22

 

23

 

24

 

25

 

26

 

27

 

28

 

29

 

30

X

 

 

 

+

 

 

 

+

+

+

+

+

 

 

 

Подсчитаем число νрасч(n) подряд идущих знаков «+» и подряд идущих знаков «−», а также длину τрасч(n) самой длинной серии плюсов или минусов. Напомним, что пустые клетки таблицы при подсче-

тах не учитываются. Получим, что νрасч(n) = 15, τрасч(n) = 4. 4. Проверим выполнение системы неравенств (3.10):

ν

расч

(n) >

1

(n+1)1,96

 

n1 ;

15>

1

(30+1)1,96 301 ;

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

τ

 

(n)

< 3,3ln(n)+1 .

 

4

< 3,3ln(30)

+1 .

 

 

расч

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

15

> 15,51,96 29

4,975 =4;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4< 3,3ln(30)+1

5,874 =5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как оба неравенства системы (3.10) выполнены, то делаем вывод, что с вероятностью 1 – α = 1 – 0,05 = 0,95 гипотеза о случайности и независимости совокупности исследуемых выборочных значений случайной величины X, содержащихся в табл. 3.3, не должна быть отвергнута.

Аналогично можно проверить на случайность и независимость значения случайной величины Y и убедиться, что содержащиеся в табл. 3.3 выборочные значения случайной величины Y также случайны и независимы, т.е. при измерении величины Y не обнаружилось скрытых статистических закономерностей, связывающих ее значения.

Решение примера 3.2 завершено.

Рассмотренный критерий случайности и независимости неупорядоченной совокупности опытных данных одновременно использует две независимых случайных величины: число серий из одинаковых знаков и длину самой длинной из серий.

36

Теоретически случайная величина νрасч(n) для случайных независимых расчетных данных с одинаковым математическим ожиданием и дисперсией должна подчиняться нормальному закону распределения с математическим ожиданием

Mνрасч(n) = 0,5n + 1

и дисперсией

Dνрасч(n) = 0,25 (n – 1).

Это обстоятельство как раз и позволяет при заданном уровне значимости α исследовать соответствие опытной статистики ее теоретическому аналогу с помощью специально разработанных критериев, а при обнаруженном несоответствии делать вывод о стохастической зависимости результатов эксперимента. При значении уровня значимости α = 0,05 эти критерии принимают вид системы неравенств (3.10), которая и была использована в нашем случае.

3.2.2. Критерий «восходящих» и «нисходящих» серий

Еще один критерий проверки опытных данных на их случайность и независимость позволяет уловить не только монотонное, но и периодическое смещение среднего выборочного значения в ходе эксперимента. Это критерий «восходящих» и «нисходящих» серий.

Как и в предыдущем случае, рассматривается исходная неупорядоченная выборка с исключенными ложными данными объемом n.

Снова строится последовательность знаков «+» и «−», но по иному правилу. Знак «−» ставится, если последующее выборочное значение меньше предыдущего: xi+1 > xi, а знак «+», если наоборот: xi+1 < xi. Если xi+1 = xi, то в последовательности оставляется пустое место. Построенная таким образом последовательность знаков позволяет в исходной последовательности опытных данных выделить монотонно возрастающие («восходящие») и монотонно убывающие («нисходящие») отрезки.

Снова рассматриваются две расчетные статистики: число серий νрасч(n) изодинаковых знаков идлинаτрасч(n) самойдлинной изсерий.

37

В случайной последовательности серия, состоящая из одинаковых знаков (подряд идущих «+» или «−»), не может иметь слишком большую длину, а число серий также не должно быть меньше критического.

При уровне значимости α = 0,05 вопрос о том, можно ли принять гипотезу о случайности и независимости опытных данных, решается на основании следующей системы неравенств:

 

1

 

 

 

νрасч(n) >

 

(2n1)1,96 (16n29)/90

 

кр(0,05;n);

 

 

3

 

 

(3.11)

 

 

 

τрасч(n)кр (0,05;n).

 

 

 

 

 

 

 

Величина τкр(0,05;n) принимает различные значения в зависимости от объема n выборочной совокупности. Приведем соответствующие значения этой величины для некоторых значений величины n (при уровне значимости α = 0,05):

n

n ≤ 26

26< n ≤ 153

153< n ≤ 1170

τкр(0,05;n)

5

6

7

Для других значений уровня значимости α необходимо воспользоваться справочной литературой по статистике [1, 10].

Если хотя бы одно из неравенств (3.11) нарушено, то гипотезу о случайности и независимости данных в выборочной совокупности следует отвергнуть. Если ошибки, приведшие к неслучайности и зависимости опытных данных, были вызваны систематическими погрешностями в ходе измерений, то необходимо повторить эксперимент и составить новую выборочную совокупность. Новые опытные данные также необходимо проверить на случайность и независимость.

Особое значение проверка нарушения условий проведения статистического наблюдения имеет при решении вопросов безопасности, связанных с получением и обработкой данных мониторинга окружающей среды, данных о состоянии технических объектов и т.п.

38

Закономерности, обнаруженные при первичной обработке, могут свидетельствовать не только об обычных ошибках измерения, но и о начале развития опасных процессов, которые скрытым образом влияют на результаты измерения. Своевременный первичный анализ опытных данных может привести к выводам, способствующим более тщательным наблюдениям, и в результате – к выявлению причин опасных явлений, которые могут в дальнейшем привести к значительному материальному ущербу и человеческим потерям.

Контрольные вопросы

1.Какие ошибки называют случайными? Что такое систематические ошибки, какими причинами они обусловлены?

2.Какова цель первичной обработки совокупности опытных данных? Назовите две главные процедуры их первичной обработки.

3.Укажите основные источники ложных данных.

4.В чем суть процедуры исключения ложных данных? Какую

роль при этом играет задание уровня значимости α?

5.Почему опытные статистики каждый раз необходимо пересчитывать после отбрасывания ложных данных?

6.Почему данные эксперимента необходимо подвергнуть процедурам проверки на их случайность и независимость? Укажите несколько причин возникновения зависимости и неслучайности экспериментальных значений измеряемых величин.

7.Какие критерии можно применить с целью статистической проверки случайности и независимости результатов наблюдения?

8.Какое нарушение случайности данных позволяет заметить критерий, основанный на использовании медианы выборки? Какие две случайные величины позволяют заметить это нарушение?

9.Какое нарушение случайности данных позволяет заметить критерий «восходящих» и «нисходящих» серий, в отличие от процедуры, основанной на медиане выборки?

39

4. СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ

После процедур первичной обработки исходная совокупность опытных результатов представляется выборочной совокупностью, для которой выполнены важнейшие требования, обеспечивающие ее репрезентативность.

Дальнейший статистический анализ, как правило, начинается с оценки значений важнейших числовых характеристик исследуемых случайных величин, представленных совокупностями своих выборочных значений, и проверки выдвигаемых гипотез.

Далее эти оценки необходимо рассматривать как случайные величины, выдвинуть и проверить гипотезы о значимости полученных оценок и возможности их использования для проверки гипотез о виде распределения генеральной совокупности значений исследуемой случайной величины.

4.1. Статистические оценки числовых характеристик случайных величин

Предположим, что некоторая случайная величина X, характеризуемая числовым параметром θ, истинное значение которого нам неизвестно, исследуется опытным путем. Наблюдаемые при этом значения величины X, регистрируемые в качестве результатов эксперимента (опытных данных), являются ее реализациями и составляют выборочную совокупность. Элементы выборочной совокупности и ее объем n меняются от опыта к опыту. При этом опытные данные, несмотря на то что были выполнены процедуры первичной обработки, по-прежнему зависят от случайных возмущений и содержат погрешности измерений. Попытка вычисления параметра θ на основании выборочной совокупности приводит к понятию статистики и статистической оценки.

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]