Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТеорПрактНаучнИссл_Устименко

.pdf
Скачиваний:
19
Добавлен:
03.03.2016
Размер:
2.48 Mб
Скачать

91

и т.д.

, чтобы проверить нулевую гипотезу 0 относительно альтернативной 1.

Критерием статистической гипотезы называется правило, которое позволя-

ет принять или отвергнуть нулевую гипотезу. При построении этого правила

используют

некоторую функцию (статистику) от результатов наблюдения

 

= ( ,

, … , ), которая называется статистикой критерия.

 

1 2

 

Основной принцип проверки гипотез состоит в следующем. Множество возможных значений статистики критерия разбивается на два непересекающихся подмножества: критическую область , т.е. область отклонения гипотезы 0 область принятия этой гипотезы. Если фактически полученное по выборке значение статистики критерия попадает в критическую область, то основная гипотеза отклоняется, и принимается альтернативная гипотеза 1. Если значение критерия попадает в , то принимается 0, 1 отклоняется.

При проверке гипотезы могут быть допущены ошибки двух типов: Ошибка первого рода состоит в том, что отвергается нулевая гипотеза, ко-

гда на самом деле она верна.

Ошибка второго рода возникает, когда отвергается альтернативная гипотеза 1 , когда на самом деле она верна.

Вероятность ошибки первого рода (обозначается ) называется уровнем значимости критерия:

= 1 0

Чем меньше , тем меньше вероятность отклонить верную гипотезу. Допустимую ошибку первого рода обычно задают заранее. Обычно для используют стандартные значения =0,05; 0,01; 0,005; 0,001.

Вероятность ошибки второго рода (обозначается ):

= 0 1 .

Величину 1 − , т.е. вероятность недопущения ошибки второго рода (отвергнуть неверную гипотезу 0, принять верную 1), называют мощностью критерия. Чем больше мощность критерия, тем меньше вероятность ошибки второго рода.

Последствия ошибок 1-го, 2-ого рода совершенно различны, в чем можно убедиться на таких примерах:

-применительно к радиолокации говорят, что – вероятность пропуска сигнала, – вероятность ложной тревоги;

-применительно к производству – – риск поставщика (т.е. забраковка по выборке всей партии изделий, удовлетворяющих стандарту), – риск потребителя (т.е. прием по выборке всей партии изделий, не удовлетворяющих стандарту);

92

- применительно к судебной практике, ошибка 1-ого рода приводит к оправданию виновного, ошибка 2-ого рода - осуждению невиновного.

В общем случае, при принятии решения возможны варианты, представленные в таблице 4.2.

Отметим, что одновременное уменьшение ошибок 1-ого и 2-ого рода возможно лишь при увеличении объема выборок. Поэтому обычно при заданном уровне значимости отыскивается критерий с наибольшей мощностью.

 

 

 

Таблица 4.2.

Варианты принятия решения и соответствующие им ошибки

 

 

 

 

 

Гипотеза

Верна

Неверна

 

 

 

 

Наш выбор

Принимается

Правильное решение

Ошибка II рода

 

 

 

Отвергается

Ошибка I рода

Правильное решение

 

 

 

 

 

4.3.2.Отсев грубых погрешностей наблюдений

Вслучае отсева грубых погрешностей (ошибок) нулевая гипотеза формулируется следующим образом:

НО: «Среди результатов наблюдений (выборочных, опытных данных) нет резко выделяющихся (аномальных) значений»

Альтернативной гипотезой может быть

Либо Н1: «среди результатов наблюдений есть только одна грубая ошиб-

ка»,

Либо Н1: «среди результатов наблюдений есть две или более грубых ошибок».

Если известно, что есть только одно аномальное значение, то оно будет крайним членом вариационного ряда (т.е. ряда наблюдений, расположенных в

возрастающей последовательности: 1 2 ≤ ≤ ). Поэтому проверять выборку на наличие одной грубой ошибки естественно при помощи статистики

 

=

1

,

(4.3.1)

 

1

 

 

 

 

 

 

 

 

Если сомнения вызывает первый член вариационного ряда 1 = ,

или

 

=

,

(4.3.2)

 

 

 

 

 

 

 

 

 

 

Если сомнителен максимальный член вариационного ряда = max . Н.В.Смирновым исследовалось распределение указанных статистик (4.3.1)

и (4.3.2) и были составлены таблицы точек , (квантили порядка = 1 − ) для α=0,1; 0,05; 0,01 при объеме выборки от 3 до 20 опытов.

При выбранном уровне значимости α критическая область для критерия Н.В.Смирнова строится следующим образом:

1 > , или > ,

93

, - это табличное значение. В случае, когда выполняется условие (статистика попадает в критическую область), то нулевая гипотеза отклоняется, т.е. выброс 1 или не характерен для данной выборки, после чего значения 1 или исключают из рассмотрения, а найденные ранее оценки подвергаются корректировке с учетом отброшенного результата.

4.3.3. Сравнение двух рядов наблюдений

При проведении и анализе результатов экспериментальных исследований часто приходится сравнивать две партии изделий, показания двух или нескольких приборов, анализировать результаты работы однотипных установок, сравнивать результаты проб материалов и т.д. вот некоторые примеры подобных ситуаций:

1.Необходимо сравнить показания двух приборов, измеряющих одну

иту же величину, когда этими средствами получено два ряда наблюдений данной величины. Одинакова ли точность измерения одного и того же технологического параметра разными приборами.

2.Требуется поверить рабочее средство измерения (т.е. проверить, выходит ли погрешность прибора за пределы регламентированных значений) с помощью образцового средства измерения. Равно ли математическое ожидание показаний прибора действительному значению измеряемого параметра?

3.Два агрегата выпускают одну и ту же продукцию. Необходимо сделать вывод о том, какой их них лучше или хуже в каком–либо смысле. Решение подобных задач осуществляется с использованием аппарата проверки статистических гипотез.

4.3.3.1. Проверка однородности дисперсий

Такую операцию приходится выполнять, когда сопоставляются результаты нескольких выборок. Величина рассеяния характеризует такие исключительно важные показатели, как точность машин, приборов, стабильность технологических процессов, качество готовой продукции и т.д. Поэтому, например, о преимуществах той или иной технологии или о качестве выпускаемой продукции можно сделать вывод в результате сравнения дисперсий тех параметров, которые их характеризуют.

Для решения задач такого типа требуется установить, являются ли выборочные дисперсии 12 22 со степенями свободы 1 и 2значимо отличающимися или же они характеризуют выборки, взятые из одной и той же генеральной совокупности или из генеральных совокупностей с равными дисперсиями. В этом случае нулевая гипотеза формулируется так: между двумя дисперсиями различия нет при заданном уровне значимости α ( 12 = 22 = 2).

Для проверки этой гипотезы используется критерий Фишера, зависящий от числа степеней свободы 1 и 2.

94

Поскольку для проверки нуль-гипотезы 12 = 22, т.е. требуется проверить, что две выработки принадлежат одной и той же генеральной совокупности, то выражение можно представить как отношение выборочных дисперсий

 

2

 

 

 

 

 

=

1

где 2

> 2.

 

 

 

2

 

 

 

 

1

2

 

 

 

 

2

 

 

 

 

 

Очевидно, что F всегда больше единицы. Выбирается уровень значимости

α. Нулевую гипотезу принимают, если

.

, 2

определяется по

 

 

 

, 1, 2

, 1

 

таблицам квантилей F-распределения Фишера для числа степеней свободы1 = 1 − 1 и 2 = 2 − 1 и уровня значимости.

4.3.3.2. Проверка однородности нескольких дисперсий

Критерий Фишера используется для сравнения только двух дисперсий, однако на практике приходится сравнивать между собой три и более дисперсий.

При сопоставлении дисперсий ряда выборок нулевая гипотеза заключается в том, что совокупностей, из которых взяты выборки, имеют равные дисперсии. То есть проверке подлежит предположение, что все эмпирические диспер-

сии 2

, 2

2 относятся к выборкам из совокупности с одной и той же гене-

1

2

 

 

 

 

 

 

ральной дисперсией 2.

 

 

 

 

 

Пусть среди выборочных дисперсий обнаружена такая, которая значитель-

но больше всех остальных 2

. Задача заключается в том, чтобы выяснить,

 

 

 

 

 

 

 

 

можно ли считать отличие выделенной дисперсии 2

 

существенными. Аль-

 

 

 

 

 

 

 

тернативная гипотеза может быть выбрана как : 2

 

> 2.

 

 

 

 

 

1

 

При равном объеме выборок

=

= =

= для всех выборок

 

 

 

1

2

 

 

 

может быть использован критерий Кохрена. Статистика критерия Кохренарассчитываетка рассчитывается как

2

= 2

=1

Далее для выбранного уровня значимости α определяется табличное значение этого критерия, который зависит от числа степеней свободы = − 1 и числа сравниваемых дисперсий : ; ; . Критическая область строится как; ; . При < ; ; нулевая гипотеза принимается, т.е. отличие выделенной дисперсии считается несущественной.

В случае подтверждения однородности дисперсий можно сделать оценку обобщенной дисперсии 2:

 

 

2

2 =

=1

 

 

 

 

 

Критерий Кохрена используется только в тех случаях, когда все сравниваемые дисперсии имеют одинаковое число степеней свободы (одинаковые объемы выборок). Если же число измерений в различных сериях неодинаково,

95

то для проверки однородности дисперсий обычно выбирается критерий Бартлета. Введем обозначения для общего числа степеней свободы: = 1 + 2 +

+ ; и средневзвешенной дисперсии: 2

 

2 + + 2

 

 

 

2

 

 

 

=

1

1

 

 

 

 

 

=

=1

 

 

. Бартлет по-

+ + +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

 

 

 

 

 

 

казал, что в условиях нулевой гипотезы отношение

 

, где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 2.303( ( 2) −

 

 

lg ( 2),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

1

 

 

 

 

 

 

 

 

= 1 +

 

 

(

 

 

 

 

)

 

 

 

 

 

 

 

3( − 1)

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

распределено приближенно как 2 с − 1 степенями свободы, если все > 2. Гипотеза равенства генеральной дисперсии принимается, если

2

при выбранном уровне значимости .

В этом случае различие между выборочными дисперсиями можно считать незначимым, а сами выборочные дисперсии однородными.

Так как > 1, если 2, то нулевую гипотезу следует принять. Если

> 2, то критерий Бартлета вычисляют полностью.

4.3.3.3. Проверка гипотез о числовых значениях математических ожиданий

Для решения вопроса о соответствии произведенной продукции определенным требованиям (например, ГОСТ или ТУ), или выявлении преимуществ новой разработки по сравнению с существующими аналогами, возникает необходимость по выборочным средним значениям исследуемых случайных величин делать вывод о соответствующих им генеральных значениях математических ожиданий.

При этом может возникнуть задача (1) сравнения неизвестного математического ожидания М1, для которого получена оценка через выборочное среднее1с конкретным числовым значением М (например, с известным математическим ожиданием) или задача (2) сравнения двух математических ожиданий М1и М2, оцененным по двум выборочным средним 1и 2.

Впервом случае в качестве нулевой гипотезы выдвигается предположение

отом, что оцененное математическое ожидание М1равно известному математи-

ческому ожиданию М ( 0: 1 = ). В качестве альтернативной примем

1: 1

Если генеральная дисперсия 2 неизвестна и для нее сделана оценка 2, то используется критерий (распределения Стьюдента). статистика имеет

вид: = . Как и при построении доверительного интервала для матема-

тического ожидания, выбирается уровень значимости . Для числа степеней

96

свободы = − 1 (c которым сделана оценка дисперсии) устанавливаются границы критической области по табличным значениям квантилей t- распределения. Нулевую гипотезу принимают, т.е. полагают, что 1 = при выполнении неравенства: , .

В задаче (2), где сравниваются два неизвестных математических ожидания М1и М2, прежде всего, необходимо убедиться, что исследуемые выборки независимы между собой. После чего для двух нормально распределенных гене-

ральных совокупностей с неизвестными параметрами ,

2, и , 2 , которые

 

 

1

1

2

2

характеризуются независимыми выборками с

объемами,

соответственно,

1и 2

, для сравнения выборочных средних 1 и 2

выдвигается нулевая гипо-

теза о

равенстве математических ожиданий: 0: 1 = 2. Альтернативную ги-

потезу можем сформулировать как 1: 1 2.

Как и в предыдущей задаче, используем критерий. Вид t-статистики зависит от того, равны 12 = 22 = 2, либо не равны 12 22 между собой генеральные дисперсии (для ответа на этот вопрос можно воспользоваться критерием Фишера).

В первом случае (когда дисперсии не имеют значимого отличия) статисти-

ка принимает вид

 

=

1 2

11

1 + 2

двухвыборочный t-критерий с равными дисперсиями, где – обобщенное среднее квадратичное отклонение.

Во втором случае, когда дисперсии значимо отличаются друг от друга, статистика имеет вид:

= 1 2 1 + 21 2

двухвыборочный критерий с неравными дисперсиями.

В зависимости от условия решаемой задачи выбирается необходимый уровень значимости . Границы критической области устанавливаются по табличным значениям квантилей t-распределения. При этом число степеней свободы рассчитывается как = 1 + 2 − 2.

Нулевую гипотезу принимают при выполнении неравенства , . Рассмотрим наиболее типичную практическую задачу. Пусть усовершенст-

вована какая-либо машина. Для оценки полезности реконструкции поставлен сравнительный эксперимент: проведен ряд измерений производительности до и после выполненной модернизации. В результате эксперимента получены две выборки. Первая - число измерений n1 , математическое ожидание 1

97

и дисперсия 2

(до реконструкции).

Вторая - число опытов , математическое

1

 

2

 

 

ожидание , дисперсия выборки 2

(после реконструкции). При этом

.

2

2

 

1

2

Ставится вопрос: можно ли утверждать, что различие между 1

и 2 значимо?

Иными словами, можно ли утверждать, что реконструкция дала положительные результаты?

 

Обозначим 1 2

= .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если выйдет за пределы доверительного интервала

 

≤ ≤ +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, то будет значимой величиной.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предположим, что различие

 

между 1

и 2

незначимо, т.е. предположим

= 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда доверительный интервал может быть найден как ≤ +

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ранее было показано, что для оценки дисперсии косвенный измерений

справедлива формула

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

2

 

 

 

 

 

 

2 =

 

 

 

 

 

2

+

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

 

 

2

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для рассматриваемой функции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

= 2

+ 2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

Так как 2

= 2/ , то 2 =

 

1

 

+

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

Если 2

 

и 2

однородны, а только в этом случае можно сравнить

и ,

 

1

 

2

 

 

 

 

 

 

 

 

 

1

2

то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

= 2

(

1

+

 

1

) или 2

= 2

(

1+ 2

)

 

 

 

 

1

 

 

 

 

 

 

 

 

св

 

 

2

 

св

 

1 2

 

 

 

 

В результате,

искомый доверительный интервал

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= ±

+ /( )

 

 

 

 

 

 

 

 

 

 

 

св

1

2

1 2

 

 

Критерий

 

берется для соответствующего .уровня значимости и числа

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

степеней свободы = 1

+ 2 − 2.

 

 

 

 

 

 

Если разность математических ожиданий попадает в построенный доверительный интервал, то гипотеза об эффективности модернизации оборудования отвергается. Если разность превышает доверительный интервал, то можно сделать вывод, что результаты имеют существенные различия и реконструкция дала значимый результат.

98

4.3.4. Проверка гипотезы о законе распределения

Ранее нами выполнялась проверка гипотез на основании статистических критериев в предположении, что известна функция распределения, которая представлялась нормальным законом распределения Гаусса . Однако в большинстве случаев вид закона распределения не известен и требуется статистическое подтверждение его вида.

Наиболее простым методом проверки согласия результатов эксперимента с тем или иным законом распределения является графический метод. Он заключается в оценке эмпирической функции распределения и сопоставлении ее с функцией предполагаемого теоретического закона. Если построенные экспериментальные точки лежат вблизи теоретического графика, то можно считать, что полученные в опытах данные не противоречат выбранному теоретическому закону распределения. Графический метод является довольно грубой оценкой и может использоваться только на первом этапе исследования.

Проверка гипотезы о законе распределения проводится с использованием специально подобранной статистики. Обычно статистические критерии для проверки таких гипотез называются критериями согласия.

Нулевая гипотеза Но в данном случае заключается в том, что исследуемая генеральная совокупность не противоречит предполагаемому теоретическому закону распределения. При этом альтернативная гипотеза обычно формулируется как Н1 - случайная величина имеет любое другое распределение, отличное от предполагаемого.

Разработано достаточно много критериев согласия, отличающихся как своей мощностью, так и объемом опытных данных, необходимых для их использования. Рассмотрим некоторые из них, и в первую очередь остановимся на критериях согласия, которые могут быть использованы при относительно больших объемах выборки.

Когда экспериментатор располагает достаточно представительным количеством экспериментальных данных ( > 100), то их предварительная обработка представляет собой упорядочивание экспериментального материала и построение гистограммы. Для этого:

1.Находят наибольшее ( ) и наименьшее ( ) выборочные значения случайной величины и вычисляют ее размах = − .

2.Размах случайной величины разбивают на равных интервалов, коли-

чество которых выбирают в зависимости от объема выборки. Число интервалов к можно определить по формуле = 1 + 3,32 ( ) с округлением результата до ближайшей целой величины.

99

3.Определяют ширину интервала = / , для упрощения расчетов полученные значения округляют в любую сторону, несколько увеличивая или уменьшая при этом размах варьирования .

4.Устанавливают границы интервалов и подсчитывают число попаданий случайной величины в каждый из выбранных интервалов : 1 ≤ ≤

5.Определяют частоту попаданий для каждого интервала как =

.

6.Определяется величина ординаты = , где – вероятность появ-

ления случайной величины в 1-м интервале.

7.В системе координат ( )на ширине каждого интервала откладывают величины | как высоты и строятся прямоугольники.

8.Очевидно, что площадь элементарного прямоугольника = ∙ =

=

 

 

. Площадь всей гистограммы равна =

 

=

 

= 1.

Следо-

 

 

=1

=1

 

 

 

 

 

 

 

 

вательно, площадь, ограниченная гистограммой,

равна единице.

 

 

9. Построение интегральной функции распределения осуществляется сум-

мированием вероятностей =

 

.

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

Рисунок 4.3.4 – Построение гистограммы и интегральной функции распределения случайной величины

В дальнейшем осуществляется сравнение экспериментально полученного распределения случайной величины с теоретическим. Для этой цели используются различные критерии согласия: Пирсона, Колмогорова и др.

100

Критерий согласия Пирсона. Является универсальным, т.к. применяется для различных видов распределений. Сущность его состоит в сравнении эмпирических и теоретических частот попадания значений случайной величины в различные интервалы равной длины, на которые разбивается весь диапазон ее возможного изменения. В качестве примера рассмотрим критерий Пирсона о нормальном распределении.

Для стандартного нормального распределения теоретическая вероятность попадания случайной величины в интервал ∆ = +1 определяется по формуле

=

− =

1

+1 2 2 .

 

 

+1

 

2

 

 

 

 

Отличие оценки закона распределения P от теоретического закона распределения Р* можно охарактеризовать величиной

2 = ( − )2,

=1

Где и - оценка и теоретическая вероятность случайной величины для i-ого интервала; - весовые коэффициенты, которые с большим весом учитывают отклонения для меньших .

Пирсон выбрал весовые коэффициенты следующим образом:

=

Пирсон показал, что при таком выборе закон распределения 2 слабо зависит от n и P(x), а определяется в основном числом разрядов k (количеством интервалов).

Следовательно,

 

 

 

 

 

 

 

 

− )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

(

 

 

 

(

 

2

 

 

 

 

 

 

 

 

 

 

 

( − )

 

 

 

 

 

 

 

− )

 

2

=

 

 

 

 

=

 

 

=

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

=1

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

Очевидно, что при идеальном соответствии экспериментальных данных нормальному закону, экспериментальное значение критерия Пирсона будет

равно нулю, т.к. = .

Алгоритм использования критерия Пирсона заключается в следующем:

1. Выдвигается нуль-гипотеза: «Отличие экспериментальных данных от нормального закона распределения не существенно» и альтернативная гипотеза: «Отличие экспериментальных данных от нормального закона распределения существенно, т.е. экспериментальные данные не подчиняются закону нормального распределения».