Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
учебник_2.doc
Скачиваний:
5
Добавлен:
01.03.2025
Размер:
4.17 Mб
Скачать

6.3. Проверка статистических гипотез

Выдвинутую гипотезу о законе распределения случайной величины (его виде и параметрах) называют нулевой (основной) и обозначают H0.

Гипотезу, которая противоречит нулевой, называют конкурирующей (альтернативной).

Проверка статистической гипотезы означает проверку соответствия характеристик выборки некоторым теоретическим (предполагаемым) значениям этих характеристик.

Проверяются следствия, логически вытекающие из содержания гипотезы.

Пусть событие А таково, что вероятность его наступления при гипотезе Н0, меньше . Если в эксперименте произошло событие А, то отвергаем гипотезу Н0 на уровне значимости .

При проверке гипотезы возможны ошибки двух видов: ошибка первого рода заключается в том, что мы отвергаем гипотезу, когда она верна, а ошибка второго рода – принимаем гипотезу, когда она неверна. Вероятность ошибки первого рода называется уровнем значимости.

Пример 6.3.

Известно, что шарик сделан либо из пробки, либо из камня. Гипотеза H0: шарик сделан из пробки. Гипотеза H1: шарик сделан из камня. Погружаем шарик в воду. Пусть событие А: «шарик тонет в воде». Если шарик сделан из пробки, то вероятность этого события ничтожно мала. Если шарик утонул (событие А произошло), то гипотезу H0 отвергаем.

Статистический критерий (правило, по которому гипотеза принимается или отвергается) устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Для построения события А используются специальные функции от наблюдаемых значений, которые называют статистиками. Статистика строится таким образом, чтобы ее распределение при нулевой гипотезе и при альтернативе как можно больше различались. Распределения статистик хорошо известны, а их значения вычисляются по характеристикам выборки. Событие А состоит в том, что вычисленное значение статистики больше некоторого известного, «табличного» значения.

Критическая область – совокупность значений статистики, при которых нулевую гипотезу отвергают.

Критические точки – точки, отделяющие критическую область от области принятия гипотезы

Можно предложить следующую схему статистической проверки гипотез (см. рис. 6.4):

Р ис. 6.4.

Задача 1

Рассмотрим реализацию этой схемы на примере задачи 1: зависит ли эффективность обучения иностранному языку от методики преподавания?

Начнем с описания эмпирических (т.е. полученных путем опыта) данных. Если речь идет о двух методиках, значит, надо выделить две группы испытуемых: те, которые обучались по первой методике, и те, которые обучались по второй. Если нас интересует эффективность обучения, значит, в нашем распоряжении должны быть способы определить уровень обучаемого, например, путем тестирование или экзамена. Выделим три уровня владения языком: слабое, удовлетворительное и хорошее. Каждый испытуемый принадлежит одной из шести групп, определяемых методикой преподавания и степенью освоения языка. Результаты испытаний удобно (и принято) представлять в виде таблицы.1

Таблица 1.

Распределение групп по результатам

Методики

Слабое

Удовлетворительное

Хорошее

всего

Первая

8

12

11

31

Вторая

13

7

9

29

всего

21

19

20

60

Пусть данная таблица содержит результаты некоторого экзамена.

«Содержательное предположение»: эффективность обучения иностранному языку не зависит от методики преподавания.

«Статистическая гипотеза»: Если эти случайные величины (степень владения языком, т.е. эффективность обучения, и методика преподавания) независимы, то pij – вероятность попасть в ячейку, находящуюся на пересечении строки с номером i и столбца с номером j равна произведению вероятности попасть в строку с номером i (pi ) и вероятности попасть в столбец с номером j (pj ). Таким образом мы можем вычислить теоретические частоты (т.е. число испытуемых, которое бы оказаться в каждой ячейке, если бы исследуемые случайные величины были независимыми): pij = pi pj.

Таблица 2.

Теоретические частоты

Методика

Слабое

Удовлетворительное

Хорошее

всего

Первая

(теоретические)

60(21/60) (31/60)= 10,85

60(19/60)(31/60)= 9,82

60(20/60)(31/60)= 10,33

Первая (наблюдение)

8

12

11

31

Вторая

(теоретические)

60(21/60) (29/60)= 10,15

60(19/60)(29/60)= 9,18

60(20/60)(29/60)= 9,67

Вторая (наблюдение)

13

7

9

29

Всего

21

19

20

60

Разумеется, полученные теоретические частоты отличаются от наблюдаемых. Но насколько значимо это отличие? Ответ дается критерием согласия Пирсона.

Критерий согласия К. Пирсона (критерий хи-квадрат) служит для проверки гипотезы о предполагаемом законе неизвестного распределения. Нулевая гипотеза: генеральная совокупность распределена по закону В (в нашем примере: pij = pi pj). Для проверки гипотезы сравниваются эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нулевой гипотезы) частоты. Если генеральная совокупность распределена по закону В, то указанная далее статистика имеет распределение хи-квадрат с определенным числом степеней свободы.

Для проверки при данном уровне значимости  нулевой гипотезы Н0, состоящей в том, что исследуемые признаки независимы, – следует выполнить следующие действия.

  1. Вычислить теоретические (ожидаемые) частоты .

  2. «Вычислить наблюдаемое значение критерия»:

.

Таблица 3.

Вспомогательные вычисления

Методики

Слабое

Удовлетворительное

Хорошее

Первая

(8-10,85)2/8

(12-9,82)2/12

(11-10,33)2/11

Вторая

(13-10,15)2/13

(7-9,18)2/7

(9-9,67)2/9

1,01+0,40+0,04+0,63+0,68+0,05=2,81

  1. По таблице критических точек распределения хи-квадрат, по заданному уровню значимости  и числу степеней свободы k=(n-1)(m-1), найти критическую точку .

В данном случае число степеней свободы k = (3-1)(2-1)=2

Возьмем уровень значимости  равным 0,05. Тогда (0,05; 2)= 5,99.

  1. «Сравнение с критической точкой»: если – нет оснований отвергнуть нулевую гипотезу.

Если – нулевую гипотезу отвергают.

Поскольку 2,81 < 5,99, то на уровне значимости 0,05 мы можем считать эффективность обучения независящей от методики преподавания. «Гипотезу не отвергаем». 

Замечание: этот критерий применяется для выборок с объемом не менее 50. Каждая группа должна содержать не менее 5 вариант.

Рассмотрим еще одну задачу типа 1.

Пример 6.4.

Приведены результаты психологического теста (в баллах) для 22 женщин: 25, 52, 44, 54, 44, 12, 47, 12, 20, 47, 13, 49, 11, 76, 41, 68, 60, 28, 42, 23, 39, 17 и 19 мужчин:

50, 38, 21, 80, 42, 88, 57, 67, 57, 25, 90, 67, 12, 22, 81, 63, 35, 35, 37.

Зависят ли результаты тестирования от пола?

Содержательное предположение: результаты тестирования от пола не зависят. Статистическая гипотеза: распределение результатов тестирования в группе женщин не отличается от распределения результатов тестирования в группе мужчин. Но если эти распределения не различаются, значит, их средние и дисперсии также не различимы. Таким образом, имеем две статистические гипотезы: гипотезу о равенстве средних и гипотезу о равенстве дисперсий.

Следующие критерии справедливы для выборок из нормальных генеральных совокупностей.

Критерий Стьюдента применяется для сравнения средних двух нормальных генеральных совокупностей, дисперсии которых одинаковы, но неизвестны.

При заданном уровне значимости проверяется нулевая гипотеза о равенстве математических ожиданий (генеральных средних) двух нормальных совокупностей с одинаковыми, но неизвестными дисперсиями при альтернативе их неравенства.

Правило проверки нулевой гипотезы:

1. Вычислить наблюдаемое значения критерия:

,

где n и m – объемы выборок, и – выборочные средние, а и – исправленные дисперсии.

В условиях Примера 6.4 n = 22, m = 19,  37,45;  50,89;  362,83;  569,77; Тнабл  - 2.

2. По таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы k=n+m-2 найти критическую точку (двустороннюю) – t.

В условиях Примера 6.4 k= 39; по таблицам для уровня значимости 0,1 и 39степеней свободы находим t = 1,68.

3. Если |Тнабл| > t, нулевую гипотезу отвергают на данном уровне значимости. В противном случае нулевая гипотеза не противоречит имеющимся наблюдениям, т.е. нет оснований отвергнуть гипотезу. 

В условиях Примера 6.4 |-2|>1,68, следовательно, гипотезу о равенстве средних отвергаем на уровне значимости 0,1.

Критерий Фишера-Снедекора используется для проверки при данном уровне значимости  нулевой гипотезы о равенстве генеральных дисперсий (т.е. дисперсий генеральных совокупностей) при конкурирующей гипотезе неравенства этих дисперсий.

Правило проверки нулевой гипотезы:

1. Вычислить наблюдаемое значение критерия – отношение большей по величине исправленной дисперсии (см. стр. ) к меньшей: Fнабл = s12/s22

В условиях Примера 6.4 s22 =  362,83; s12 =  569,77; Fнабл  1,57.

2. Найти число степеней свободы исправленных дисперсий:

k1= n1 - 1 (большая) (n1 – объем выборки, имеющей большую исправленную дисперсию)

k2 = n2 - 1 (меньшая) (n2 – объем выборки, имеющей меньшую исправленную дисперсию).

В условиях Примера 6.4 k1= 18, k2= 21.

3. По таблице критических точек распределения Фишера-Снедекора по уровню значимости /2 (вдвое меньше требуемого в условии уровня значимости ) и числам степеней свободы k1 и k2 найти Fкр – критическую точку.

Положим =0,1. В условиях Примера 6.4 Fкр = число между 2,15 и 2,09.

4. Если Fнабл<Fкр – нет оснований отвергать нулевую гипотезу. Если Fнабл>Fкр – нулевую гипотезу отвергают. 

В условиях Примера 6.4 Fнабл<Fкр (1,57 < 2,09). Значит, нет оснований отвергать гипотезу о равенстве дисперсий.