Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
методичка ППД для СП.doc
Скачиваний:
166
Добавлен:
13.11.2019
Размер:
5.4 Mб
Скачать

Тема 32. Методы вторичной статистической обработки

Цель:

  1. t-критерий Стьюдента

  2. хи-квадрат критерий

  3. критерий Фишера

1. t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

Данный критерий был разработан Уильямом Размиковичем Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Задание: До проведения были получены следующие данные:

X1 =10,12,14,15,12,9,14,16,12,14,14,15,15,16

X2 =9,8,10,13,11,7,11,12,11,10,11,12,13,14

Вопрос: Отличаются ли выборочные средние величины достоверно друг от друга?

Х1

Х2

1 – Х1ср)2

2 – Х2ср)2

10

9

11,76

3,45

12

8

2,04

8,16

14

10

0,33

0,73

15

13

2,47

4,59

12

11

2,04

0,02

9

7

19,61

14,88

14

11

0,33

0,02

16

12

6,61

1,31

12

11

2,04

0,02

14

10

0,33

0,73

14

11

0,33

0,02

15

12

2,47

1,31

15

13

2,47

4,59

16

14

6,61

9,88

Σ 188

152

59,4

49,7

Х1ср =13,4

Х2ср =10,9

вычисляем дисперсию по формуле

;

общая формула t-критерия Стьюдента выглядит так

Вычисляем значения m1 и m2 : ;

После вычисления t-критерия Стьюдента, его надо сравнить с табличными значениями для числа степеней свободы n1+ n2 -2 = 26 (в нашем случае). Убеждаемся в том, что наше значение превышает табличное 2.779, для вероятности допустимой ошибки 0.99 Т.о. наша гипотеза о том, что выборочные средние величины действительно отличаются друг от друга, подтвердилась, т.е. внедрение нашей программы успешно.

2. Хи-квадрат критерий (χ²) - непараметрический критерий для статистической проверки гипотезы о статистической связи между двумя переменными по таблице сопряженности. В основе К."Х.-К." лежит наиболее общее определение статистической связи, согласно которому две переменные связаны между собой, если при изменении одной переменной меняется распределение другой.

К."Х.-К." позволяет проверить гипотезу о наличии статистической связи/независимости двух переменных, но не измеряет тесноту связи между ними. Для измерения связи между переменными, образующими таблицу сопряженности, применяются специальные коэффициенты, которые рассчитывают на основе вычисленного по таблице значения χ²

, где

- это частота результатов, наблюдаемая до эксперимента

- частоты результатов наблюдений сделанных после эксперимента

m – общее число групп, на которые разделены результаты наблюдения

 Пример: Для экспериментального исследования была взята выборка из 100 учащихся и с ними был проведен формирующий эксперимент. До эксперимента 30 человек успевали на «3», 30 человек - на «4», остальные 40 человек – на «5»

После эксперимента результаты стали следующими: 10 учащихся стали успевать на «3», 45 учащихся – на «4», 45 учащихся на «5»

Вопрос: Можно ли утверждать, что формирующий эксперимент направлен на улучшение успеваемости учащихся.

= 30%; 30%; 40%

= 10%; 45%; 45%

m =3

Воспользуемся таблицей, где для заданного числа степеней свободы равного m=1 и избранной вероятностью допустимой ошибки (0,05; 0,01; 0,001) Находим табличное χ² значение .

χ²табл = 13,82 следовательно χ²> χ²табл

Значит, эксперимент удался и существует статистическая достоверная разница между средними значениями, представленными как проценты.

3. Критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости интересующего исследователя эффекта. Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий исследователя эффект

Пример: Допустим, что проводился эксперимент, которым проверяется гипотеза о том, что одна из двух программ обучения обеспечивает одинаковое успешное усвоение знаний учащихся с разными способностями, а другая программа (или методика) этим свойством не обладает. Демонстрация справедливости такой гипотезы было бы доказательством того, что индивидуальный разброс оценок учащихся по одной программе меньше или больше чем индивидуальный разброс оценок по другой программе.(табл 2)

Формула Фишера выглядит так: или , где

- число степеней свободы

-дисперсии первой и второй выборки

Таблица 2

Х1

Х2

1 – Х1ср)2

2 – Х2ср)2

4

2

1

6,25

6

7

1

6,25

5

3

0

2,25

7

6

4

2,25

3

1

4

12,25

4

8

1

12,25

5

4

0

0,25

6

5

1

0,25

Σ40

Σ 36

12

42

Х1ср= 5

Х2ср= 4,5

;

таким образом

Для данного числа степеней свободы равного 7;7 и вероятно допустимой ошибки 0,05 показатель критерия F табличного значения равно 3.5.

Для числа степеней свободы равного 6;6 и вероятно допустимой ошибки 0,05 показатель критерия F табличного значения равен 4,28, для 8;8 - F= 3,44

Берем среднее табличное значение 3.5 (а так же учитываем все другие значения)

F крит ≤ F табл , а это значит что не существует статистически достоверной разницы между дисперсиями двух выборок. Значит наша гипотеза не подтвердилась.