Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика вопросы 22-30.docx
Скачиваний:
1
Добавлен:
13.09.2019
Размер:
152.44 Кб
Скачать

X (демократии): 3, 6, 2, 11, 7, 5, 15.

Y (автократии): 1, 3, 7, 2, 10, 1, 3.

При этом X~N (a112)

Y~ N (a222).

Вопрос, можно ли считать, что средние значения равны, т.е. равны ли мат. ожидания EX и EY.

1. Формулируем нулевую гипотезу и ее альтернативу.

H0: EX = EY

VS H1: EX≠EY.

2. Определяем уровень значимости. Пусть альфа = 0,05.

3,4. Вводим статистику критерия и определяем распределение статистики при H0.

t = (хср. – уср.) / [S * (1/n + 1/k)^0,5] ~ H0 t (n+k-2). Для случая с одинаковыми дисперсиями.

Где n – объем выборки X, k – объем выборки Y,

S – обобщенная по двум выборкам оценка среднеквадратичного отклонения.

S = (S2)^0,5,

Где S2 = (Sx2(n-1) + Sy2(k-1)) / (n+k-2),

Где Sx = (1/(n-1)) * ∑ (xi – xср.)2,

Sy = (1/(k-1)) * ∑ (yi – yср.)2

5. Определяем доверительную зону (зону высоковероятных значений).

Определяем по таблице Стьюдента.

6. Рассчитываем наблюденное значение статистики.

В данном случае…

7. Критерий Стьюдента: отвергать H0 в пользу H1 на уровне значимости альфа, если наблюденное значение статистики критерия не попало в доверительную зону.

Где выше уровень неравенства? Где среднее значение больше.

Использование параметрических методов осложнено по нескольким причинам:

  1. Если мало данных, то нормальность вряд ли есть.

  2. Такие статистические методы, как t-критерий, регрессия и т. д. предполагают, что исходные данные непрерывны. Однако имеются ситуации, когда данные, скорее, просто ранжированы (измерены в порядковой шкале), чем измерены точно.

Непараметрический метод.

Критерий Франка Уилкоксона (1945 г., исторически один из первых, основанных на рангах).

Допущения:

  1. Выборки независимы между собой.

  2. Законы распределения F и G непрерывны.

H0: F=G (однородность выборок).

H1: F≠G (неоднородность выборок).

Пример:

Проводится социологический опрос: отношение к политическим лидерам. Респонденты выставляют оценки политикам (от 1 до 5). [Порядковая шкала].

Вопрос: одинаково ли мужчины и женщины относятся к В.В. Жириновскому?

Две выборки: девушки и парни.

Девушки

Юноши

3

1

2

5

2

4

5

1

4

3

5

2

5

3

4

1

3

3

  1. Формулируем нулевую гипотезу и ее альтернативу.

H0: F=G

H1: F≠G

2. Определяем уровень значимости. Пусть альфа = 0,05 (вероятность ошибки первого рода – отвергнуть верную гипотезу).

  1. Вводим статистику критерия:

W = сумма рангов одной из выборок в объединенном вариационном ряду.

4. Определяем распределение статистики при нулевой гипотезе.

W – это дискретная статистика. Если большая выборка (достаточно большая), аппроксируем к нормальному.

Проводим стандартизацию:

W* = [(W – EW) / (DW)^0,5] ~ N (0;1)

5. Определяем доверительную зону (зону высоковероятных значений).

(-1,96; 1,96)

6. Рассчитываем наблюденное значение статистики.

В данном случае:

Ранжируем все имеющиеся наблюдения двух выборок.

1 1 1 2 2 2 3 3 3 3 3 4 4 4 5 5 5 5

R1 = 2

R2 = 5

R3 = 9

R4 = 13

R5 = 16,5

Считаем сумму рангов одной выборки.

W (девушки) = 9+2+5+16,5+5+13+16,5+2+13 = 82

W* = (W – EW) / (DW)0,5

EW = n(n+m+1) /2

DW = nm(n+m+1) / 12

EW = 85,5

DW = 128,25

W* = – 0,027

7. Принимаем решение.

Критерий Ц (правило проверки статистических гипотез): отвергать H0 в пользу H1 на уровне значимости 0,05, если наблюденное значение статистики критерия Ц* не попало в доверительную зону.

В данном случае значение не превысило критическое значение по модулю, следовательно, нет оснований отвергнуть гипотезу H0.

Кто лучше относится? Чей ранг выше.

У кого больше уровень неравенства, у кого больше средний ранг.