- •11. Анализ парных наблюдений в политологии: постановка задачи, применение критерия знаков. (Бочарова а)
- •12. «Задача о двух выборках»: постановка задачи. Критерий Стьюдента: алгоритм решения, ограничения метода. Пример использования в политологии.(Бочарова а)
- •X (демократии): 3, 6, 2, 11, 7, 5, 15.
- •13. Коэффициент корреляции Пирсона: содержательный смысл, формула расчета. Проблема устойчивости. Примеры применения в политологии (прошлый год)
- •Общие положения
- •Алгоритм действий
- •Vs h1: модель лучше константы.
- •Vs h1: β1 мнк с крышкой ≠ 0.
X (демократии): 3, 6, 2, 11, 7, 5, 15.
Y (автократии): 1, 3, 7, 2, 10, 1, 3.
При этом X~N (a1;ς12)
Y~ N (a2;ς22).
Вопрос, можно ли считать, что средние значения равны, т.е. равны ли мат. ожидания EX и EY.
1. Формулируем нулевую гипотезу и ее альтернативу. H0: EX = EY VS H1: EX≠EY. |
2. Определяем уровень значимости. Пусть альфа = 0,05. |
3,4. Вводим статистику критерия и определяем распределение статистики при H0. t = (хср. – уср.) / [S * (1/n + 1/k)^0,5] ~ H0 t (n+k-2). Для случая с одинаковыми дисперсиями. Где n – объем выборки X, k – объем выборки Y, S – обобщенная по двум выборкам оценка среднеквадратичного отклонения. S = (S2)^0,5, Где S2 = (Sx2(n-1) + Sy2(k-1)) / (n+k-2), Где Sx = (1/(n-1)) * ∑ (xi – xср.)2, Sy = (1/(k-1)) * ∑ (yi – yср.)2 |
5. Определяем доверительную зону (зону высоковероятных значений). Определяем по таблице Стьюдента. |
6. Рассчитываем наблюденное значение статистики. В данном случае… |
7. Критерий Стьюдента: отвергать H0 в пользу H1 на уровне значимости альфа, если наблюденное значение статистики критерия не попало в доверительную зону. |
Где выше уровень неравенства? Где среднее значение больше.
Использование параметрических методов осложнено по нескольким причинам:
Если мало данных, то нормальность вряд ли есть.
Такие статистические методы, как t-критерий, регрессия и т. д. предполагают, что исходные данные непрерывны. Однако имеются ситуации, когда данные, скорее, просто ранжированы (измерены в порядковой шкале), чем измерены точно.
Непараметрический метод.
Критерий Франка Уилкоксона (1945 г., исторически один из первых, основанных на рангах).
Допущения:
Выборки независимы между собой.
Законы распределения F и G непрерывны.
H0: F=G (однородность выборок).
H1: F≠G (неоднородность выборок).
Пример:
Проводится социологический опрос: отношение к политическим лидерам. Респонденты выставляют оценки политикам (от 1 до 5). [Порядковая шкала].
Вопрос: одинаково ли мужчины и женщины относятся к В.В. Жириновскому?
Две выборки: девушки и парни.
Девушки |
Юноши |
3 1 2 5 2 4 5 1 4 |
3 5 2 5 3 4 1 3 3 |
H0: F=G H1: F≠G |
2. Определяем уровень значимости. Пусть альфа = 0,05 (вероятность ошибки первого рода – отвергнуть верную гипотезу). |
W = сумма рангов одной из выборок в объединенном вариационном ряду. |
4. Определяем распределение статистики при нулевой гипотезе. W – это дискретная статистика. Если большая выборка (достаточно большая), аппроксируем к нормальному. Проводим стандартизацию: W* = [(W – EW) / (DW)^0,5] ~ N (0;1) |
5. Определяем доверительную зону (зону высоковероятных значений). (-1,96; 1,96) |
6. Рассчитываем наблюденное значение статистики. В данном случае: Ранжируем все имеющиеся наблюдения двух выборок. 1 1 1 2 2 2 3 3 3 3 3 4 4 4 5 5 5 5 R1 = 2 R2 = 5 R3 = 9 R4 = 13 R5 = 16,5 Считаем сумму рангов одной выборки. W (девушки) = 9+2+5+16,5+5+13+16,5+2+13 = 82 W* = (W – EW) / (DW)0,5 EW = n(n+m+1) /2 DW = nm(n+m+1) / 12 EW = 85,5 DW = 128,25 W* = – 0,027 |
7. Принимаем решение. Критерий Ц (правило проверки статистических гипотез): отвергать H0 в пользу H1 на уровне значимости 0,05, если наблюденное значение статистики критерия Ц* не попало в доверительную зону. В данном случае значение не превысило критическое значение по модулю, следовательно, нет оснований отвергнуть гипотезу H0. |
Кто лучше относится? Чей ранг выше.
У кого больше уровень неравенства, у кого больше средний ранг.