
- •«Математические методы в психологии»
- •Четыре типа измерительных шкал.
- •Порядковая (ранговая) шкала
- •Интервальная шкала
- •Шкала отношений (абсолютная шкала)
- •1) Правило порядка ранжирования
- •2) Правило связанных рангов.
- •Случайная выборка
- •1.2 Стратифицированная (расслоенная) выборка.
- •1.3 Групповая выборка (кластерная, гнездовая)
- •1.4 Простая выборка
- •1.5 Зависимые и независимые выборки
- •2) Однородность генеральной совокупности
- •3) Вероятность ошибки (уровень статистической значимости) p.
- •4) Предельная ошибка репрезентативности выборки («ошибка выборки»)
- •6) Совместное использование ошибки репрезентативности выборки и дисперсии признака
- •1) Мода;
- •2) Среднее арифметическое значение;
- •3) Медиана.
- •Чаще всего сырые баллы переводят в следующие шкалы: - стены,
- •- Процентили.
- •Соотношение нормального распределения и показателей различных стандартизированных шкал.
- •Параметрические и непараметрические показатели
- •1) Параметрические;
- •2) Непараметрические.
- •Задачи исследования и используемые для их решения методы
- •Соотношение р- уровня и статистической значимости
- •Этапы проверки статистических гипотез
- •Степени свободы
- •Сравнительная характеристика статистических критериев Возможности и ограничения параметрических и непараметрических критериев
- •Условия, когда применение непараметрических методов является оправданным:
- •1) Есть основания считать, что распределение значений признака в генеральной совокупности не соответствует нормальному закону;
- •2) Есть сомнения в нормальности распределения признака в генеральной совокупности, но выборка слишком мала, чтобы по выборочному распределению судить о распределении в генеральной совокупности;
- •Определение значимости корреляции
- •1) А связано с в;
- •2) А предшествует в (направление связи от а к в);
- •3) Отношения между а и в не связаны с их отношениями с с (в деле не
2) Однородность генеральной совокупности
Чем более однородна выборка, тем меньший объем выборки будет достаточным для исследования.
Выражаясь более формально, дисперсия исследуемого признака в однородной совокупности меньше, чем в неоднородной. В сущности, увеличение выборки приводит к уменьшению дисперсии (хотя связь между объемом выборки и дисперсией не является линейной).
Пример: возьмем 10 выборок директоров школ из генеральной совокупности директоров школ большого города для исследования их отношения к Единому государственному экзамену. Пусть отношение к ЕГЭ оценивалось по 5-балльной шкале.
Объем выборки |
Дисперсия |
25 |
0,87 |
50 |
0,80 |
75 |
0,73 |
100 |
0,69 |
125 |
0,61 |
150 |
0,55 |
175 |
0,49 |
200 |
0,46 |
225 |
0,47 |
250 |
0.46 |
На практике, однако, редко бывает так, что предыдущие исследования дают значение оптимального объема выборки на основе анализа дисперсии. Тем не менее, в отдельном эмпири-ческом исследовании анализ связи дисперсии и объема выборки может указать на недостаточность набранной выборки.
3) Вероятность ошибки (уровень статистической значимости) p.
Данный показатель говорит о степени нашей уверенности в полученном результате. Исторически сложилось так, что в психологии принято считать допустимой вероятность ошибиться в 5 случаях из 100 или меньше (<5%). Вероятность ошибки обозначают как р. Так что обычный низший уровень статистической значимости обозначается как р < 0,05. Кроме того, используются уровни р< 0,01 и р < 0,001.
Связь объема выборки с вероятностью ошибки хорошо видна из таблиц критических значений статистических критериев (t-Стьюдента, φ-Фишера, Колмогорова-Смирнова и др., которые имеются в любом учебнике по статистике). Можно заметить, что достижение одной и той же критической величины облегчается с увеличением числа случаев.
4) Предельная ошибка репрезентативности выборки («ошибка выборки»)
Эта статистическая величина (обозначается греческой буквой «дельта» - Δ) показывает долю отклонения показателя, полученного в выборочной совокупности, от показателя, который получили бы, сделав измерение на всей генеральной совокупности.
В принципе, можно заранее определить ту ошибку выборки, на какую согласны, и то, какова будет принимаемая ошибка, задаст нам примерный объем выборки, который потребуется. Так, можно согласиться с тем, чтобы наш показатель (полученный на реальной выборке) отличался от «истинного» (если бы мы могли его получить на генеральной совокупности) в пределах ±4%. Чем большую ошибку выборки мы заранее принимаем, тем меньше может быть выборка. Обычно в социальных исследованиях допускается Δ от 1 до 10%.
Существуют специальные таблицы, где желательный объем выборки уже высчитан для той или иной предельной ошибки репрезентативности (табл. 3).
Величи на ошибки выборки в зависимости от ее объема
Объем выборки, если генеральная совокупность >= 5000 |
25 |
45 |
100 |
123 |
156 |
204 |
400 |
625 |
Ошибка выборки при данном объеме, (%) |
20 |
15 |
10 |
9 |
8 |
7 |
5 |
4 |
Данные этой таблицы говорят о том, что если, к примеру, берется выборка учителей школ города численностью 25 человек и измеряется их средний уровень конформности по соответствующему тесту, то показатель будет иметь погрешность ±20% по отношению к конформности в генеральной совокупности. Очевидно, что с увеличением объема выборки предельная ошибка репрезентативности уменьшается.
Совместное использование вероятности ошибки и предельной ошибки репрезентативности выборки
Как ни запутанно это может звучать, но существует понятие «вероятности ошибки в ошибке выборки». Это означает, что можно ошибиться в допускаемой погрешности. На самом деле всегда есть риск ошибиться в прогнозе события, даже если этим событием является ошибка. Рассмотрим следующий пример, который покажет, как связаны эти два понятия: принимаемая погрешность и вероятность ошибиться в ней. Допустим, в предстоящую сессию вам – достаточно усердному студенту (студентке) – надо сдать шесть экзаменов. Предположим, что вы делаете два различных прогноза относительно своей успешности:
1) 6 экзаменов будут сданы на одни 5;
2) 6 экзаменов будут сданы на 4 и 5.
В первом случае не допускается никакой погрешности («только пятерки»), а во втором случае допускается погрешность в 0,5 балла («среднее между пятеркой и четверкой»). Как вы считаете, какой прогноз более рискованный? Очевидно, первый, и именно потому, что он точнее. Так что чем точнее прогноз, тем больше риск, что будет допущена ошибка.
Причем в одном случае есть возможность пересдать, а в другом случае – нет. Количество возможностей для пересдачи – это объем выборки. Допускаемая погрешность – это предельная ошибка выборки. Уверенность в своем прогнозе – это вероятность ошибки. Посмотрим как меняются значения этих показателей относительно друг друга (табл. 4).
Иллюстрация связи объема выборки, ошибки выборки и степени уверенности
Прогноз |
Степень уверенности, % |
||
90 |
95 |
99 |
|
Только 5 |
3 попытки |
4 попытки |
5 попыток |
5 и 4 |
2 попытки |
3 попытки |
4 попытки |
5, 4 и 3 |
1 попытка |
2 попытки |
3 попытки |