Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Готфруа - Что такое психоллогия ТОМ-2.doc
Скачиваний:
2
Добавлен:
06.05.2019
Размер:
3.88 Mб
Скачать

I. Описательная статистика

1. Задачи описательной статистики - классификация данных, постро­ение распределения их частот, выявление центральных тенденций этого распределения и оценка разброса данных относительно средних.

2. Для классификации данных сначала располагают их в возрастаю­щем порядке. Далее их разбивают на классы по величине, интервалы между которыми определяются в зависимости от того, что именно иследователь хочет выявить в данном распределении.

3. К наиболее часто используемым параметрам, с помощью которых можно описать распределение, относятся, с одной стороны, такие величины, как мода, медиана и средняя арифметическая, а с другой -показатели разброса, такие как варианса (дисперсия) и стандартное отклонение.

4. Мода соответствует значению, которое встречается чаще других или находится в середине класса, обладающего наибольшей частотой.

Медиана соответствует значению центрального данного, которое может быть получено после того, как все данные будут расположены в возрастающем порядке.

Средняя арифметическая равна частному от деления суммы всех данных на их число.

Распределение считается нормальным, если кривая распределения имеет колоколообразный вид, а все показатели центральной тенденции совпадают, что свидетельствует о симметричности распределения.

5. Диапазон распределения (размах вариаций) равен разности между наибольшим и наименьшим значениями результатов.

6. Среднее отклонение-это более точный показатель разброса, чем диапазон распределения. Для расчета среднего отклонения вычисляют среднюю разность между всеми значениями данных и средней арифме-

Cinciiniu тики и обработки дачных 313

тической, или, упрощенно,

Среднее отклонение =

7. Еще один показатель разброса, вычисляемый из среднего откло­нения,-это варианса (дисперсия), равная среднему квадрату разностей между значениями всех данных и средней:

Yd2 Варианса = ——. п

8. Наиболее употребительным показателем разброса служит стан­дартное отклонение, равное квадратному корню из вариансы. Таким образом, это квадратный корень из суммы квадратов всех отклонений от средней:

Стандартное отклонение = или

п V п - 1

9. Важное свойство стандартного отклонения заключается в том. что независимо от его абсолютной величины в нормальном распределении оно всегда соответствует одинаковому проценту данных, располага­ющихся по обе стороны от средней: 68% результатов располагаются в пределах одного стандартного отклонения в обе стороны от средней, 95%-в пределах двух стандартных отклонений и 99,7%-в пределах трех стандартных отклонений.

10. С помощью перечисленных выше показателей можно осущест­вить оценку различий между двумя или несколькими распределениями, позволяющую проверить, насколько эти различия могут быть экстра­полированы на популяцию, из которой взяты выборки. Для этого применяют методы индуктивной статистики.

II. Индуктивная статистика

1. Задача индуктивной статистики заключается в том, чтобы оце-' нить значимость тех различий, которые могут быть между двумя распределениями, с целью выяснить, можно ли распространить найден­ную закономерность на всю популяцию, из которой были взяты выборки.

2. Для того чтобы определить, достоверны ли различия между распределениями, следует выдвинуть гипотезу, которую нужно будет затем проверить статистическими методами. Нулевой гипотезой на­зывают предположение, согласно которому различие между распре­делениями недостоверно, тогда как альтернативная гипотеза утверж­дает противоположное.

3. В том случае, если данных достаточно, если эти данные количест­венные и подчиняются нормальному распределению, для проверки гипотез используют параметрические критерии. Если же данных мало либо они

.44 Приложение Б

являются порядковыми или качественными (см.дополнение Б.1), исполь­зуют непараметрические критерии.

4. Из параметрических критериев наиболее эффективен и чаще всего используется критерий t Стьюдента. Этот критерий позволяет сравнить средние и стандартные отклонения для двух распределений. В случае если эти показатели принадлежат независимым выборкам, используют формулу

Х,-Х,

Для сопряженных выборок используют иную формулу:

^-^ .

lny--(W

5. Если необходимо сравнить три или большее число распределений. используют иной параметрический метод-дисперсионный анализ. При этом с помощью метода Шеффе можно выявить пары выборок, разли­чия между которыми достоверны либо недостоверны.

6. Критерий 72 (хи-квадрат)-это непараметрический критерий, по­зволяющий проверить, являются ли две переменные независимыми друг от друга. По этому методу сравнивают, как распределяются эмпири­ческие частоты в зависимости от критериев для каждой переменной, с тем, как они распределились бы теоретически, если бы переменные были независимыми. Далее с помощью таблицы, в которую сводятся все частоты, вычисляют критерий у/. Для этого сначала находят разницу между каждой эмпирической (Э) и соответствующей теоретической (Т) частотой, а затем сумму этих разностей:

, у(Э-Т)2

X— \ _____

t—i -у

7. Критерий знаков (биномиальный тест)-еще один непараметри­ческий метод, позволяющий легко определить, оказала ли независимая переменная существенное влияние по сравнению с исходным уровнем (ф:'ном). Для этого сначала подсчитывают число «ухудшений» (-) или число «улучшений» (+), а затем сравнивают одно из этих двух чисел с тем. что могло бы получиться в результате чистой случайности (1 шанс из 2, или п/2). Для этого применяют формулу

(X ± 0.5) - ,

Z

/" V 2

Статистики и обработка дачных 315

8. Существуют и другие непараметрические тесты, которые прихо­дится использовать для проверки гипотез тогда, когда нельзя применить параметрические критерии. К этим методам, в частности, относится критерий рангов, позволяющий определить, случайна или нет очеред­ность событий в той или иной последовательности, а также критерий U и критерий Т. Последние два критерия используют в случае поряд­ковых переменных соответственно для независимых и зависимых выборок.

9. Какой бы критерий ни использовался, его вычисленное значение следует сравнить с табличным для уровня значимости 0.05 с учетом числа степеней свободы. Если при этом вычисленный результат ока­жется выше, нулевая гипотеза может быть отвергнута и можно, следо­вательно, утверждать, что разница достоверна.