
- •Основные понятия, используемые в математической обработке психологических данных Признаки и переменные
- •Шкалы измерения
- •Математическая статистика. Первоначальные понятия математической статистики
- •Измерение значений психологических признаков
- •Разные виды случайных выборок
- •Статистическое распределение выборки.
- •Типы выборки
- •Эмпирическая функция распределения.
- •Гистограмма
- •Статистические оценки параметров распределения.
- •Групповая и общая средние
- •Групповая, внутри групповая, межгрупповая и общая дисперсии
- •Интервальные оценки.
- •Доверительные интервалы для оценки среднеквадратического отклонения нормального распределения
- •Характеристики вариационного ряда
- •Обычные, начальные и центральные эмпирические моменты
- •Эмпирические и выравнивающие (теоретические) частоты
- •Асимметрия и эксцесс
- •Метод моментов.
- •Метод наибольшего правдоподобия.
- •Элементы теории линейной корреляции.
- •Статистическая проверка гипотез о виде и о параметрах распределений.
- •Статистический критерий проверки нулевой гипотезы
- •Критерий Пирсона проверки гипотезы о нормальном распределении генеральной совокупности
- •Сравнение двух дисперсий нормальных генеральных совокупностей
- •Сравнение исправленной выборочной дисперсии с гипотетической генеральной дисперсией нормальной совокупности
- •Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
- •Сравнение двух средних произвольно распределенных генеральных совокупностей (большие независимые выборки)
- •Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки)
- •Сравнение выборочной средней с гипотетической генеральной средней нормальной совокупности
- •Связь между двусторонней критической областью и доверительным интервалом
- •Определение минимального объема выборки при сравнении выборочной и гипотетической генеральной средних
- •Сравнение двух средних нормальных генеральных совокупностей с неизвестными дисперсиями (зависимые выборки)
- •Сравнение наблюдаемой относительной частоты с гипотетической вероятностью появления события
- •Сравнение двух вероятностей биномиальных распределений
- •Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам различного объема. Критерий Бартлетта
- •Сравнение нескольких дисперсий нормальных генеральных совокупностей по выборкам одинакового объема. Критерий Кочрена
- •Проверка гипотезы о значимости выборочного коэффициента корреляции
- •Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости
- •Выборочный коэффициент ранговой корреляции Кендалла и проверка гипотезы о его значимости
- •Критерий Вилкоксона и проверка гипотезы об однородности двух выборок
- •Однофакторный дисперсионный анализ Сравнение нескольких средних. Понятие о дисперсионном анализе
- •Общая факторная и остаточная суммы квадратов отклонений
- •Общая, факторная и остаточная дисперсии
- •Сравнение нескольких средних методом дисперсионного анализа
- •Критические точки распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения f Фишера — Снедекора
- •Критические точки распределения Кочрена
- •Критические точки распределения Кочрена (продолжение)
- •Критические точки критерия Вилкоксона
- •Критические точки критерия Вилкоксона (продолжение)
- •Критические точки критерия Вилкоксона (продолжение)
Проверка гипотезы о значимости выборочного коэффициента корреляции
Пусть двумерная генеральная совокупность
распределена нормально. Из этой
совокупности извлечена выборка объема
и по ней найден выборочный коэффициент
корреляции
,
который оказался отличным от нуля. Так
как выборка отобрана случайно, то еще
нельзя заключить, что коэффициент
корреляции генеральной совокупности
также отличен от нуля. В конечном счете
нас интересует именно этот коэффициент,
поэтому возникает необходимость при
заданном уровне значимости
проверить нулевую гипотезу
о равенстве нулю генерального коэффициента
корреляции при конкурирующей гипотезе
.
Если нулевая гипотеза отвергается, то это означает, что выборочный коэффициент корреляции значимо отличается от нуля (кратко говоря, значим), а X и Y коррелированны, т. е. связаны линейной зависимостью.
Если нулевая гипотеза будет принята, то выборочный коэффициент корреляции незначим, а X и Y некоррелированны, т. е. не связаны линейной зависимостью.
В качестве критерия проверки нулевой гипотезы примем случайную величину
.
Величина
при справедливости нулевой гипотезы
имеет распределение Стьюдента с
степенями свободы. Поскольку конкурирующая
гипотеза имеет вид
критическая область – двусторонняя.
Обозначим значение критерия, вычисленное
по данным наблюдений, через
и сформулируем правил проверки нулевой
гипотезы.
Правило. Для того чтобы при заданном
уровне значимости
проверить нулевую гипотезу
о равенстве нулю генерального коэффициента
корреляции нормальной двумерной
случайной величины при конкурирующей
гипотезе
,
надо вычислить наблюдаемое значение
критерия:
и по таблице критических точек
распределения Стьюдента по заданному
уровню значимости и числу степеней
свободы
найти критическую точку
для двусторонней критической области.
Если
– нет оснований отвергнуть нулевую
гипотезу.
Если
– нулевую гипотезу отвергают.
Выборочный коэффициент ранговой корреляции Спирмена и проверка гипотезы о его значимости
Допустим, что объекты генеральной совокупности обладают двумя качественными признаками. Под качественным подразумевается признак, который невозможно измерить точно, но он позволяет сравнивать объекты между собой и, следовательно, расположить их в порядке убывания или возрастания качества. Для определенности будем всегда располагать объекты в порядке ухудшения качества. При таком “ранжировании” на первом месте находится объект наилучшего качества по сравнению с остальными; на втором месте окажется объект “хуже” первого, но “лучше” других, и т. д.
Пусть выборка объема
содержит независимые объекты, которые
обладают двумя качественными признаками
и
.
Для оценки степени связи признаков
вводят, в частности, коэффициенты
ранговой корреляции Спирмена и Кендалла.
Для практических целей использование ранговой корреляции весьма полезно. Например, если установлена высокая ранговая корреляция между двумя качественными признаками, то достаточно контролировать только один из признаков.
Расположим сначала объекты выборки в
порядке ухудшения качества по признаку
при допущении, что все объекты имеют
различное качество по обоим признакам
(случай, когда это допущение не выполняется,
рассмотрим ниже). Припишем объекту,
стоящему на
-м
месте, число – ранг
равный порядковому номеру объекта.
Например, ранг объекта, занимающего
первое место,
;
объект, расположенный на втором месте,
имеет ранг
,
и т. д. В итоге получим последовательность
рангов по признаку
.
Расположим теперь объекты в порядке
убывания качества по признаку
и припишем каждому из них ранг
,
однако (для удобства сравнения рангов)
индекс
при
будет по-прежнему равен порядковому
номеру объекта по признаку
.
Например, запись
означает, что по признаку
объект стоит на втором месте, а по
признаку
на пятом.
В итоге получим две последовательности рангов:
по признаку
,
по признаку
.
Заметим, что в первой строке индекс совпадает с порядковым номером объекта, а во второй, вообще говоря, не совпадает. Итак, в общем случае .
Рассмотрим два “крайних случая”.
1. Пусть ранги по признакам
и
совпадают при всех значениях индекса
.
В этом случае ухудшение качества по
одному признаку влечет ухудшение
качества по другому. Очевидно, признаки
связаны: имеет место “полная прямая
зависимость”.
2. Пусть ранги по признакам
и
противоположны в том смысле, что если
,
то
;
если
,
то
;
…., если
,
то
.
В этом случае ухудшение качества по
одному признаку влечет улучшение по
другому. Очевидно, признаки связаны –
имеет место “противоположная зависимость”.
На практике чаще будет встречаться
промежуточный случай, когда ухудшение
качества по одному признаку влечет для
некоторых объектов ухудшение, а для
других – улучшение качества. Задача
состоит в том, чтобы оценить связь между
признаками. Для ее решения рассмотрим
ранги
как возможные значения случайной
величины X, а
– как возможные значения случайной
величины Y. Таким образом, о связи
между качественными признаками
и
можно судить по связи между случайными
величинами X и Y,
для оценки которой используем коэффициент
корреляции. Вычислим выборочный
коэффициент корреляции случайных
величин X и Y
в условных вариантах, учитывая, что
каждому рангу
,
соответствует только один ранг
:
приняв
в качестве условных вариант отклонения
,
.
Учитывая, кроме того, что среднее значение
отклонения равно нулю т.е.
,
получим более простую формулу вычисления
выборочного коэффициента корреляции:
.
Выразим
через известные числа – объем выборки
и разности рангов
.
Поскольку средние значения рангов
равны между собой, то
и следовательно
.
Несложный подсчет суммы квадратов дает
.
Отсюда
.
Таким образом
.
Учитывая, что
,
получим:
.
Аналогично
.
Следовательно
.
Подставив, найденные выражения в формулу для вычисления коэффициента корреляции получим выборочный коэффициент ранговой корреляции Спирмена
.
Приведем свойства выборочного коэффициента корреляции Спирмена.
Свойство 1. Если между качественными признаками A и B имеется “полная прямая зависимость” в том смысле, что ранги объектов совпадают при всех значениях , то выборочный коэффициент ранговой корреляции Спирмена равен единице.
Свойство 2. Если между качественными признаками A и B имеется “противоположная зависимость”, то выборочный коэффициент ранговой корреляции Спирмена равен минус единице.
Свойство 3. Если между качественными
признаками A и B
нет ни “полной прямой”, ни “противоположной”
зависимостей, то коэффициент корреляции
Спирмена заключен между
и
,
причем чем ближе к нулю его абсолютная
величина, тем зависимость меньше.
Замечание. Если выборка содержит объекты
с одинаковым качеством, то каждому из
них приписывается ранг, равный среднему
арифметическому порядковых номеров
объектов. Например, если объекты
одинакового качества по признаку A
имеют порядковые номера 5 и 6, то их ранги
соответственно равны:
.
Приведем правило, позволяющее установить значимость или незначимость ранговой корреляции связи.
Правило. Для того чтобы при уровне
значимости проверить
нулевую гипотезу
о равенстве нулю генерального коэффициента
ранговой корреляции Спирмена при
конкурирующей гипотезе
,
надо вычислить критическую точку:
,
где
– объем выборки,
– выборочный коэффициент ранговой
корреляции Спирмена,
– критическая точка двусторонней
критической области, которую находят
по таблице критических точек распределения
Стьюдента, по уровню значимости
и числу степеней свободы
.
Если
– нет оснований отвергнуть нулевую
гипотезу. Ранговая корреляционная связь
между качественными признаками незначима.
Если
– нулевую гипотезу отвергают. Между
качественными признаками существует
значимая ранговая корреляционная связь.