- •Параметрические и непараметрические процедуры статистического анализа данных. Проверка на нормальность.
- •Уровни статистической значимости, ось значимости, особенности нахождения критических значений различных критериев.
- •Критерий Вилкоксона (общая характеристика, графическая интерпретация, ограничения, примеры использования).
- •Алгоритм 9 Подсчет критерия Вилкоксона
- •5. Критерий Розенбаума (общая характеристика, графическая интерпретация, ограничения, примеры использования).
- •Алгоритм 1 Подсчет критерия q Розенбаума
- •Критерий Фридмана (общая характеристика, ограничения, примеры использования).
- •Алгоритм 10 Подсчет критерия χ2r Фридмана
- •Критерий Манна-Уитни (общая характеристика, представление о ранжировании числовых данных, ограничения, примеры использования).
- •Правила ранжирования
- •Алгоритм 4 Подсчет критерия u Манна-Уитни.
- •Критерий Мак-Немара (общая характеристика, ограничения, примеры использования).
- •9. Критерий Крускала-Уоллиса (общая характеристика, ограничения, примеры использования).
- •Алгоритм 5 Подсчет критерия н Крускала-Уоллиса
- •10.Критерий тенденций Пейджа (общая характеристика, ограничения, примеры использования).
- •Алгоритм 11 Подсчет критерия тенденций l Пейджа
- •Критерий тенденций Джонкира (общая характеристика, графическое представление, ограничения, примеры использования).
- •Алгоритм 6 Подсчет критерия s Джонкира
- •Показатели различий в распределениях признака. Критерии согласия (общая характеристика, алгоритм выбора критериев согласия). Выявление различий в распределении признака
- •14.Критерий Пирсона и особенности его использования при сравнении теоретического и эмпирического распределение и 2 эмпирических.
- •Шутливый пример
- •Алгоритм 13 Расчет критерия χ2
- •15. Критерий Колмогорова-Смирнова и особенности его использования при сравнении теоретического и эмпирического распределение.
- •16. Критерий Колмогорова-Смирнова и особенности его использования при сопоставлении двух эмпирических распределений.
- •Алгоритм 14
- •Алгоритм 15
- •17. Критерии сдвига и особенности их применений в психологических исследованиях. Классификация сдвигов. Алгоритм выбора критерия сдвига.
- •1) Шкала "я сам наказываю"
- •2) Шкала "Бабушка наказывает"
- •3) Шкала "Воспитательница наказывает"
- •18. Критерии различий и особенности их применения в психологических исследованиях. Алгоритм выбора критерия различий.
Параметрические и непараметрические процедуры статистического анализа данных. Проверка на нормальность.
Параметрические методы основаны на некоторых, как правило, вполне вероятных предположениях о характере распределения случайной величины. Обычно параметрические методы, используемые в анализе экспериментальных данных, основаны на предположении нормальности распределения этих данных. Следствием такого предположения является необходимость оценки исследуемых параметров распределения. Так, в случае рассматриваемого далее t-теста Стьюдента такими оцениваемыми параметрами являются математическое ожидание и дисперсия. В ряде случаев делаются дополнительные предположения по поводу того, как параметры, характеризующие распределение случайной величины в разных выборках, соотносятся между собой. Так, в тесте Стьюдента, который часто используют для сравнения средних значений (математического ожидания) двух рядов данных на предмет их однородности или неоднородности, дополнительно делается предположение об однородности дисперсий распределения случайных величин в двух генеральных совокупностях, из которых эти данные были извлечены.
Достоинством методов параметрического анализа данных является тот факт, что они обладают достаточно высокой мощностью.
Под мощностью теста имеют в виду его способность избегать ошибки второго рода, или β-ошибки. Чем меньше оказывается β-ошибка, тем выше мощность теста. Иными словами, мощность теста = 1 – β.
Высокая мощность параметрических тестов, или критериев, обусловлена тем, что данные методы требуют, чтобы имеющиеся данные были описаны в метрической шкале. Как известно, к метрическим шкалам относят интервальную шкалу и шкалу отношений, которую иногда еще называют абсолютной шкалой. Интервальная шкала позволяет исследователю выяснить не только отношения равенства или неравенства элементов выборки (как это позволяет сделать шкала наименований) и не только отношения порядка (как это позволяет сделать шкала порядка), но также и оценивать эквивалентность интервалов. Абсолютная шкала вдобавок к этому позволяет оценивать эквивалентность отношений между элементами множества, полученными в ходе измерения. Именно поэтому метрические шкалы относят к сильным измерительным шкалам. Благодаря этой силе параметрические методы позволяют более точно выразить различия в распределении случайной величины при условии истинности пулевых или альтернативных гипотез.
Следует также отметить, что в целом параметрические методы статистики более разработаны в теории математической статистики и поэтому применяются значительно шире. Практически любой экспериментальный результат может быть оценен с помощью какого-либо из этих методов. Именно такие методы и рассматриваются преимущественно в учебниках и руководствах по статистическому анализу данных.
В то же время трудности, связанные с использованием методов параметрического анализа в статистике, состоят в том, что в ряде случаев априорные предположения о характере распределения исследуемых случайных величин могут оказаться неверными. И эти случаи весьма характерны именно для психологических исследований в тех или иных ситуациях.
Так, если сравнивать две выборки с помощью t-теста Стьюдента, можно обнаружить, что распределение наших данных отличается от нормального, а дисперсии в двух выборках значительно разнятся. В этом случае использование параметрического теста Стьюдента может до некоторой степени исказить выводы, которые хочет сделать исследователь. Такая опасность увеличивается, если значения вычисленной статистики оказываются близкими к граничным значениям квантилей, которые используются для принятия или отвержения гипотез. В большинстве случаев, однако, как, например, в случае использования t-теста, некоторые отклонения от теоретически заданных предположений оказываются некритичными для надежного статистического вывода. В других случаях такие отклонения могут создавать серьезную угрозу такому выводу. Тогда исследователи могут разрабатывать специальные процедуры, которые могут скорректировать процедуру принятия решения по поводу истинности статистических гипотез. Назначение этих процедур состоит в том, чтобы обойти или смягчить слишком жесткие требования параметрических моделей используемой статистики.
Один из вариантов таких действий исследователя, когда он обнаруживает, что полученные им данные по своим параметрам отличаются от того, что задано в структурной модели используемого параметрического теста, может состоять в том, чтобы попытаться преобразовать эти данные к нужному виду. Например, как отмечалось в гл. 1, измеряя время реакции, можно избежать высокого значения асимметрии его распределения, если использовать для анализа логарифмы получаемых значений, а не сами значения времени реакции.
Другой вариант действий состоит в отказе от использования каких-либо априорно заданных предположений о характере распределения случайной величины в генеральной совокупности. А это означает отказ от параметрических методов математической статистики в пользу непараметрических.
Непараметрическими называют методы математической статистики, при которых не выдвигаются какие-либо априорные предположения о характере распределения исследуемых данных и не предполагается каких-либо допущений о соотношении параметров распределения анализируемых величин. В этом заключается главное достоинство этих методов.
В полной мере преимущество непараметрической статистики раскрывается тогда, когда результаты, полученные в эксперименте, оказываются представленными в более слабой неметрической шкале, представляя собой результаты ранжирования. Такая шкала называется шкалой порядка. Конечно, в ряде случаев исследователь может преобразовать эти данные к более сильной интервальной шкале, используя процедуры нормализации данных, но, как правило, оптимальным вариантом в этой ситуации является применение именно непараметрических тестов, специально созданных для статистического анализа.
Как правило, тесты непараметрической статистики предполагают оценивание имеющихся соотношений ранговых сумм в двух или более выборках, и на основании этого формулируется вывод о соотношении этих выборок. Примерами таких тестов являются критерий знаков, критерий знаковых рангов Уилкоксона, а также U-критерий Манна – Уитни, которые используются в качестве аналога параметрического t-теста Стьюдента.
В то же время, если результаты измерения оказываются представленными в более сильной шкале, использование непараметрической статистики означает отказ от части информации, содержащейся в данных. Следствием этого является опасность возрастания ошибки второго рода, свойственной этим методам.
Таким образом, методы непараметрической статистики оказываются более консервативными по сравнению с методами параметрической статистики. Их использование грозит в большей мере ошибкой второго рода, т.е. ситуацией, когда исследователь, например, не может обнаружить отличия двух выборок, когда такие отличия на самом деле имеют место. Иными словами, такие методы оказываются менее мощными по сравнению с параметрическими методами. Поэтому использование параметрической статистики в анализе экспериментальных данных, отличающихся от простого ранжирования, как правило, является предпочтительным.
(проверка на нормальность в тетради).
