Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Дьячков.doc
Скачиваний:
16
Добавлен:
21.09.2019
Размер:
618.5 Кб
Скачать

В. В. СЕЧКО

Математические методы обработки психологических данных

Минск 2002

ОГЛАВЛЕНИЕ

1. ВВЕДЕНИЕ 4

2. ОСНОВНЫЕ ЭТАПЫ СТАТИСТИЧЕСКОГО АНАЛИЗА ДАННЫХ 5

3. ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА ИЗ НЕЕ. РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ 6

4. ОСНОВНЫЕ СПОСОБЫ ОРГАНИЗАЦИИ ВЫБОРКИ 6

5. ШКАЛЫ ИЗМЕРЕНИЙ 7

6. ТАБУЛИРОВАНИЕ ДАННЫХ 9

7. КВАНТИЛЬ 11

8. ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ 13

9. МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ 16

10. МЕРЫ ИЗМЕНЧИВОСТИ 21

11. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ 25

12. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ВЫБОРКИ 28

13. СТАТИСТИЧЕСКИЙ ВЫВОД. ПРОВЕРКА ГИПОТЕЗ 32

14. ОБЩАЯ СХЕМА ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ 32

15. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК 33

16. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ ДВУХ ЗАВИСИМЫХ (СВЯЗАННЫХ) ВЫБОРОК 36

17. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ РАНЖИРОВАННЫХ ПРИЗНАКОВ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК 38

n=14 m=12 40

18. СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ РАНЖИРОВАННЫХ ПРИЗНАКОВ ДВУХ СВЯЗАННЫХ ВЫБОРОК 40

Н1 42

19. СРАВНЕНИЕ ДИСПЕРСИЙ ДВУХ НЕЗАВИСИМЫХ ВЫБОРОК 42

20. СРАВНЕНИЕ ДИСПЕРСИЙ ДВУХ ЗАВИСИМЫХ (СВЯЗАННЫХ) ВЫБОРОК 43

Если мы хотим сравнить два исследуемых показателя (или один и тот же, но для двух различных групп лиц по их уровню), то необходимо проверять гипотезу о равенстве средних значений. Если хотим сравнить изменчивость (разброс показателя), то необходимо проверять гипотезу о равенстве дисперсий. 45

21. АНАЛИЗ ВЗАИМОСВЯЗЕЙ КОЛИЧЕСТВЕННЫХ ПРИЗНАКОВ. КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ ПИРСОНА 45

Исследователя часто интересует, как связаны между собой два изучаемых признака в данной группе лиц. Например: имеют ли ученики, 45

научившиеся читать раньше других, тенденцию к более высокой успеваемости? Связь между двумя признаками можно изобразить графически с помощью диаграммы рассеивания (рассеяния). Для ее построения на координатной плоскости каждый объект изображается точкой. Первая координата, которая соответствует значению первого признака для данного объекта, а вторая – значению второго признака для данного объекта. Для оценки связи между двумя признаками можно использовать ковариацию, которая обозначается Sxy и вычисляется по формуле: 45

i=1 45

45

Если рассматривать ковариацию какого-либо признака с самим собой Sxx, то в этом случае мы получаем дисперсию 45

22. ЗНАЧИМОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ 47

23. АНАЛИЗ ВЗАИМОСВЯЗИ РАНЖИРОВАННЫХ ПРИЗНАКОВ 49

24. КОЭФФИЦИЕНТ РАНГОВОЙ КОРРЕЛЯЦИИ КЕНДАЛЛА 53

25. АНАЛИЗ ВЗАИМОСВЯЗИ НОМИНАЛЬНЫХ ПРИЗНАКОВ С ПОМОЩЬЮ КОРРЕЛЯЦИОННОГО АНАЛИЗА 57

26. БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ (БКК) 58

27. РАНГОВЫЙ БИСЕРИАЛЬНЫЙ КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ 59

28. АНАЛИЗ ВЗАИМОСВЯЗЕЙ НОМИНАЛЬНЫХ ПРИЗНАКОВ С ПОМОЩЬЮ ТАБЛИЦ СОПРЯЖЕННОСТИ 60

29. ОДНОФАКТОРНЫЙ АНАЛИЗ (ОФА) 62

30. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (ОДА) 64

31. ДВУХФАКТОРНЫЙ АНАЛИЗ 66

32. ДВУХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ (ДДА) 67

33. ПРОВЕРКА НОРМАЛЬНОСТИ РАСПРЕДЕЛЕНИЯ ИСХОДНЫХ ДАННЫХ 69

Литература 77

1. Введение

Математическую статистику условно делят на 3 части:

-описательная статистика;

-теория статистического вывода;

-планирование и анализ эксперимента.

Описательная статистика занимается описанием, графическим представлением и табулированием совокупности исходных данных.

Теория статистического вывода – общий класс задач, характеризующийся попытками вывести свойства большого массива данных путем обследования небольшого массива данных, т.е. выборки.

Планирование и анализ эксперимента – статистические методы, разработанные для обнаружения и проверки причинной связи между изучаемыми переменными (показателями).

2. Основные этапы статистического анализа данных

1 этап – исходный предварительный анализ исследуемой реальной системы. В результате этого этапа определяются:

- основные цели исследования на содержательном неформализованном уровне;

- совокупность единиц, представляющих предмет статистического исследования;

- перечень отобранных из представленных специалистами априорных (независимых от опыта человека) показателей, характеризующих каждого из исследуемых объектов;

- степень формализации соответствующих записей при сборе исходных данных;

- общее время и трудозатраты на планируемые работы.

- формализованная постановка задачи, по возможности включающая статистическую модель изучаемого явления.

2 этап – составление детального плана сбора исходной информации. При составлении этого плана необходимо по возможности учитывать полную схему дальнейшего статистического анализа.

3 этап – сбор исходного материала и ввод этих данных в ЭВМ.

4 этап – первичная статистическая обработка данных. В ходе этой обработки решаются следующие задачи:

1..Отображение переменных, описанных текстом в номинальную или порядковую шкалу.

  1. Анализ резко выделяющихся наблюдений.

  2. Восстановление пропущенных наблюдений.

  3. Проверка статистической независимости элементов исходной выборки.

5 этап – составление детального плана вычислительного анализа исходного материала. На этом этапе определяются основные группы, для которых будет проводиться дальнейший анализ. Обычно описывается блок-схема анализа с указанием привлекаемого метода.

6 этап – вычислительная реализация основной части статистической обработки данных.

7 этап – подведение итогов исследования. На этом этапе проверяется, в какой мере достигнуты сформулированные на 1 этапе содержательные цели работы. Если эти цели не достигнуты, то объясняется, почему. Работа завершается содержательной формулировкой новых задач, вытекающих из проведенного исследования.

3. Генеральная совокупность и выборка из нее. Репрезентативность выборки

Генеральная совокупность – это совокупность всех мысленных наблюдений (или всех мыслимо возможных объектов), которые могут быть проведены при данном реальном комплексе условий.

Понятие ГС – это абстрактное математическое понятие. ГС может быть конечной или бесконечной.

Выборка из данной ГС представляет собой результат ограниченного ряда наблюдений интересующего нас показателя (признака, переменной). ГС всегда больше, чем выборка. В статистике выборка обозначается х1, х2, …, хn количество наблюдений n.

Количество наблюдений – «n»- называется объемом выборки.

Сущность статистических методов – чтобы по некоторой части ГС, т.е. по выборке, выносить суждения о свойствах ГС в целом.

Одним из важнейших вопросов, от успешного решения которого зависит достоверность выводов, получаемых в результате статистической обработки данных, является вопрос репрезентативности выборки, т.е. вопрос полноты и адекватности представления выборкой интересующих нас свойств ГС. Одним из важных путей повышения степени репрезентативности выборки является достижение полностью случайного отбора объектов из ГС.