Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
матметоды.docx
Скачиваний:
8
Добавлен:
23.09.2019
Размер:
97.05 Кб
Скачать

Анализ сдвига на уровне порядковой шкалы.

Через 2 недели самостоятельная работа по первым 4 лекциям + выбор критерия. Тест. Со следующей недели – SPSS.

T-Вилкоксона.

Назначение: для оценки направленности изменения и степени его выраженности.

Ограничения: С=2, n>=5. Нулевые сдвиги из рассмотрения исключаются, количество наблюдений N уменьшается на количество этих нулевых сдвигов. Именно поэтому желательно брать достаточно большой разброс значений ( от 0 до 15, или от 0 до 30).

Гипотезы: H0 – интенсивность сдвигов в типичном направлении не превышает интенсивности сдвигов в нетипичном направлении. Типичное направление – часто встречающее направление, нетипичное – редкое. H1 – превышает.

1) «После» вычесть «до» (первое значение вычитаем из второго). Абстрагируемся от знака разности, записывая значения отдельным столбцом по модулю.

2) Проводим ранжирование этих значений. Подсчитываем общую сумму рангов, сверяем с расчетной.

3) Подсчет критерия

Т = ∑ Rr.

Rr – ранговые значения, соответствующие нетипичным сдвигам.

4) Принятие гипотезы, помня, что это – критерий исключения. Таблица 6 приложения 1 Сидоренко.

Задача: 11 курсантов военного училища. Динамометр. Индивидуальный показатель разделили пополам. Xi/2. Обычная инструкция (пока рука не устанет). Следующий эксперимент (с обращением к идеалу) – представление идеального волевого усилия. Гипотеза: обращение к идеалу способствует возрастанию волевого усилия.

Т до

Т после

Т после – Т до

Модуль разности

Ранговый номер

64

77

74

95

105

83

73

75

101

97

78

25

50

77

76

67

75

77

71

63

122

60

-39

-27

3

-19

-38

-8

4

-4

-38

25

-18

39

27

3

19

38

8

4

4

38

25

18

11

8

1

6

9,5

4

2,5

2,5

9,5

7

5

∑ = 66.

H1: интенсивность сдвигов в сторону уменьшения длительности мышечного усилия превышает интенсивность сдвигов в сторону её повышения.

Проверка суммы рангов. 11*12/2 = 66. 66=66.

Т = 1+2,5+7 = 10,5. 0,01 = 7, 0,05 = 13. Р < 0,05 = > H1.

Эксперимент невалиден, неверно организован.

H2r-Фридмана.

(Хи-ар-квадрат Фридмана). Назначение: позволяет оценить степень выраженности изменений; для того, чтобы отследить направленность, необходимо строить график. Ограничения: С>=3, n>=4.

H0 – между показателями, полученными в разных условиях, существуют лишь случайные различия. H1 – неслучайные.

Алгоритм расчета: 1) ранжирование проводится не по вертикали, а по горизонтали в пределах каждого испытуемого. Петров решил первую задачу за 4, вторую за 3, третью за 7 сек. Ранги – 2,1,3. Иванов: каждую задачу – за 5 сек. Все ранги – 2. Подсчитываются суммы рангов по условиям по замерам; чем больше они различаются, тем более достоверный сдвиг мы имеем.

Проверка рангов: ∑ R = n * ((C*(C+1)/2);

2) Расчёт критерия.

H2r = ( 12/(n*C(C+1)) * ∑ Ti2) – 3*n(C+1)

3) Принятие решения. Если С, n от 4 до 9, то таблица 7а приложения 1 Сидоренко.

Если С=4 и n=4, приложение 7б приложения 1 Сидоренко.

При большем количество замеров и испытуемых, таблица 9 приложения 1 Сидоренко.

Задача. Решаемые анаграммы (рука, сталь, машина). C=3,n=5. Различия во времени при решении 3х анаграмм, не являются случайными.

Рука

Сталь

Машина

5

7

2

2

35

1

1

1

1

2

6

235

604

93

171

141

3

3

3

3

3

15

7

20

5

8

7

2

2

2

2

1

9

∑ R = 30; 30=30.

H2r = 12/5*3*4 * (36+225+81) – 3*20 = 1/5 * 342 – 60 = 8,4. P = 0,0085 < 0,01 => H1.

Задача1: эффективен ли социально-психологический тренинг, направленный на формирование навыка активного слушания? 10 – навык сформирован максимально.

До

После

6

3

4

4

6

6

3

6

6

5

6

6

7

5

8

6

4

8

7

5

7

7

5

7

Ранжирование.

До

После

Т после – Т до

Модуль разности

Ранг

6

3

4

4

6

6

3

6

6

5

6

6

7

5

8

6

4

8

7

5

7

7

5

7

1

2

4

2

-2

2

4

-1

1

2

-1

1

1

2

4

2

2

2

4

1

1

2

1

1

3

8

11,5

8

8

8

11,5

3

3

8

3

3

H1 : интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.

∑ R = 78. Проверка: 78=78.

T = 8+3+3=14. 0,05= 17, 0,01= 9 => P < 0,05 => H1.

Задача2: 16 родителей. Их попросили оценить степень согласия о допустимости телесных наказаний их детей. 10 – согласен максимально. Можно ли говорить о достоверной тенденции в оценках?

Родитель наказывает

Бабушка наказывает

Учительница наказывает

4

1

5

4

3

4

3

5

6

2

6

5

7

5

5

6

2

1

4

3

3

5

3

5

5

2

3

3

5

5

5

6

1

1

4

2

2

1

1

3

3

2

2

4

4

2

4

4

Ранжирование.

Родитель наказывает

Бабушка наказывает

Учительница наказывает

4

1

5

4

3

4

3

5

6

2

6

5

7

5

5

6

3

2

3

3

2,5

2

2,5

2,5

3

2

3

3

3

2,5

2,5

2,5

2

1

4

3

3

5

3

5

5

2

3

3

5

5

5

6

2

2

1,5

2

2,5

3

2,5

2,5

2

2

2

1

2

2,5

2,5

2,5

1

1

4

2

2

1

1

3

3

2

2

4

4

2

4

4

1

2

1,5

1

1

1

1

1

1

2

1

2

1

1

1

1

H1: между показателями существуют неслучайные различия.

Т1 = 42, Т2= 34,5. Т3=19,5. Т = 96. Проверка: 96=96.

H2r = 12/16*3*4 * (422+34,52+19,52) – 3*16*4 = 0,0625 * (1764+1190,25+380,25) – 192 = 208, 406 – 192 = 16,4.

0,05 – 5,991, 0,01 – 9,210 => P<0,01 => H1.

Лекция 3.

Уровни статистической значимости(традиционная интерпретация).

Уровень статистической значимости

Решение

Возможный статистический вывод

Р>0,1

Р<=0,1

Р<=0,05

Р<=0,01

Принимается H0

Сомнение в истинности H0, неопределенность.

Значимость отклонения H0

Высокая значимость отклонения H0

Статистически достоверные различия, сдвиги, корреляции не обнаружены.

Обнаружены на уровне статистической тенденции.

Обнаружены статистически достоверные (значимые) различия.

Различия обнаружены на высоком уровне статистической значимости.

При большой выборке вариант 3 рассматривается как неопределенность.

S-Джонкера.

Назначение: предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении 3х или более выборок. С>=3. Параллельный критерий к критерию Крускала-Уоллеса, более мощный. Ограничение: количество испытуемых равное. n1=n2=n3

Алгоритм расчета.

Данный критерий позволяет упорядочить обследованные выборки по какому-либо признаку. Все выборки располагаются в порядке возрастания исследуемого признака. При этом выборку, в которой значение в общем ниже, мы помещаем слева. Выборку, в которой выше – правее, и т.д. в порядке возрастания значений. Все выборки выстраиваются слева направо в порядке возрастания значения исследуемого признака. При упорядочивании выборок мы можем опираться на сумму всех значений в каждой выборке, потому что в каждой выборке должно быть одинаковое число испытуемых. Для каждого индивидуального значения подсчитывается количество значений справа, превышающих его по величине. Если тенденция возрастания значений слева направо существенна, то большая часть значений справа должна быть выше. Критерий S позволяет определить, преобладают ли справа более высокие значения или нет. Статистика S отражает степень этого преобладания. Чем выше эмпирическое значение S, тем тенденция возрастания признака является более существенной.

Гипотеза: H0 - Тенденция возрастания значений признака при переходе от выборки к выборке является случайной. H1 – неслучайной.

Ограничение: С>=3, n>=4. n<=10, C<=6.

Задача. Авторитетность. Показатели по шкале авторитетности в группах с разным социометрическим статусом. n=20.

0 выборов по социометрии

1 выбор

2-3 выбора

4 и более выборов

5

5

2

5

4

5

6

7

6

4

5

6

7

7

5

9

9

8

8

7

Можно ли считать, что группы с разным статусом различаются и по уровню авторитетности, определявшейся независимо от социометрии с помощью экспресс-видео-диагностики?

21, 28, 30, 41. => H1: Тенденция возрастания значений авторитетности при переходе от выборки к выборке является неслучайной.

Алгоритм: 1) разложить значения 1 группы в порядке возрастания признака и занести полученный ряд значений в крайний слева столбец таблицы. Проделать то же с другими группами.

2) начиная с крайнего левого столбца подсчитать для каждого индивидуального значения количество превышающих его значений во всех столбцах справа. Si. Полученные суммы записать рядом с каждым индивидуальным значением

3) подсчитать суммы показателей по столбцам.

4) подсчитать общую сумму, просуммировав все суммы по столбцам. А.

5) подсчитать максимально возможное количество превышающих значений(B), которое мы получили бы, если бы все значения справа были выше значений слева. B = (C*(C-1))/2 *n2.

6) Рассчитать критерий. S = 2A – B.

7) Критические значения. Таблица 4, приложение 1, Сидоренко.

Число, Si.

2

4

5

5

5

15

14

11

11

11

4

5

6

6

7

10

8

7

7

4

5

5

6

7

7

5

5

5

4

4

7

8

8

9

9

A = 62+36+23=121.

B = 150.

S = 2*121 - 150 = 92. 0,05 = 51, 0,01 = 72. => H1, потому что Р<0,01.

Задача.

Данные.

2

10

5

8

10

7

12

11

7

8

12

12

12

9

8

12

14

9

16

14

10

11

12

9

9

10

14

13


Расчет Si.

Si

Si

Si

2

5

7

8

10

10

12

21

21

20

18

12

12

5

7

8

9

11

12

12

12

14

13

10

7

6

6

6

8

9

10

12

14

14

16

7

5

4

2

0

0

0

9

9

10

11

12

13

14

Корреляционный анализ.

Использование метода ранговой корреляции для расчёта прогностической валидности. 38 школьников, 12 показателей – оценки по дисциплинам, 13-16 – профили, 17-21 – показатели по тесту ТИР. 1)Есть ли связь между картой интересов и учебными результатами (оценками за четверть); результатами теста и учебными оценками; картой интересов и результатами теста?

1)Рассмотреть корреляционный анализ по Спирмену на завтра.

2)На след. неделе занятий не будет.

Корреляционная связь означает согласованные изменения двух или большего количества признаков. Речь идёт о сопряжённости изменений переменной А с переменной Б. КС различаются: а) по форме, б) направлению, в) степени. а) линейные и нелинейные. Линейные: график (прямая, прямая зависимость, обратная зависимость). Нелинейные: связь между надёжностью и валидностью (парабола). б). в) ось значимости; критические значения - Сидоренко, с.340.

T- Стьюдента.

Формула для анализа различий: (ограничения: n1=n2)

Tразл.= x1-x2/ sqrt (сигма12/n1 + сигма22/n2)

Сигма = sqrt((cумма(xi-x)2 / n-1). X=сумма xi / n.

Формула для анализа сдвига: (ограничения: проверка нормальности – n>=50; без проверки – n>=5).

d = x1 – x2.

Tсдвиг = Сумма d / sqrt ((n* сумма квадратов d – (сумма d)2) / n-1)

Экспериментальная группа

Контрольная группа

До

После

D

D2

До

после

D

D2

12

21

10

15

15

19

17

14

13

11

20

15

15

14

17

10,24

33,64

27,04

0,04

0,04

14,44

3,24

1,44

4,84

17,64

23,04

0,04

0,04

1,44

3,24

8

20

6

8

17

10

10

9

7

8

14

13

16

11

12

10,89

75,69

28,09

10,89

32,49

1,69

1,69

5,29

18,49

10,89

7,29

2,89

22,09

0,09

0,49

4

1

4

7

-2

9

7

5

6

3

6

2

-1

3

5

16

1

16

49

4

81

49

25

36

9

36

4

1

9

25

19

10

12

13

17

14

17

15

14

15

17

15

18

19

22

10,24

33,64

14,44

7,84

1,44

3,24

1,44

0,64

3,24

0,64

1,44

0,64

4,84

10,24

38,44

21

8

13

11

20

12

15

17

15

15

18

16

15

19

25

25

64

9

25

16

16

1

1

1

1

4

0

1

9

81

-2

2

-1

2

-3

2

2

-2

-1

0

-1

-1

3

0

-3

4

4

1

4

9

4

4

4

1

-

1

1

9

-

9

Крит. значения для различия: V = 28. 5% - 2,05. 1% = 2,76.

Сдвиг. 5% = 2,14. 1% = 2,98.

H0: Различия между экспериментальной и контрольной группой до эксперимента по показателю ресурса внимания не являются достоверными.

H1: Различия между экспериментальной и контрольной группой после эксперимента касательно ресурса внимания являются достоверными.

H1: Сдвиги между показателями в экспериментальной группе до и после эксперимента являются достоверными.

H0: Сдвиги между показателями в контрольной группе до и после эксперимента не являются достоверными.

Сумма х

Х штрих

Сигма

х1 = 228

х2 = 169

х3 = 237

х4 = 240

1 = 15,2

2 = 11,3.

3 = 15,8.

4 = 16.

1 = 3,17

2 = 4,04

3 = 3,08

4 = 4,26.

Сумма D 1 = 59. Сумма D 2 = -3.

Сумма квадратов D 1 = 361; Сумма квадратов D 2 = 55.

1)Т (разл.) (до) = х штрих 1 – х штрих 3 / sqrt (0,67 + 0,63) = 15,2 – 15,8 / 1,14 = - 0,53. => H0.

2)Т (разл.) (после) = 11,3 – 16 / sqrt (1,09+1,21) = -4,7 / 1,52 = - 3,09 => H1.

3)Т1 (сдвиг) = 59 / sqrt ((5415-3481)/14) = 59 / 11,75 = 5. => H1.

4)Т2 (сдвиг) = -3 / sqrt ((825-9 / 14)) = -3 / 7,63 = -0,4. => H0

Параллельные методы: расчёты 1) и 2) – по U-Манна-Уитни, расчёты 3) и 4) – по Т-Вилкоксона.

Лекция №5.

Продолжение.

Экзамен – 15 июня, 8:20.

  1. д,е. -

  2. А,б, в, д. +

  3. В. Потому что он связан с расчетом параметрических шкал. +

  4. -

  5. Д. +

  6. А,г,е. +

  7. В. +

  8. А. +

Каким образом строится современное научное исследование? 1) Выражение сомнения в истинности мнения, формулировка мнения как гипотезы–утверждения, допускающую проверку на фактах. 2) Эмпирическая проверка гипотезы, измерение признака, в форме вывода – заключение. В заключении необходимо высказать объективное положение дел относительно гипотезы. Измерение и описание предполагает применение различных, но взаимосвязанных математических и соответствующих им процедур. В процессе измерения мы представляем реальные события, признаки, свойства в виде чисел в соответствии с принятой математической моделью измерений, затем множество подобных результатов измерения мы должны представить в виде, доступном для интерпретации с точки зрения выдвинутой гипотезы. Для этого используются математические модели описания для обобщения результатов измерения: менее сложные (частоты, средние значения, etc.) или более сложные (корреляционный/факторный анализ,etc.). Помимо описания и измерения, существует статистическая проверка гипотез. Иначе, научное познание начинается с формулировки гипотезы, вследствие теории или частного мнения по поводу некоторого аспекта реальности. Гипотеза формулируется так, чтобы её можно было проверить по результатам измерения, то есть в форме описательной математической модели. Описательная математическая модель согласуется с доступной измерительной моделью. Далее модель измерения применяется к интересующим нас аспектам реальности для регистрации результатов наблюдения, как правило в числовой форме. Далее идёт использование конкретных математических методов и интерпретация полученных результатов. Главная проблема заключается в правильном выборе шкалы.

Задача. Существует ли взаимосвязь между временем решения этих задач? Переменная х – среднее время решения наглядно-образных задач, y – вербальные задания тестов.

X

Y

19

32

33

44

28

35

39

39

44

44

24

37

29

40

42

32

48

42

33

47

17

7

17

28

27

31

20

17

35

43

10

28

13

43

45

24

45

26

16

26

Ранговая корреляция Спирмена.

Ограничения: n>=5.

KS ранг. = 1-6*(Сигма*d2)/(n*(n2-1)), D – квадрат разности.

Лекция

Регрессионный анализ.

Регрессионный анализ (лат. движение назад) - область статистического анализа, изучающая зависимость изменений значений переменных от одной или нескольких независимых переменных (факторов). Одно- и многофакторный анализ.

Особенности: 1) описывает динамический процесс. 2) модель обладает прогностической силой, предсказывает развитие процесса за пределами эмпирических значений. Один из самых мощных матметодов.

Применение: RA применим только по отношению к количественно выраженным переменным, измеренным в шкале интервалов или отношений (линейная модель RA). Существуют виды регрессионного анализа, которые описывают переход от шкалы к шкале.

Описание: основными процедурами регрессионного анализа является построение линий (моделей) и нахождение уравнений регрессии. Под линией регрессии понимается линия, соединяющая точки средних значений сгруппированных признаков-факторов (тех признаков, влияние которых на переменную и изучается). Построенные таким образом линии в общем виде определяет взаимодействие изучаемого показателя и одного или группы из объясняющих факторов. Таким образом, позволяет дать предварительную наглядную оценку воздействия фактора на результирующий признак. RA соответствует собственно экспериментальному плану.

График, прямая предсказания (из облака значений).

Задачи, решаемые с помощью RA: 1) как и насколько хорошо мы можем предсказывать отметки по английскому языку в колледже, зная отметки в школе (школьные отметки предшествуют отметкам в колледже, поэтому мы можем предсказывать последние). 2) предсказывание успеваемости по уровню интеллекта.

Виды RA: 1) линейная регрессия. y = a0+a1x (y по x); 2)логарифмическая; 3)обратная; 4) степенная; 5) показательная; 6) s-образная; 7) логистическая; 8) роста, etc.

Виды регрессионного анализа: 1) Бинарно-логистическая регрессия: зависимость дихотомических переменных от независимых переменных, имеющих любой вид шкалы. 2) Порядковая регрессия. Зависиммая переменная относится к порядковой шкале, а независимые переменные должны быть категориальными (номинальная). 3) Мультиномиальная логистическая регрессия.Зависимая переменная имеет больше двух перемнных, пригодная только для категориальных переменных, хотя можно допустить и порядковую шкалу.

Подборка кривых. у – зависимая переменная (dependent), х – независимая переменная (предикат). Для того, чтобы использовать уравнение прогноза, для начала нужно рассчитать коэффициенты регрессии о оценить их значимость. Существует связь между коэффициентами регрессионного уравнения и линейной корреляцией Пирсона.

  1. Rx1y = sqrt a1*b1.

  2. а1= (n*сигма xiyi – сигма xi*сигма yi )/ (n* сигма xi2 – (сигма xi)2).

  3. b1= (n*сигма xiyi – сигма xi*сигма yi)/ (n* сигма yi2 – (сигма yi)2).

  4. a0= (сигма yi * сигма xi2 - сигма xi * сигма xiyi ) / (n* сигма xi2 – (сигма xi)2).

b0=(сигма xi * сигма yi2 - сигма yi * сигма xiyi ) / (n* сигма yi2 – (сигма yi)2).

  1. 7) Syx (y по x)= sqrt ((сигма(уi-y’)2 – ( (сигма(уi-y’)*сигма(xi-x’))2 / сигма(xi-x’)2 ) / (n-2)*сигма(xi-x’)2 ).

Sxy (x по y)= sqrt ((сигма(xi-x’)2 – ( (сигма(уi-y’)*сигма(xi-x’))2 / сигма(уi-y’)2 ) / (n-2)*сигма(уi-y’)2 ).

  1. 8) tфакт= a1/Syx ; tфакт= b1/Sxy.

Для формул 7 и 8 рассчитывается стандартная ошибка выборочного коэффициента регрессии, а затем производится оценка значимости с помощью T-Стьюдента. K(степень свободы) = n-2.

Ранговый бисериальный коэффициент корреляции. Применение: одна переменная измеряется в дихотомической (номинативной) шкале (переменная х), а другая – в ранговой шкале (переменная у). От -1 до 1, знак для интерпретации результатов не имеет значения.

Rrb = (x1-x0)*2/N.

Х1 - ;х0 – средний ранг по тем элементам переменной у, которым соответствует код-признак 0 в переменной х; N – общее количество элементов переменной х. Оценка значимости осуществляется по Т-Стьюдента. Tфакт= |Vэмп| * sqrt (n-2)/(1-Vэмп2).

Существуют ли гендерные различия в вербальных способностях? 15 подростков разного пола, учитель литературы, по вербальным способностям. 1 – мужчины, 0 – девушки.

Пол

Вербальная способность

1

0

1

1

0

1

0

0

1

1

1

0

1

1

0

1

10

6

9

15

7

8

13

4

3

5

11

12

2

14

Среднее арифметическое х1 = 49; х0 = 71. Rrb = (49-71)*2/9 = -4,88. Tфакт =

H1: ранговый бисериальный коэффициент значимо отличается от нуля.

Расчёт регрессионного анализа.

Осуществить расчёт по регрессионному анализу (коэффициенты а0, а1 и др.)

Задача: 8 чел. измерили матспособности (переменная х) и оценки по алгебре (у). Влияет ли xi на yi?

Хi

Yi

Xi*yi

Xi2

Yi2

8

8

10

10

14

16

18

18

2

3

4

5

5

4

3

4

16

24

40

50

70

64

54

72

64

64

100

100

196

256

324

324

4

9

16

25

25

16

9

16

102

30

390

1428

120

A1 = (8*390 – (102*30))/(8*1428 – 10404) = 3120 – 3060/11424 – 10404 = 60/1020 = 0,06.

B1 = 60 / 8*120 – 900 = 60 / 60 = 1.

A0 = 30*1428 – 102*390 / 8*1428 – 10404 = 3060 / 1020 = 3.

B0 = 102*120 – 30*390 / 8*120 – 900 = 12240 – 11700 / 60 = 740 /60 = 12,3.

X’= 12,75; Y’=3,75.

Sxy= 1,6.

Сигма(xi-x’) = -4,75 – 4,75 – 2,75 – 2,75 + 1,25 + 3,25 + 5,25 + 5,25 = -15 + 15 = 0.

Сигма(yi-y’)= -1,75 – 0,75 + 0,25 + 1,25+1,25+0,25-0,75+0,25= 0

Сигма(xi-x’)2=

Сигма(yi-y’)2=

Задача: x – ум в см. у – уровень притязаний. 52 испытуемых. Имеется ли связь этих переменных? Влияет ли самооценка на уровень притязаний?

1)проверка на нормальность. Non-Parametristic Tests – 1-Simple-K-S => H0.

2)корреляционный анализ. Пирсон – 0,329 (H0). Спирмен – 0,389 (H1).

3)Regression – Dep./Indep.

4)Уравнение прогноза. Regr. – Linear – Anova. Constant. Y = (4,612+0,391)*x.

  1. 2 школы, n – 23. N – 28 чел. M1 – 15 человек, m2 – 11 человек. Какой класс более успешен? Фи-Фишера.

  2. Будет ли уровень тревожности у подростков-сирот более высоким, чем у их сверстников из полных семей? N1 – 10, n2 – 13. m1 -7, M2 – 3. Фи-фишера.

Задачи: 1)тест Равена, 6 школьников, время. Будут ли найдены статистические различия между временем решения первых трех заданий теста? Xr2-Фридмана. Т-Вилкоксона.

2)4 группы испытуемых, тест Бурдона, по 4 чел. Число ошибок показателей переключаемости внимания. Будут ли достоверны различия? S-Джонкера.

Дисперсионный анализ (A-NOVA) – разработан в 1938 Фишером. Исследует влияние одной или нескольких независимых переменных на одну зависимую переменную (одномерный) или на несколько зависимых (многомерный). Независимые переменные принимают только дискретные значения и относятся к номинальной (или порядковой) шкале. В этой ситуации говорят о факторном анализе. Если же независимые переменные принадлежат к интервальной шкале или к шкале отношений, то их называют ковариациями, а соответствующий анализ – ковариационным. АНОВА использует функцию экспериментального плана. Независимая переменная представляет собой качественно определенный номинативный признак, имеющий две или более градаций. Каждая градация независимой переменной соответствует выборка объектов (испытуемых), для которой определены значения зависимой переменной. Независимая переменная еще называется фактором, имеющим несколько градаций или условий. Зависимая переменная в экспериментальном исследовании рассматривается как изменяющийся под влиянием независимых переменных. В модели АНОВА зависимая переменная должна быть представлена в метрической шкале. В простейшем случае независимая переменная имеет две градации, и тогда задача сводится к сравнению двух выборок по уровню выраженности (средним значением) зависимой переменной. В зависимости от соотношения выборок, соответствующих разным градациям фактора, различают два типа независимых переменных (факторов): градациям уровня межгруппового фактора соответствуют независимые выборки объектов, а градациям уровня внутригруппового фактора соответствуют зависимые выборки, чаще всего повторные измерения зависимой переменной на одной и той же выборке. В зависимости от типа экспериментального плана выделяют 4 основных варианта АНОВА: однофакторный, многофакторный, АНОВА с повторными измерениями и многомерный АНОВА (M-NOVA).

Одномерные АНОВА (One-Way A-NOVA): Используется при изучении влияния одного фактора на зависимую переменную. Проверка одной гипотезы.

Многофакторный АНОВА: используется при изучении двух и более факторов на зависимую переменную. Позволяет проверять гипотезы не только о влиянии каждого фактора в отдельности, но и о взаимодействии факторов.

Рассмотрим на примере двухфакторного анализа. Два фактора: пол и порядок рождения в семье. Результирующий признак – доминантность. Гипотезы: 1)влияние одного фактора; 2)влияние второго фактора; 3)взаимодействие факторов.

Математическая суть метода. Вариативность, обусловленная действием используемых переменных и их взаимодействием, соотносится со случайной вариативностью.

Fэмпа – вариативность, обеспеченная переменной а / случайная вариативность.

F­­эмпб – вариативность, обеспеченная переменной б / случайная вариативность.

Fэмп а и б – вариативность, обеспеченная переменными а и б / случайная варативность.

Входит в оценки дисперсии, т.е. параметров распределения признака. По этому критерию F является параметрическим критерием. Чем в большей степени вариативность признака обусловлена исследуемыми переменными – факторами, или их взаимодействием, тем выше эмпирическое значение F-критерия. Нулевая гипотеза в АНОВА содержит утверждение о равенстве межгрупповой и внутригрупповой составляющих изменчивости и подразумевает направленную альтернативу о том, что межгрупповая составляющая изменчивости превышает внутригрупповую изменчивость. Н0 соответствует равенство средних значений зависимой переменной на всех уровнях фактора. Принятие альтернативной гипотезы означает, что по крайней мере два средних значения различаются, без уточнения, какие градации факторов различаются.

Основные допущения: 1) распределение зависимой переменной должно иметь вид нормального распределения (One-Sample-K-S). 2) Если выборки неравночисленны, то необходима дополнительная предварительная проверка гомогенности (гомогенный тест Ливена в SPSS). Если выборки заметно различаются по численности и дисперсия по критерию Ливена различается статистически достоверна, то дисперсионный анализ неприменим.

Непараметрический аналог – H-Крускала-Уоллеса.

Метрические аналоги – регрессионный и дискриминантный анализ. В дискриминантном анализе зависимая переменная является классифицирующей (номинативно), а независимая переменная – метрической.

Бисериальный коэффициент корреляции.

Одна переменная измеряется в дихотомической шкале (номинативная шкала; переменная х имеет только два значения – 0 и 1). Коэффициент изменяется в диапазоне от -1 до 1, его знак для интерпретации результатов не имеет значения; это исключение из общего правила.

Расчёт. R bis = (x1’ – x0’ / Sy )* sqrt ( n1*n0 / N * (N-1)).

X1’ = среднее по тем элементам переменной у, которым соответствует код 1 в переменной х.

n1 =

n0 = количество нулей в переменной x.

Y’ = среднее по всем значениям.

N = n1+n0.

Sy – стандартное отклонение переменной y. Sy = sqrt сигма( yi – y’)2 /(n-1).

Оценка значимости.

Tфакт = |Rэмп|* sqrt(n-2/1-Rэмп2)

K(степень свободы) = n-2.

5% - 2,16. 1% - 3,1.

Задача. Гендерные различия в показателях интеллекта. N – 15 чел, юноши -1, девушки – 0. N1 – 9, n0 – 6.

1

0

1

1

0

1

0

0

1

1

1

0

1

1

0

102

110

86

90

120

78

95

103

105

93

123

89

109

100

105

Гипотеза H0: бисериальный коэффициент значимо не отличается от нуля.

1)рассчитать x1’. 98,4

2)рассчитать x0’. 103,7.

3)рассчитать y’ и Sy.; 100,5. 12,4.

4)рассчитать бисериальный коэффициент. R bis = (98,4-100,53 / 12,4) * sqrt ( 9*6 / 15*14) = -0,17 * 0,51 = -0, 09=> H0.

Тфакт = 0,09 * sqrt 13/0,99 = 0,09*3,62= -0,216.

Назначение и классификация многомерных методов.

Назначение матметодов: исходная функция матметодов в любой области есть представление эмпирических данных в пригодном для интерпретации виде. Поиск смысла в обилии исходной информации.

1)Эмпирические матмодели включают в себя: описательные математические модели, применяемые для представления исходных (эмпирических) данных в доступном для интерпретации виде. Среднее арифметическое, медиана, разброс значений (минимум-максимум), идентичные мыслительным операции.

2)Многомерные методы как метод многостороннего описания изучаемых явлений.

Функции: 1)структурирование эмпирической информации («множество признаков, измеренных у множества испытуемых») – факторный анализ. 2)классификация – кластерный анализ. 3)распознавание образов – дискриминантный анализ. 4)экстраполяция – множественный регрессионный анализ.

Классификация методов по назначению: 1) методы экстраполяции. Множественный регрессионный анализ – предсказывает значение метрической зависимой переменной по множеству известных значений независимых переменных, измеренных у множества объектов (испытуемых). Дискриминантный анализ – предсказывает принадлежность объектов к одному из известных классов (номинативной шкале по измеренным метрическим дискриминантным переменным). 2)методы классификации. Варианты кластерного анализа и дискриминантный анализ. Кластерный анализ – по измеренным характеристикам у множества объектов либо по данным об их попарном сходстве(различии) разбивает это множество объектов на группы, в каждой из которых содержатся объекты, более похожие друг на друга, чем на объекты из других групп. Дискриминантный анализ позволяет классифицировать объект по известным классам, исходя из измеренных у них признаков, пользуясь решающими правилами, выработанными предварительно на выборке идентичных объектов, у которых были измерены те же признаки. 3)структурные методы. Факторный анализ – направлен на выявление структуры переменных как совокупности факторов, каждый из которых – это скрытая обобщающая причина взаимосвязи групп переменных. Многомерное шкалирование выявляет шкалы как критерии, по которым поляризуются объекты при их субъективном попарном сравнении.

Классификация методов по исходным предположениям о структуре данных: 1) методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов. Факторный анализ, множественный регрессионный, отчасти дискриминантный анализ. 2) методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними. На дистантной модели основаны кластерный анализ и многомерное шкалирование, частичный дискриминантный анализ. Многомерное шкалирование и дискриминантный анализ добавляют предположение о том,что исходные различия между объектами можно представить как расстояние между ними в пространстве небольшого числа шкал или функций.

Классификация по виду исходных данных: 1) методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов. Множественный регрессионный анализ, дискриминантный анализ, факторный анализ. 2) методы, исходными данными для которых могут быть попарные сходства (различия) между объектами. Кластерный анализ и многомерное шкалирование. Кроме того, можно анализировать данные о попарном сходстве между совокупностью объектов, оцененных группой экспертов. При этом анализируются различия как между объектами, так и индивидуальные различия между экспертами.

Различия дисперсионного и дискриминантного анализа.

Дисперсионный анализ

Дискриминантный анализ

Следственно-метрический.

Любой тип шкалы (1 – номинативная, 2 - метрическая).

Метод классификации.

Фактор должна проверяться на нормальность (метрический вид).

1 – метрическая, 2 – номинативная.

Маркер 1 – здоров, симптомов нет.

Маркер 2 – диагноза нет, симптома нет.

Маркер 3 – диагноз есть, симптома нет.

Маркер 4 – диагноза нет, симптомы есть.

Маркер 5 – болен, симптомы есть.

Факторный анализ.

Множество => обобщить информацию. 1 – внесение в компьютерную программу всех данных. 2 – коэффициент Пирсона (корреляции между переменными). 3 – поворот факторной структур в пространстве. «Какие исходные переменные входят в данный фактор?»