Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matematicheskaya_statistika_v_meditsine

.pdf
Скачиваний:
120
Добавлен:
19.02.2016
Размер:
5.63 Mб
Скачать

2

Гангренозный абсцесс

48

11

Решение:

Так как в данной задаче требуется сравнить две выборки по уровню признака и данные представлены в виде таблицы сопряженности, а объемы выборок превосходят 5, то для решения можно использовать критерий φ*.

1. Гипотезы:

H0: Доля летальных исходов во второй группе не больше, чем в первой. H1: Доля летальных исходов во второй группе больше, чем в первой.

2. Количество летальных исходов в первой группе и во второй группе – значения столбца "есть эффект" в представленной таблице.

3. Определим доли летальных исходов в каждой группе

 

m1

 

 

4

0.0286 ,

 

 

1

 

n1

 

140

 

 

 

 

 

 

 

 

m

 

11

0.2292

 

2

 

 

 

 

 

 

 

 

2

 

n

 

48

 

 

 

 

 

 

 

 

 

2

 

 

 

4. Подсчитаем величины углов мых долей по формуле:

, выразив их в радианах, для каждой из сопоставляе-

 

 

2 arcsin

 

 

2 arcsin

0.0286 0.340

 

 

1

 

 

1

 

 

 

 

 

 

 

2

2 arcsin

 

2

2 arcsin

 

0.2292 0.998

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Номер груп-

 

«Есть эффект»

 

Число больных, n

Доля летальных ис-

, рад

пы

 

летальные исходы, m

ходов,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

4

 

 

140

0.0286

0.340

2

 

 

 

 

11

 

 

48

0.2292

0.998

5. Подсчитаем эмпирическое значение

*эмп

:

эмп

 

 

 

n

n

0.340 0.998

140 48

3.93

2

1

2

 

1

 

 

n

n

 

140 48

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

6. Отметим на оси значимости критические и эмпирическое значения критерия:

7. *эмп попадает в зону значимости, следовательно, принимаем H1 на высоком уровне значимости. Доля летальных исходов во второй группе значимо больше, чем в первой.

91

ГЛАВА 12. ЭЛЕМЕНТЫ КОРРЕЛЯЦИОННОГО

ИРЕГРЕССИОННОГО АНАЛИЗА

12.1.Статистическая и корреляционная зависимости

Часто перед исследователем стоит задача о взаимодействии отдельных признаков. Иногда значение одной величины однозначно определяет значение другой, связанной с ней, величины, тогда говорят о функциональной зависимости между переменными y=f(x). Однако существует много явлений, для которых число факторов, влияющих на протекание явления очень велико, все их учесть невозможно, тогда при фиксированном значении одной величины, другая имеет некоторую свободу и может принимать различные значения. Если в такой ситуации рассматривать одну величину, как независимую (контролируемую), а вторую, как зависимую от первой, то зависимая величина ведет себя как случайная, и ее можно описать некоторым вероятностным распределением. Стохастическая (вероятностная) связь между случайными величинами X и Y проявляется в изменении закона распределения Y при изменении распределения Х. Стохастическая (вероятностная) зависимость величины Y от X – такая,

при которой каждому значению величины X из множества ее возможных значений соответствует некоторое распределение возможных значений величины Y. Эта зависимость может быть установлена качественно – по форме корреляционного поля и количественно – путем вычисления коэффициента корреляции. Частный случай стохастической зависимости – корреляционная зависимость между величинами, при которой изменение величины X ведет к изменению математического ожидания величины Y.

M (Y )x f (x) – называют уравнением регрессии Y на X;

M (X )

y

( y)

 

 

– называют уравнением регрессии X на Y.

Корреляционные связи различают по форме, направлению и тесноте.

На практике, имея ограниченный объем данных, выборку, невозможно определить математические ожидания величин X и Y, возможно сделать только их оценки.

При установлении корреляционной зависимости экспериментально для каждого обследованного объекта получают соответствующие пары значений величин X и Y. Объем выборки – n. Каждой паре значений на плоскости xOy соответствует одна точка. Всего будет n точек. Область на графике, занимаемая занятая этими точками, образует корреляционное поле:

У

У

 

Линия

 

регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

 

  

 

 

 

 

 

 

 

 

 

  

 

 



 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

 

 

  

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 



 

 

 

 



 

 

 

 

 

 

 

 

 

 



 

 

 



 

 

 

 

 

 

 



 

 

 



 

 

 

 

 

 

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

  

 

 

  

 

 

 

 

 

 

 

  

 



  

 

 

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У случайныхвеличин имеется связь

Связь выражена слабо

Если форма корреляционного поля близка к кругу, то связи между признаками X и Y нет. Если же корреляционное поле вытянуто, то корреляционная связь между признаками X и Y есть, причем тем сильнее, чем более вытянуто корреляционное поле.

12.2. Показатели статистической связи

На сегодняшний день существует достаточное большое количество мер связи величин: коэффициенты корреляции, ассоциации, контингенции. Выбор того или иного показате-

92

ля зависит от того, в каких шкалах заданы изучаемые признаки, сколько вообще изучаемых признаков, как они распределены и в каких диапазонах изменяются.

Меры связи условно принято разделять на параметрические и непараметрические.

Параметрические показатели связи зависят от вида распределения признаков, непараметрические – нет.

К простейшим параметрическим показателям относят следующие:

1. Ковариация – простейший показатель совместного линейного изменения двух нормально распределенных признаков. Определяется по формуле:

Cov( X ,Y )

(xi

x)( yi n

y)

.

Данный показатель является не вполне удобным, так как позволяет только определить направление линейной корреляции, но зависит от дисперсий признаков.

2. Коэффициент линейной корреляции r-Пирсона. Классический показатель линей-

ной корреляции двух нормально распределенных признаков, показывающий не только направление связи, но и ее тесноту. Определяется по формуле:

rxy

Cov( X ,Y )

 

(x x)( y

y)

 

 

 

i

 

i

 

.

 

 

(x x)

 

 

( y y)

 

y

 

2

 

2

 

x

 

 

 

 

 

 

 

i

 

 

i

 

При этом –1≤r≤1. При r=0 линейная корреляционная связь между признаками X и Y от-

сутствует, если

r 1

связь полная, или функциональная. При r>0 связь между признаками

положительная, т. е. с увеличением значений одного признака значения другого тоже увеличиваются, а при r<0 связь отрицательная, с увеличением значений одного признака значения другого уменьшаются.

Данный коэффициент корреляции используется для классификации корреляционных связей по их силе (тесноте или степени). Выделяют общую и частную классификацию корреляционных связей:

● Общая:

1.Сильная (тесная) – при r 0.7

2.Средняя – при 0.5 r 0.69

3.Умеренная – при 0.3 r 0.49

4.Слабая – при 0.2 r 0.29

5.Очень слабая r 0.19

● Частная:

1.Высокая значимая корреляция – при r, соответствующем уровню статистической значимости p 0.01

2.Значимая корреляция – при r, соответствующем уровню статистической значимости p 0.05

3.Незначимая корреляция – при r, не достигающем уровню статистической значимости

0.05.

Две эти классификации не совпадают. Первая ориентирована на величину коэффициента корреляции, вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньшей величины r оказывается достаточно, чтобы корреляция была признана достоверной. Обычно принято ориентироваться на вторую классификацию. Вместе с тем необходимо

помнить, что сильная (высокая) корреляция – это корреляция с коэффициентом r 0.7 , а не просто корреляция высокого уровня значимости.

На практике для оценки тесноты линейной корреляционной связи по результатам выборочных наблюдений считают выборочный коэффициент линейной корреляции, который является оценкой генерального коэффициента линейной корреляции. Потом осуществляется проверка его значимости и делается статистический вывод.

93

3. Коэффициент детерминации – показатель того, какая часть дисперсии одного при-

знака объясняется изменением другого признака. Определяется по формуле:

Dxy r

2

.

 

Некоторые непараметрические коэффициенты корреляции будут рассмотрены в параграфе 12.4.

12.3. Форма и направление корреляционной связи: уравнение регрессии, линия регрессии

Регрессионный анализ – устанавливает формы зависимости между случайной величиной Y и значениями одной (или нескольких) переменных величин, значения которых считаются заданными. Пользуясь математической моделью (уравнением регрессии), находят оценки ее неизвестных параметров, затем определяют статистические ошибки этих оценок и проверяют соответствие принятой математической модели эмпирическим данным. По экспериментальным данным для каждого значения признака X можно найти Y .

Зависимость Yx f (x) называется эмпирическим уравнением регрессии Y на X. Аналогично можно получить зависимость X y ( y) – эмпирическое уравнение регрессии X на

Y.

Если зависимости f(x) и φ(y) возрастающие, то корреляционная связь – положитель-

ная, если убывающие, то – отрицательная.

Графики этих функций называются линиями регрессии. Если они представляют собой прямые, то корреляционная связь между признаками X и Y называется линейной. В этом случае:

Y

ax b

x

 

X

y

cy d

 

 

 

 

 

 

 

 

Здесь коэффициенты

a

и c

называются выборочными коэффициентами регрессии.

Корреляционный анализ состоит в определении степени (тесноты) связи между двумя случайными величинами X и Y. В качестве меры связи используют коэффициент корреляции r.

12.4. Непараметрические коэффициенты корреляции

В данной главе рассмотрим некоторые непараметрические коэффициенты корреля-

ции, часто используемые в медицинских и биометрических исследованиях.

Из всего многообразия непараметрических коэффициентов рассмотрим следующие: коэффициент ранговой корреляции rs-Спирмена, коэффициент корреляции τ-Кендалла, коэффициент ассоциации φ и рангово-бисериальный коэффициент корреляции. Выбор того или коэффициента корреляции в исследовании зависит от того, в каких шкалах заданы исследуемые признаки:

Тип шкалы переменной

Коэффициент корреляции

Переменная X

Переменная Y

 

Отношений, отрезков или

Отношений, отрезков или

τ-Кендалла (если нет одинаковых ран-

ранговая

ранговая

гов) или rs-Спирмена

Дихотомическая

Дихотомическая

Коэффициент ассоциации φ

Дихотомическая

Ранговая

Рангово-бисериальный

Если для некоторого коэффициента корреляции нет таблицы критических значений, то используют таблицу критических значений t-критерия Стьюдента (см. таблицу 4). При этом эмпирическое значение t-критерия находится по формуле:

94

t

эмп

=

 

 

Если

r

tэмп

n 2

, где

1 r

2

 

 

 

 

α; n

t

крит

 

 

r

– коэффициент корреляции,

2 , то на уровне значимости

n

– объемы выборок.

α принимается гипотеза о значимо-

сти отличия данного коэффициента корреляции от 0, т. е. гипотеза о существенности корреляционной связи.

12.4.1. Коэффициент корреляции τ-Кендалла

Данный коэффициент используется для выявления корреляционной связи между двумя величинами, заданными в ранговой шкале. При этом у каждой переменной не должно быть одинаковых рангов, если это требование не выполняется то, необходимо использовать коэффициент корреляции рангов Спирмена.

Порядок расчета коэффициента корреляции τ-Кендалла:

1.Записать результаты измерений пары признаков в столбцы таблицы, упорядочив при этом первый признак по возрастанию.

2.В соседние столбцы таблицы вписать для каждого значения второго признака число так называемых совпадений и инверсий.

а) Совпадение считается следующим образом: для данного значения второй переменной подсчитывается количество значений этой переменной, расположенных ниже в таблице

ибольших данного значения.

б) Инверсия считается следующим образом: для данного значения второй переменной подсчитывается количество значений этой переменной, расположенных ниже в таблице и меньших данного значения.

3.Найти сумму всех совпадений для второй переменной – P.

4.Найти сумму всех инверсий для второй переменной – Q.

5. Проверить правильность подсчетов: сумма всех совпадений и инверсий

на совпасть с контрольным числом

N N 1

, где N – объем второй выборки:

2

 

 

N N 1

 

 

P + Q =

 

 

 

2

 

 

 

 

 

 

 

P +Q

долж-

5. Найти эмпирическое значение коэффициента корреляции по одной из следующих

формул:

 

 

 

 

 

P Q

 

Q

P

τэмп =

N N 1 , τэмп = 1

 

N N 1 , τэмп =

N N 1 1.

 

2

 

4

4

6. Найти критические значения коэффициента, нанести их на ось значимости. На нее же нанести эмпирическое значение, сделать выводы.

12.4.2. Коэффициент ассоциации φ

Данный коэффициент корреляции используется для выявления связи между двумя величинами заданными в дихотомической шкале.

Существуют 2 способа расчета данного коэффициента корреляции.

Способ 1.

В данном способе предварительно дихотомические шкалы перекодируются к одним и тем же обозначениям: в нашем случае – «0» и «1». Далее вычисляется эмпирическое значение коэффициента корреляции по формуле:

95

 

эмп

=

 

 

чение «1»;

борке;

Py

 

P

P P

 

 

 

 

 

xy

 

x

y

 

, где

Pxy

– доля случаев, в которых оба признака имеют зна-

 

P 1 P

P

1 P

 

 

 

 

 

 

x

x

y

y

 

 

 

 

Px

– доля случаев, в которых признак X имеет значение равное «1» в своей вы-

доля случаев, в которых признак Y имеет значение равное «1» в своей выборке.

Способ 2.

В данном случае используется четырехпольная таблица, в ячейках которой находятся абсолютные частоты возможных комбинаций признаков. Таким образом, данный метод требует вместо перекодировки построения дополнительной таблицы следующего типа:

X\Y

 

Y +

 

Y

X +

 

a

 

b

X

 

c

 

d

В таблицу вводятся дополнительные строка и столбец, содержащие суммы по столбцам

и строкам соответственно:

 

 

 

 

 

X\Y

 

Y +

 

Y

 

Σ

X +

 

a

 

b

 

a+b

X

 

c

 

d

 

a+d

Σ

 

a+c

 

b+d

 

a+b+c+d

Коэффициент корреляции вычисляется в таком случае по формуле:

 

эмп

=

 

 

ad bc a + c b + d a + d a + b

.

После вычисления эмпирического значения нужно найти критические значения коэффициента, нанести их на ось значимости. На нее же нанести эмпирическое значение, сделать выводы.

12.4.3. Рангово-бисериальный коэффициент корреляции.

Данный коэффициент используется в том случае, когда один из признаков задан в дихотомической шкале, а другой – в ранговой. Особенностью данного коэффициента является то, что его знак («+» или « – ») не интерпретируется.

Эмпирическое значение критерия считается по формуле:

r

рб эксп

 

 

 

2(R R )

1

0

 

n

,

где

R1

– средний ранг первого признака (в ранговой шкале), для тех случаев, для кото-

рых значения второго признака (в дихотомической шкале) равны «1»;

где

R0

– средний ранг первого признака (в ранговой шкале), для тех случаев, для кото-

рых значения второго признака (в дихотомической шкале) равны «0»; n – объем выборок.

Далее нужно найти критические значения коэффициента, нанести их на ось значимости. На нее же нанести эмпирическое значение, сделать выводы.

12.4.4. Коэффициент ранговой корреляции rs-Спирмена

Назначение критерия: Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков.

96

Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами значений могут быть:

● Два признака, измеренные в одной и той же группе испытуемых. Здесь ранжируются индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Значимость полученного коэффициента корреляции определяется по количеству ранжированных значений N. В этом случае это количество будет совпадать с объемом выборки n.

Две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков. Здесь ранжируются индивидуальные значения, полученные каждым из 2-х испытуемых по определенному (одинаковому для них обоих) набору признаков. Первый ранг получит признак с самым низким значением; второй ранг – признак с более высоким значением и т.д. Очевидно, что все признаки должны быть измерены в одних и тех же единицах, иначе ранжирование невозможно. Количеством ранжированных значений N в этом случае будет количество признаков, составляющих иерархию.

Две групповые иерархии признаков. Здесь ранжируются среднегрупповые значения, полученные в 2-х группах испытуемых по определенному, одинаковому для двух групп, набору признаков. Здесь N – это также количество сопоставляемых признаков, а не количество испытуемых в группах.

Индивидуальная и групповая иерархии признаков. Здесь ранжируются отдельно индивидуальные значения испытуемого и среднегрупповые значения по тому же набору признаков, которые получены, как правило, при исключении этого отдельного испытуемого – он не участвует в среднегрупповом профиле, с которым будет сопоставляться его индивидуальный профиль. Ранговая корреляция позволит проверить, насколько согласованы индивидуальный и групповой профили. Аналогично предыдущему случаю N – количество сопоставляемых признаков, а не количество испытуемых в группах.

В первом случае, если два признака связаны положительно, то испытуемые, имеющие низкие ранги по одному из них, будут иметь низкие ранги и по другому, а испытуемые, имеющие высокие ранги по одному из признаков, будут иметь по другому признаку также высо-

кие ранги. Для подсчета rs необходимо определить разности (d) между рангами, полученными данным испытуемым по обоим признакам. Чем меньше разности между рангами, тем

больше будет rs, тем ближе он будет к +1.

Если корреляция отсутствует, то все ранги будут перемешаны и между ними не будет

никакого соответствия. Формула составлена так, что в этом случае rs окажется близким к 0. В случае отрицательной корреляции низким рангам испытуемых по одному признаку

будут соответствовать высокие ранги по другому признаку, и наоборот.

Чем больше несовпадение между рангами испытуемых по двум переменным, тем бли-

же rs к –1.

Во втором, третьем и четвертом случаях, если две иерархии признаков связаны положительно, то признаки, имеющие низкие ранги в одной из них, будут иметь низкие ранги и в другой, и наоборот.

Если абсолютная величина rs достигает критического значения или превышает его, корреляция достоверна.

Условия применения критерия:

По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки определяется имеющимися таблицами критических значений, а именно

N≤40.

Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несов-

97

падающих значений. В случае, если это условие не соблюдается, необходимо вносить поправку на одинаковые ранги.

Гипотезы:

Возможны два варианта гипотез. Первый относится к первому случаю, второй – к трем остальным.

Первый вариант гипотез:

Н0: Корреляция между переменными А и Б не отличается от нуля.

Н1: Корреляция между переменными А и Б достоверно отличается от нуля.

Второй вариант гипотез:

Н0: Корреляция между иерархиями А и Б не отличается от нуля.

H1: Корреляция между иерархиями А и Б достоверно отличается от нуля.

Расчет коэффициента ранговой корреляции Спирмена rs :

1.Два признака или две иерархии признаков, которые участвуют в сопоставлении, назовем переменными А и В.

2.Номера или коды испытуемых (или признаков) занести в первый столбец таблицы.

3.Проранжировать значения переменной А, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Занести ранги во второй столбец таблицы соответственно номерам испытуемых или признаков.

4.Проранжировать значения переменной В в соответствии с теми же правилами. Занести ранги во третий столбец таблицы соответственно номерам испытуемых или признаков.

5.Подсчитать разности di между рангами А и В по каждой строке таблицы и занести в четвертый столбец таблицы.

6.Возвести каждую разность в квадрат: di2. Эти значения занести в пятый столбец таб-

лицы.

7. Подсчитать сумму квадратов

d

2

 

i

 

i

 

.

8. При наличии одинаковых рангов рассчитать поправки:

 

k

3

 

T

(a

a ) /12

 

a

i

 

i

 

1

 

 

 

m

3

 

T

(b

b ) /12

 

b

i

 

i

 

1

 

 

где ai – объем каждой группы одинаковых рангов в ранговом ряду А; k – число групп одинаковых рангов в ранговом ряду A; bi – объем каждой группы одинаковых рангов в ран-

говом ряду В; m – число групп одинаковых рангов в ранговом ряду B. 9. Рассчитать коэффициент ранговой корреляции rs по формуле:

а) при отсутствии одинаковых рангов:

6 di 2 rs 1 N (Ni 2 1)

б) при наличии одинаковых рангов:

 

 

6 d

2

T

T

 

 

i

 

1

i

 

a

b

r

 

2

 

 

s

 

N (N

1)

 

 

 

где N – количество испытуемых или признаков, участвовавших в ранжировании.

10. Определить по таблице 23 критические значения rs для данного N. Если rs превышает критическое значение или, по крайней мере, равен ему, корреляция достоверно отличается от 0.

98

Примеры решения задач

Пример 33. На приеме у семейного психолога психолог попросил мужа и жену расставить прилагательные, характеризующие их сына, в порядке их выраженности. Результаты расположения прилагательных представлены в таблице:

муж

жена

энергичный

радостный

ответственный

отзывчивый

любознательный

добрый

умный

умный

радостный

любознательный

отзывчивый

энергичный

скромный

ответственный

добрый

скромный

Согласуются ли оценки родителей?

 

Решение:

Так как в данной задаче требуется сопоставить две иерархии признаков, то для решения можно использовать как коэффициент корреляции рангов Спирмена, так и коэффициент корреляции τ-Кендалла. Будем использовать второй коэффициент, так как он вычисляется

проще, и в исходных данных нет повторяющихся рангов.

1. Переведем иерархии признаков в шкалу рангов. Для этого произвольно признакам приписываем номера: например, по иерархии мужа по возрастанию. В результате получаем:

муж

Ранг в иерархии

 

жена

Ранг в иерархии жены

мужа

 

 

 

 

 

 

 

энергичный

1

 

радостный

5

ответственный

2

 

отзывчивый

6

любознательный

3

 

добрый

8

умный

4

 

умный

4

радостный

5

 

любознательный

3

отзывчивый

6

 

энергичный

1

скромный

7

 

ответственный

2

добрый

8

 

скромный

7

Отбрасывая иерархии, получаем таблицу с рангами, в которой в первом столбце ранги

расположены по возрастанию:

 

 

 

 

 

 

 

 

 

 

Ранг в иерархии мужа

Ранг в иерархии жены

 

Совпадения

 

Инверсии

1

 

5

 

3

 

4

2

 

6

 

2

 

4

3

 

8

 

0

 

5

4

 

4

 

1

 

3

5

 

3

 

1

 

2

6

 

1

 

2

 

0

7

 

2

 

1

 

0

8

 

7

 

0

 

0

Σ

 

 

 

10

 

18

2. Считаем число совпадений и инверсий.

Считаем число совпадений. Например, берем первое число для второй иерархии – это

99

число 5. Считаем, сколько чисел стоящих ниже в этом же столбце и больших 5 – таких чисел 3 (6, 8, 7). Вписываем в столбец «Совпадения» для данного значения ранга число 3. Берем следующий ранг во второй иерархии – это число 6. Чисел стоящих ниже в этом же столбце и больших 6 – 2 (7 и 8). Вписываем в столбец «Совпадения» для данного значения ранга число 2. И так далее.

Аналогично подсчитываются инверсии, только сейчас считаем количество нижестоящих чисел не больших данного, а – меньших.

3. В таблицу добавляем еще одну строку, в которой суммируем значения в столбцах «Совпадения» и «Инверсии». Таким образом, получаем общее число совпадений P =10 и общее число инверсий Q =18 .

Проверяем правильность подсчетов. Находим общую сумму инверсий и совпаде-

ний: P +Q =10+18= 28

. Находим контрольное число:

N N 1

=

8 8 1

=

56

= 28.

2

2

2

 

 

 

 

Видно, что общая сумма совпадает с контрольным числом, следовательно подсчеты проведены верно.

4. Находим эмпирическое значение критерия по формуле:

τ

эмп

=

 

 

P Q N N 1

2

,

1018

τэмп = 8 8 1 =

2

8

=

28

 

0.29

.

5. Находим критические значения для данного критерия. Так как отдельной таблицы критических значений для него нет, то будем использовать таблицу критических значений t- критерия Стьюдента. Вычисляем эмпирическое значение t-критерия для данного значения коэффициента корреляции по формуле:

tэмп

= r

n 2

, tэмп = 0.28

8 2

= 0.78 .

1 r

2

2

 

 

 

 

1 0.28

 

По таблице критических значений t-критерия (см. таблицу 4) находим критические

значения:

 

 

 

 

 

 

t0.05

(6) = 2.45

,

 

 

 

t0.01

(6) = 3.71.

 

 

 

Наносим критические значения на ось значимости, на нее же наносим эмпирическое значение.

Как видно из рисунка, эмпирическое значение коэффициента корреляции попадает в зону незначимости, поэтому принимаем гипотезу H0, о незначимости отличия коэффициента корреляции от 0, т. .е. о несущественности корреляции иерархий признаков.

Пример 34. Группа пациентов, страдающих психосоматическими заболеваниями, выполнила 16-факторный тест личности Кеттела. Результаты измерений по фактору N («Дипломатичность») были занесены в таблицу:

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]