Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Matematicheskaya_statistika_v_meditsine

.pdf
Скачиваний:
120
Добавлен:
19.02.2016
Размер:
5.63 Mб
Скачать

Квартильный (межквартильный) размах показывает в каком диапазоне находится центральная часть (50%) ряда, вычисляется как разница между третьим и первым квартилями:

IQR= Q3 Q1.

5.3.3. Среднее линейное отклонение

Среднее линейное отклонение – усреднённый показатель отклонений значений при-

знака от среднего. Вычисляется следующим образом:

 

 

а) Для несгруппированных данных:

 

 

 

 

 

d =

 

x

x + x

x +...+ x x

=

1 N

x ,

 

 

 

1

 

 

 

2

k

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N i=1

 

 

 

 

 

б) Для группированных данных:

 

 

 

1 n

x x , где

N = n ,

k – число вариант,

d = n1 x1 x + n2

x2 x +...+ nk

xk x =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

k

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

i

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N i=1

 

i=1

 

(z)

 

1

z

u

2

/ 2

 

 

 

 

 

 

 

 

 

 

 

 

e

du

– общий объём выборки, ni

– частота каждой i -й варианты.

 

 

 

 

2

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в)

d

Для

 

n

=

1

 

интервального ряда:

x

x

x + n

x

x +...+ n

1

2

2

k

k

 

 

 

N

 

x

=

 

1

k

x

 

n

 

i

i

N i=1

 

x

, где

k N = ni i=1

,

k

– число интерва-

лов,

N

– общий объём выборки,

ni

– частота

i

-го интервала,

xi

– середина

i

-го интервала.

5.3.4. Дисперсия

Дисперсия – усреднённый показатель квадратов отклонений значений признака от

среднего, является более удобной величиной, с точки зрения математики, величиной, чем

d .

Вычисляется следующим образом:

 

а) Для несгруппированных данных:

 

x

2

+ x

 

 

2

+...+ x

 

2

 

 

1

 

 

 

 

 

 

 

 

 

 

x

x

x

 

 

 

N

 

2

 

 

 

 

 

D =

1

 

2

 

 

 

 

k

 

 

=

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

N i=1

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) Для группированных данных:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

x

 

2

+...+ n

x

 

x

2

1

 

 

 

 

 

 

 

n x x + n

x

 

 

 

N

2

 

k

 

 

D =

1

1

 

2

2

 

 

 

k

k

 

 

 

=

 

 

, где

N = ni ,

k

– число

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

ni xi x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N i=1

 

 

i=1

 

 

вариант, N

– общий объём выборки,

в) Для интервального ряда:

 

 

n

2

+ n

x

2

+...+

 

x x

x

D =

1

1

2

2

 

 

 

 

 

 

N

 

 

 

 

 

 

 

ni nk

– частота каждой i -й варианты.

x

x

 

1

 

 

 

 

 

2

 

 

N

 

 

k

k

 

 

 

2

 

 

=

 

 

, где

N = ni

 

 

 

ni xi x

 

 

 

N i=1

 

 

i=1

,

k

– число

интервалов,

N

– общий объём выборки,

ni

– частота i -го интервала,

xi

тервала.

Если распределение признака нормальное, то справедлива формула

5.3.5. Среднее квадратическое отклонение

Среднее квадратическое отклонение – корень из дисперсии.

σ = D

а) Для несгруппированных данных:

41

середина

σ=1.25d .

i

-го ин-

 

 

x

 

 

2

+ x

 

 

2

2

 

 

1

 

 

 

 

 

x

 

x +...+ x

x

 

 

N

2

σ =

 

1

 

 

 

 

2

 

 

k

 

=

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N i=1

 

б) Для группированных данных:

 

 

 

 

 

 

 

 

n

x

 

 

2

+ n

x

2

 

 

 

2

 

 

 

 

x

x +...+ n x

k

x

 

 

σ =

 

1

 

1

 

 

 

 

2

2

 

k

 

 

=

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

k

 

 

x

 

 

2

 

 

 

 

 

 

 

 

 

 

n

 

 

,

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

N i=1

i

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

где N = ni

, k

– число вариант, N

– общий объём выборки,

i=1

ni

– частота каждой

i

варианты.

в) Для интервального ряда:

σ =

 

n1 x1

x 2 + n2 x2

x 2 +...+ nk xk x 2

 

=

 

 

 

 

 

N

 

 

 

 

 

 

 

, где

 

 

 

 

 

 

 

 

 

1 n x x 2 ,

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

 

N i=1

 

 

 

 

 

N– общий объём выборки, ni – частота i -го интервала,

5.3.6.Относительные показатели вариации

k

 

 

N = ni ,

k

– число интервалов,

i=1

 

 

xi – середина i -го интервала.

Являются относительными (относительно среднего) показателями вариации.

а) Относительный размах вариации (коэффициент осцилляции):

V

R

=

 

 

R x

100%

.

б) Относительное линейное отклонение (линейный коэффициент вариации):

Vd = dx 100% .

в) Коэффициент вариации:

Vσ

=

σ x

100%

.

Принято считать, что случае, если коэффициент вариации не превосходит 33%, выборка – однородная.

5.4. Графическое представление данных

Гистограмма строится для интервального ряда следующим образом: по оси абсцисс откладываются значения варианты (интервалы), по оси ординат – либо абсолютная частота, либо – относительная, либо – плотность относительной частоты:

42

По гистограмме можно определить моду интервального ряда, в случае его одномодальности (графический метод определения моды).

Полигон частот строится следующим образом: для дискретного ряда по оси абсцисс откладываются возможные значения признака, для интервального – середины интервалов. По оси ординат откладывается либо абсолютная частота варианты или интервала, либо – относительная, либо – плотность относительной частоты варианты или интервала:

Кумулята (график накопленной частоты) строится следующим образом: по оси абсцисс откладываются значения варианты (либо центры интервалов, если ряд – интервальный), по оси ординат – откладывается либо абсолютная частота варианты или интервала, либо – относительная:

43

Кумулята удобна тем, что с её помощью можно графически быстро определять квантили распределения – например, квартили:

Коробковая диаграмма в комплексном виде позволяет быстро оценить параметры выборки:

5.5. Центральный момент. Показатели асимметрии и эксцесса

5.5.1. Центральный момент

Центральным моментом порядка а) Для несгруппированных данных:

μ*k =

1 xi x k

 

 

N

 

N i=1

k

называется выражение:

б) Для дискретного ряда:

 

1

l

μ*k =

ni xi x k , где l – число вариант,

 

 

N i=1

ni

– частота i -й варианты.

в) Для интервального ряда:

μ*k = 1

l

– середина i – го интервала,

l – число интервалов, ni

ni xi x k , где xi

N i=1

частота i -го интервала.

44

5.5.2. Показатели асимметрии и эксцесса

Показатель асимметрии – показатель несимметричности распределения относительно среднего значения. Вычисляется по формуле:

 

 

μ

*

 

 

 

 

 

 

 

*

=

3

. При

*

> 0

распределение смещено вправо относительно среднего значение

γ3

σ

3

γ3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(положительная или правосторонняя асимметрия),

*

< 0

– влево (отрицательная или лево-

γ3

сторонняя асимметрия).

Показатель эксцесса – показатель, вычисляемый для одномодальных распределений, показывающий степень выраженности максимальной частоты. Вычисляется по формуле:

 

 

 

 

μ

*

3

 

γ

*

 

=

4

. При

4

 

 

σ

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

плосковершинном.

*

 

> 0

γ

4

говорят о островершинном распределении, при

*

 

< 0

γ

4

– о

45

ГЛАВА 6. СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ. СТАТИСТИЧЕСКИЕ КРИТЕРИИ

6.1. Переменные. Шкалы измерения. Метод ранжирования

6.1.1. Переменные. Шкалы измерений

Признаки и переменные – это измеряемые явления. Такими явлениями в практике вра- ча-психолога могут быть время реакции, уровень тревожности, показатель интеллекта, возраст, количество выкуриваемых сигарет в день, систолическое давление, вес, количество гемоглобина в крови, количество холестерина в крови, ЭКГ, и т.д. Переменные – это то, что можно измерять, контролировать или что можно изменять в исследованиях. Чаще всего в медико-психологических исследованиях переменные являются случайными величинами, поскольку заранее не известно, какое именно значение они примут. Переменные отличаются многими аспектами, особенно той ролью, которую они играют в исследованиях, шкалой измерения и т.д.

Статистика обрабатывает количественные и качественные данные. К количественным относятся рост, вес и т.д., к качественным – тип темперамента, пол. Измерение – это приписывание числовых форм объектам или событиям в соответствии с определенными правилами (С. Стивенс). Переменные различаются тем, «насколько хорошо» они могут быть измерены, или, другими словами, как много измеряемой информации обеспечивает шкала их измерений. Одним из основных понятий непараметрической статистики является понятие шкалы, или процедуры шкалирования значений случайных величин. Согласно С. Стивенсу, принято использовать четыре вида шкал.

Номинальная (номинативная) шкала, или шкала наименований. Номинальное измерение сводится к разбиению совокупности объектов на классы, в каждом из которых сосредоточены объекты, идентичные по какому-нибудь признаку или свойству. Типичные примеры номинальных переменных – пол, национальность, цвет, тип темперамента, вид заболевания и т.д. Часто такие переменные называют категориальными. Простейший случай номинативной шкалы – дихотомическая, состоящая всего из двух ячеек (пол). Более сложный вариант – классификация из трех и более ячеек («за», «против», «воздержавшиеся» при голосовании). Подсчитав количество наблюдений в каждой из ячеек (частоты встречаемости), мы затем работаем с ними с помощью математических методов. Единица измерения при этом –

это одно наблюдение. Такие данные могут быть обработаны с помощью метода

вого преобразования Фишера

*

.

 

 

2

 

, угло-

Порядковая, ординальная, или ранговая шкала. Порядковое измерение возможно только тогда, когда в квалифицируемых объектах можно различить разную степень свойства, на основе которого производится квалификация. Они незаменимы для случайных величин, не имеющих природных единиц измерения, но позволяющих применять понятия предпочтения одного значения другому. Однако они не позволяют сказать «на сколько больше» или «на сколько меньше». Типичные примеры: оценки знаний (даже при нечисловом описании), служебные уровни, уровни агрессивности и т. п.; для таких величин разрешены знаки предпочтения (> или <). В порядковой шкале должно быть не менее трех классов (например: щелочная, нейтральная, кислотная реакция). Порядковые переменные позволяют ранжировать (упорядочить) объекты, указав, какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. От классов легко перейти к числам, если считать, что низший класс получит ранг 1, следующий – ранг 2, следующий – 3 и т.д. Чем больше число классов разбиений всей экспериментальной совокупности, тем шире возможности для статистической обработки полученных данных и проверки статистических гипотез. Единица измерения в шкале порядка – расстояние в 1 класс, или ранг, при этом расстояние между классами может быть разным (оно не известно). К данным, полученным по этой шкале, применимы все описанные здесь статистические методы.

46

Интервальная – шкала, где каждое из возможных значений измеренных величин отстоит от ближайшего на равном расстоянии. Главное понятие этой шкалы – интервал, который можно определить как долю или часть измеряемого свойства между двумя соседними позициями на шкале. Размер интервала – величина, фиксированная и постоянная на всех участках шкалы. Для измерения в интервальной шкале устанавливаются специальные единицы измерения. Интервальные переменные позволяют не только упорядочивать объекты измерения, но и численно выразить и сравнить различия между ними. Числа при интервальных измерениях имеют свойство упорядоченности и однозначности. Например, температура, измеренная в градусах Фаренгейта или Цельсия, образует интервальную шкалу. Можно не только сказать, что температура 40 градусов выше, чем температура 30 градусов, но и что увеличение температуры с 20 до 40 градусов вдвое больше увеличения температуры от 30 до 40 градусов. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства).

Шкала отношений (равных отношений) очень близка к интервальной и отличается от нее только тем, что точка отсчета не произвольна. Имеется определенная точка абсолютного нуля, указывающая на полное отсутствие измеряемого свойства или признака объекта. Таким образом, для этих переменных являются обоснованными предположения типа: А в два раза больше, чем В. Типичными примерами шкал отношений являются измерения времени или пространства. Например, температура по Кельвину образует шкалу отношения, и можно не только утверждать, что температура 200 градусов выше, чем 100 градусов, но и что она вдвое выше. Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы отношения. К данным, измеренным в интервальной шкале и шкале отношений, применимо большее количество статистических методов, чем к данным, измеренным в номинальной и порядковой шкалах.

6.1.2. Метод ранжирования

Если расположить выборочные данные в неубывающем (в возрастающем, с учетом повторяющихся данных) порядке, то получается ранжированная выборка. Ранг однозначно определен, если в выборке нет совпадающих значений. Если же они есть, то их ранги определяются как среднее арифметическое порядковых номеров совпадающих значений.

Пусть, например, получена выборка объема n=10, которая после расположения в неубывающем порядке выглядит следующим образом:

№п/п

1

2

3

4

5

6

7

8

9

10

xi

12

14

15

15

15

16

18

19

19

22

Значения с порядковыми номерами 3, 4, 5 совпали, их ранг определяется:

R 3 4 5 4 3

Аналогично для значений с номерами 8 и 9:

R

8

9

8.5

2

 

 

 

 

Таким образом, значения с соответствующими им рангами запишем в таблицу:

xi

12

14

15

15

15

16

18

19

19

22

Ri

1

2

4

4

4

6

7

8.5

8.5

10

 

 

 

 

 

47

 

 

 

 

 

Сумма рангов составляет: 1+2+4+4+4+6+7+8.5+8.5+10=55.

Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

R

n(n 1)

 

10 (10 1)

55

 

 

i

2

 

2

 

 

 

 

где n – общее количество ранжируемых значений.

Если же реальная и расчетная сумма рангов не совпадает, это будет свидетельствовать об ошибке, допущенной при начислении рангов или при суммировании.

В ранговых критериях точные значения признаков заменяются их рангами, поэтому информация о них теряется. Рангами могут быть представлены данные, выраженные в порядковой шкале, в том числе результаты наблюдения качественных признаков.

6.2. Статистические гипотезы

6.2.1. Понятие о статистических гипотезах

В обычном языке слово «гипотеза» означает предположение. В научной терминологии оно употребляется в этом же смысле – предположение, вызывающее сомнение. В статистике оно обозначает предположение, не только вызывающее сомнение, но и которое мы собираемся подвергнуть статистической проверке.

Статистическая гипотеза – это научная гипотеза, допускающая статистическую проверку.

Статистические гипотезы обычно рассматривают две генеральных совокупности, одна из которых может представлять собой теоретическую модель (например, нормальное распределение), а о второй судят по выборке из нее. В других случаях обе генеральные совокупности представлены выборками. Проверка статистической гипотезы состоит в том, чтобы определить вероятность случайности или неслучайности различий (или сходства).

При этом принят следующий подход. Если взять две выборки, представляющие собой результаты измерения одного и того же признака и сравнить между собой их характеристики (среднее арифметическое, стандартное отклонение и др.), то окажется, что они практически всегда различаются. Это различие можно рассматривать, как обусловленное только действием случайностей. Поэтому первоначально гипотезу всегда можно сформулировать таким образом: между двумя генеральными совокупностями нет ожидаемого различия. Такая гипотеза называется нулевой гипотезой и обозначается H0. Обратное ей утверждение о том, что в действительности между генеральными совокупностями есть различие, называется альтернативной гипотезой и обозначается H1. Итак, вначале выдвигается нулевая гипотеза, что различие между генеральными совокупностями (или их характеристиками) равно 0. Затем получают выборку или несколько выборок, и если выборочные данные не противоречат нулевой гипотезе, т.е. различия можно объяснить только случайностью выборки, то нулевая гипотеза принимается. А если полученные результаты не удается объяснить только действием случайных факторов, H0 отвергается, а принимается альтернативная.

48

 

– гипотеза об отсутствии различий.

 

Обозначается H0.

Нулевая

Х1–Х2=0; Х1; Х2 – сопоставляемые значения

признаков.

гипотеза

Это то, что мы хотим опровергнуть,

 

 

если перед нами стоит задача доказать

 

значимость различий.

 

– это гипотеза о значимости различий.

Альтернативная

Обозначается H1.

Это то, что мы хотим чаще всего доказать,

гипотеза

поэтому ее иногда называют

 

 

экспериментальной.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, т. е. подтвердить нулевую гипотезу, например, что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам требуется доказать значимость различий, так как они более информативны для исследователя в поиске нового.

Нулевая и альтернативная гипотезы могут быть направленными и ненаправленны-

ми. Если замечено, что в одной из групп индивидуальные значения испытуемых по какомулибо признаку выше, чем в другой, то для проверки значимости этих различий необходимо сформулировать направленные гипотезы. Или же под влиянием каких-либо экспериментальных воздействий произошли более выраженные изменения в одной группе испытуемых, чем во второй.

Направленные гипотезы

Н0: Х1 не превышает Х2

Н1: Х1

превышает Х2

 

Если же необходимо доказать, что различаются формы распределения признака в одной и другой группах, то формулируются ненаправленные гипотезы.

Ненаправленные гипотезы

Н0: Х1 не отличается от Х2

Н1: Х1

отличается от Х2

 

Гипотезы предстоит проверить с помощью какого-либо метода – критерия.

6.2.2. Ошибки при проверке гипотез. Уровни статистической значимости

Статистическая проверка гипотез, основанная на экспериментальных, выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. Ошибки, допускаемые при проверке гипотез, можно разделить на два типа.

Отклонение гипотезы Н0, в то время как она верна

Принятие гипотезы Н0, в то время как она неверна

ошибка 1-го рода. Вероятность ошибки 1-го рода обозначается . Вероятность же правильного решения: 1 .

ошибка 2-го рода. Вероятность ошибки 2-го рода обозначается .

Поскольку исключить ошибки при принятии статистических гипотез невозможно, то необходимо минимизировать возможные последствия, т. е. принятие неверной статистической гипотезы. В большинстве случаев единственный путь минимизации ошибок заключается в увеличении объема выборки.

При обосновании статистического вывода следует решить вопрос, где же проходит линия между принятием и отвержением нулевой гипотезы. Так как в эксперименте имеются

49

случайные влияния, эта граница не может быть проведена абсолютно точно. Она базируется на понятии уровня значимости.

Статистическая значимость результата (p-уровень) – количественная мера уверенности в его «истинности». Более высокий p-уровень соответствует более низкой надежности (уров-

ню доверия) результата: 1 p . Величину

 

еще называют доверительной вероятностью.

Уровень значимости р представляет собой вероятность ошибки, связанной с распростране-

нием наблюдаемого результата на генеральную совокупность.

p 0.05

показывает, что име-

ет место 5% вероятность того, что найденная в выборке связь между переменными является лишь случайной особенностью данной выборки. Таким образом, уровень значимости – это вероятность того, что мы сочли различия существенными, а они на самом деле случайны. Если мы указываем, что различия достоверны на 1% уровне значимости ( p 0.01), то имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0.01. В сущности,

уровень значимости р представляет собой вероятность ошибки 1-го рода .

Любая гипотеза должна формулироваться, а уровень значимости задаваться исследователем всегда до получения экспериментальных данных, по которым эта гипотеза будет проверяться. При выборе уровня значимости исследователь исходит из практических соображений: какую вероятность ошибки он считает допустимой для его конкретной задачи.

Исторически сложилось, что в прикладных науках, использующих статистику, принято

считать:

 

 

 

 

( p 0.05)

 

● низшим уровнем статистической значимости 5% уровень

;

 

● достаточным – 1% уровень

( p 0.01)

;

 

 

 

 

 

 

● высшим – 0.1% уровень

( p 0.001)

.

 

 

 

 

 

 

 

 

Поэтому в статистических таблицах критических значений обычно приводятся значения критериев, соответствующих данным уровням статистической значимости. Как видим, наибольшая величина, или нижняя граница, уровня статистической значимости равна 0.05 – это означает, что допускается пять ошибок в выборе из ста элементов (случаев испытуемых).

Для некоторых критериев указан точный уровень для различных эмпирических значений. Заметим также, что в современных статистических пакетах для компьютеров используются не стандартные уровни значимости, а уровни, подсчитываемые непосредственно в процессе работы с соответствующим статистическим методом. Эти уровни могут иметь различное числовое выражение в интервале от 0 до 1.

6.3. Статистические критерии

6.3.1. Понятие о статистических критериях

Под критерием вообще понимают решающее правило, обусловливающее поведение в ситуации выбора.

Статистический критерий – правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью. Статистические критерии обозначают также метод расчета определенного числа и само это число (значение критерия).

Процедура проверки гипотез сводится к вычислению эмпирического значения критерия (эту величину называют еще статистикой критерия) по выборочным данным. Найденное значение сравнивается с критическим (граничным) значением критерия, взятым из соответствующих таблиц, и по результатам сравнения делается вывод о принятии гипотезы или же

50

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]