Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_po_mm.doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
13.44 Mб
Скачать

2.18 Критерий знаков z

В тех случаях, когда результаты наблюдений выражаются не числами, а знаками плюс (+) и минус (), различия между попарно связанными членами выборок оценивают с помощью критерия знаков z. Конструкция этого критерия базируется на следующих соображениях: если попарно сравниваемые значения двух зависимых выборок существенно не отличаются друг от друга, то число плюсовых и минусовых разностей окажется совершенно одинаковым; если же заметно преобладают плюсы или минусы, это будет указывать на положительное или отрицательное действие изучаемого фактора на результативный признак

Пример. Влияние туберкулина на состав периферической крови

Номер

подопытных животных

Эозинофилия в крови

Эффект

воздействия

до введения

туберкулина

после введения туберкулина

1

++

++

0

2

+++

++

+

3

++

+

+

4

++

++

+

5

+++

++

+

6

++

+++

-

7

++

+

+

8

+

++

-

9

+++

++

+

10

++

+

+

11

++

++

0

12

+++

+

+

13

++

+

+

14

++

+

+

Их 14 наблюдений два оказались нулевыми, n = 14 2 = 12.

Из этого числа положительных разностей насчитывается 10.

Следовательно, zФ = 10.

Из таблицы для n = 12 и = 5% находим zst = 10.

Равенство zФ = zst дает основание отвергнуть гипотезу Н0 на 5 % уровне значимости. Следовательно, с вероятностью 95 % можно утверждать, что введение туберкулина (реакция Манту) вызывает заметное снижение эозинофилов в периферической крови.

2.19 U - Критерий Манна-Уитни для двух независимых выборок

(U-критерий Уилкоксона)

Гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности или к совокупностям с одинаковыми параметрами т.е. Н0 – гипотезу можно проверить с помощью рангового критерия Уилкоксона.

- Расположить значения сравниваемых выборок в возрастающем порядке в один общий ряд и пронумеровать члены ряда от 1 до

N = n1 + n2 (Эти номера и будут рангами членов ряда);

Выборка 1 ( объема n1 )

Выборка 2 ( объема n2 )

наблюдение

ранг

наблюдение

ранг

х11

r11

х12

r12

х21

r21

х22

r22

·

·

·

·

·

·

·

·

х n1 1

r n1 1

х n2 2

r n2 2

Сумма

R1

Сумма

R2

Величины {хij} – реальные наблюдения. Определим n = n1 + n2. Числа { r ij } – ранги этих наблюдений. Они меняются от 1 до n.

Отдельно для каждой выборки найти суммы рангов R и определить величины U1 = R1 n1(n1+1)/2

И U2 = R2 n2(n2+1)/2

Которые отображают связь между суммами рангов первой и второй выборки. В качестве U критерия использовать меньшую величину Uф , которую сравнить с табличным значением Ust . Условием для сохранения принятой нулевой гипотезы служит неравенство Uф > Ust.

Вычисление значения критериальной статистики.

1) Малые выборки:

U1 = n1n2 + n1(n1+1)/2 –R1;U2 = n1n2 + n2(n2 + 1)/2 – R2; U = max (U1,U2). Нужно сравнить U с критическим значением для малых выборок.

2) Большие выборки:

Следует сравнить Т = (U – 0,5 n1n2) / { n1n2(n+1)/12 }0,5 с критическим значением для стандартного нормального распределения

Замечания: 1. Не имеет значения, как ранжируются наблюдения: от наименьшего до наибольшего или наоборот.

2. Если два или более наблюдения имеют в точности одинаковые значения, они называются совпадающими и в этом случае каждому из них следует приписать значения ранга, равное среднему из рангов, которые были бы им приписаны при отсутствии совпадений.

3. U1 + U2 = n ·n2

4. Не следует применять критерий к парным наблюдениям.

5. Если обе выборки извлечены из совокупностей, имеющих нормальные распределения с равными дисперсиями, то следует использовать более мощный критерий Стьюдента.

Пример. Уровень сывороточного холестерола

Самцы

Самки

уровень

ранг

уровень

ранг

226,5

9

221,5

3

224,1

7

230,2

12

218,6

1

223,4

5

220,1

2

224,3

8

228,8

10

230,8

13

229,6

11

223,8

6

222,5

4

Сумма рангов

44

47

U1 = 26, U2 = 16 и U = 26. Эта величина не является значимой, т.к. для уровня значимости 5% критическая область определяется неравенством U36. Принимается нулевая гипотеза о том, что средние равны.

Вариант U - критерия Манна-Уитни (U – критерия Уилкоксона)

- Отдельно для каждой выборки найти суммы рангов R и определить величины

U1 = R1n1(n1 + 1)/2 и U2 = R2n2(n2 + 1)/2 ;

- в качестве U-критерия использовать величину UФ, равную меньшей из U1 и U2, которую сравнить с табличным значением Ust. Условием для сохранения принятой Н0-гипотезы служит неравенство UФ > Ust. Критические точки U-критерия Ust для n1 , n2 и принимаемого уровня значимости α содержатся в соответствующей таблице.

2.20 T-критерий Манна-Уитни

Порядок вычисления критерия:

- Данные обеих групп объединяют и упорядочивают по возрастанию.

Ранг 1 присваивают наименьшему из всех значений, ранг 2 - следующему и т.д. Если значения совпадают, им присваивают один и тот же средний ранг.

- Для меньшей группы вычисляют Т – сумму рангов ее членов. Если численность групп одинакова, Т можно вычислить для любой из них.

- Полученное значение Т сравнивают с критическими значениями. Если Т меньше или равно первому из них либо больше или равно второму, то Н0-гипотеза отвергается (различия статистически значимы).

При n2n1 > 8 имеет стандартное нормальное распределение ( μТ = 0,5 n1 (n1 + n2 + 1) ; -стандартное отклонение). n1, n2 – объемы меньшей и большей выборок. μТ - средняя всех возможных значений Т.

Пример.Продолжительность бодрствования в первый час жизни, мин

По обычной методике

Ранг

По методике Лебуайе

Ранг

5,0

2

2,0

1

10,1

3

19,0

5

···

···

···

···

55,0

38

51,2

34

56,7

39

52,5

35

58,0

40

53,3

37

Сумма рангов : Т = 374 ; μТ = 20(20+20+1)/2=410 ;

и < 1,96

2.21. T-критерий Уилкоксона для парных выборочных наблюдений

Порядок вычисления значения критериальной статистики проводят по одному из следующих двух вариантов.

Вариант 1.

а) В случае малых выборок.

- Ранжируют абсолютные величины разностей в возрастающем порядке и приписывают им соответствующие ранги от 1 до n.

- Каждому значению ранга приписывают знак его разности.

- Вычисляют сумму значений положительных рангов и обозначают ее через N.

- Проверяют, принадлежит ли N критической области (по таблице значений критерия Уилкоксона).

б) В случае больших выборок.

Вычисляют N как в п. а) и полагают

Т = {Nn·(n+1) / 4} / {n·(n+1)·(2n+1)/ 24}1/2

и проверяют по таблице стандартного нормального распределения.

Вариант 2.

- Вычисляют величины изменений наблюдаемого признака. Отбрасывают пары наблюдений, которым соответствует нулевое изменение.

- Упорядочивают изменения по возрастанию их абсолютной величины и присваивают соответствующие ранги. Рангами одинаковых величин назначают средние тех мест, которые они делят в упорядоченном ряду.

- Присваивают каждому рангу знак в соответствии с изменением: если значение увеличилось – « + », если уменьшилось – « – ».

- Вычисляют величину W , равную сумме знаковых рангов.

- Сравнивают W с критическим значением. Если она больше критического значения, изменение показателя статистически значимо. Замечание:

Если число пар наблюдений больше 20, то распределение величины

близко к стандартному нормальному.

( здесь n – число пар наблюдений, т. е. численность групп

2.22 Общие принципы выбора уравнений регрессии. Прямая регрессия. Метод наименьших квадратов.(мне кажется, что первую часть не надо, но так в учебнике написано, а вторая часть полностью подходит)

Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимые случайные величины. Представим одну из величин как функцию другой. Ограничимся приближенным представлением величины Y в виде линейной функции величины X: g(x)=α+βX, где α и β – параметры, подлежащие определению. Это можно сделать различнами способами: наиболее употребительный из них – метод наименьших квадратов.

Функцию g(x)=α+βX называют наилучшим приближением Y в смысле метода наименьших квадратов, если математическое ожидание М (Y – g (X))2 принимает нименьшее возможное значение; функцию g(x) называют среднеквадратической регрессией Y на X.

Теорема. Линейная средняя квадратическая регрессия Y на X имеет вид: , где mx = M(X), my = M(Y), , , r = μxy/(σxσy) – коэффициент корреляции величин X и Y .

Доказательство. Введем в рассмотрение функцию двух независимых аргументов α и β: F(α, β)=M(Y-α-βX)2 .(1)

Учитывая, что M(X-mx) = M(Y-my) = 0, M[(X-mx)* (Y-my)] = μxy = rσx σy, и выполнив выкладки, получим .

Исследуем функцию F(α, β) на экстремум, для чего приравняем нулю частные производные:

Отсюда , .

Легко убедиться, что при любых значения α и β рассматриваемая функция принимает наименьшее значение.

Итак, линейная средняя квадратическая регрессия Y и X имеет вид

g(x)=α+βX= , или .

Коэффциент называют коэффициентом регрессии Y на X, а прямую (2) называют прямой среднеквадратической регрессии Y на X.

Подставив найденные значения α и β в соотношение (1), получим минимальное значение функции F(α, β), равное . Величину называют остаточной дисперсией случайной величины Y относительно случайной величины X; она характеризует величину ошибки, которую допускают при замене Y линейной функцией g(x)=α+βX. При r = ±1 остаточная дисперсия равна нулю; другими словами, при этих крайних значениях коэффициента корреляции не возникает ошибки при представлении Y в виде линейной функции от X.

Итак, если коэффициент корреляции r = ±1, то Y и X связаны линейной функциональной зависимостью.

Аналогично можно получить прямую среднеквадратической регрессии X на Y:

x-mx = r (Y-my) (3) и остаточную дисперсию величины X относительно Y.

Если r = ±1, то обе прямые регрессии, как видно из (2) и (3), совпадают.

Из уравнений (2) и (3) следует, что обе прямые регрессии проходят через точку (mx; my), которую называют центром совместного распределения величин X и Y.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]