Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Shpory_po_mm.doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
13.44 Mб
Скачать

2.11. Анализ качественных признаков

Среднее выборочных долей

Нормальное распределение служит хорошим приближением, если

и В этом случае: .

СРАВНЕНИЕ ДОЛЕЙ

Критерий Z, аналогичный критерию Стьюдента t :

Z =

Пусть - выборочные доли.

Стандартная ошибка разности долей:

Следовательно:

Объединяя выборки, чувствительность критерия Z можно повысить:

если справедлива нулевая гипотеза, то - оценки одной и той же доли, которую можем оценить как .

Тогда :

или с поправкой Йейтса на непрерывность:

Примеры сравнение качественных признаков.

1) Тромбозы шунта при приеме плацебо и аспирина

Группа

Тромбоз есть

Тромбоза нет

Плацебо (25 чел.)

18

7

Аспирин (19 чел.)

6

13

Всего 44 чел.

24

20

χ2 = 5,57 (без поправки 7,10)

2) Операционная летальность при галотановой и морфиновой анестезии

Группа

Живы

Умерли

Галотан (61 чел.)

53

8

Морфин (67 чел.)

57

10

Всего 128 чел.

110

18

χ2 = 0,09

χ2=

Замечание: С поправкой Йейтса только при ν = 1, т.е. для таблиц 2×2.

3) Частота обращения к врачу

Группа

Обращались

Не обращались

Контрольная (54 чел.)

14

40

Физкультурницы (23 чел.)

9

14

Спортсменки (88 чел.)

46

42

Всего 165 чел.

69

96

χ2 = 9,63

2.12 Доверительный интервал для среднего.

(лишнее сами уберете)

Характеристика положения распределения на числовой оси называется средним. Среднее по совокупности обозначают греческой буквой μ (читается «мю») и вычисляют по формуле:

Сумма значений признака для всех

членов совокупности

Среднее по совокупности = -------------------------------------------

Число членов совокупности

Эквивалентное математическое выражение имеет вид

где X — значение признака, N — число членов совокупности. Как всегда, большая греческая буква (читается «сигма») обозначает сумму.

Ясно, что для характеристики разброса все равно, в какую сторону отклоняется значение — в большую или меньшую. Иными словами, отрицательные и по­ложительные отклонения должны вносить равный вклад в ха­рактеристику разброса. Воспользуемся тем, что квадраты двух равных по абсолютной величине чисел равны между собой, и вычислим средний квадрат отклонения от среднего. Этот пока­затель носит название дисперсии и обозначается σ2. Чем больше разброс значений, тем больше дисперсия. Дисперсию вычисля­ют по формуле:

Как видно из формулы, дисперсия измеряется в единицах, равных квадрату единицы измерения соответствующей величи­ны. Например, дисперсия измеряемого в сантиметрах роста сама измеряется в квадратных сантиметрах. Это довольно неудобно. Поэтому чаще используют квадратный корень из дисперсии стандартное отклонение σ (маленькая греческая буква «сигма»):

Стандартное отклонение измеряется в тех же единицах, что исходные данные.

Об­следовать все объекты совокупности удается редко: обычно до­вольствуются изучением выборки, полагая, что эта выборка отра­жает свойства совокупности. Выборку, отражающую свойства совокупности, называют представительной. Имея дело с выбор­кой, мы, конечно, не узнаем точных значений среднего и стан дартного отклонения, но можем оценить их. Оценка среднего, вычисленная по выборке, называется выборочным средним. Выборочное среднее обозначают X и вычисляют по формуле:

где п — объем выборки.

Оценка стандартного отклонения называется выборочным стадартным отклонением (S) и определяется следующим образом:

Эта формула отличается от формулы для стандартного отклонения по совокупности. Во-первых, среднее μ заменяется его выборочной оценкой — X (с чертой наверху). Во-вторых, в знаменателе из числа членов выборки вычитается единица, т.к. разброс значений в пределах выборки никогда не бывает столь большим, как во всей совокупности, и деление не на n, а на n-1 компенсирует возникающее занижение оценки стандартного отклонения.

Величина SX служит мерой точности, с которой выборочное среднее X является оценкой среднего по совокупности μ Поэтому SX носит название стандартной ошибки среднего.

Истинная стандартная ошибка среднего по выборкам объемом n, извлеченным из совокупности, имеющей стандартное отклонение σ, равна:

Собственно стандартная ошибка — это наилучшая оценка величины σX по одной выборке:

где SX— выборочное стандартное отклонение.

Найдем доверительный интервал для средне­го. Определив выборочное среднее X(c чертой наверху), мы понимаем, разумеется, что это всего лишь выборочная оценка истинного среднего μ, кото­рое, впрочем, скорее всего находится где-то поблизости. «Где-то поблизости» можно охарактеризовать количественно, то есть ука­зать интервал, в котором с заданной вероятностью k находится ис­тинное среднее. Это и будет k-процентный доверительный интер­вал для среднего.

Примерно в 95% случаев выборочное среднее уклоняется от истинного не более чем на две стандартные ошибки среднего. Осталось внести некоторые уточнения.

Ранее мы выяснили, что величина

Разность выборочных средних - Разность истинных средних

t = ------------------------------------------------------------

Стандартная ошибка разности выборочных средних

подчиняется распределению Стьюдента. Можно показать, что

Выборочное среднее - Истинное среднее

t = ------------------------------------------------------------

Стандартная ошибка среднего

также подчиняется распределению Стьюдента. Математическая запись для последней величины выглядит так:

Дальнейший вывод аналогичен выводу доверительного интервала для разности истинных средних.

Далее вывод дов. интервала для разности истинных средних.

Критерий Стьюдента определяется как

Разность выборочных средних

t = -----------------------------------------------------------------

Стандартная ошибка разности выборочных средних

Вычислив t, его сравнивают с критическим значением tа для заданного уровня значимости α. Для двух случайных выборок из одной совокупности вероятность получить значение t, по абсолютной величине превышающее tа, весьма мала (а именно, не превышает α; уровень значимости α — это максимальная приемлемая вероятность ошибочно признать существование различий там, где их нет). Поэтому, получив «большое» значение t, мы делаем вывод о статистической значимости различий.

Для случайных выборок, извлеченных из одной совокупности, распределение всех возможных значений t (распределение Стьюдента) симметрично относительно среднего, равного нулю.

Если же выборки извлечены из двух совокупностей с разными средними, то распределение всех возможных значений t будет иметь среднее, отличное от нуля .

Формулу для t можно видоизменить так, чтобы распределение t было всегда симметрично относительно нуля:

Разность выборочных средних - Разность истинных средних

t = --------------------------------------------------------------------------------

Стандартная ошибка разности выборочных средних

Если обе выборки извлечены из одной совокупности, то разность истинных средних равна нулю и в этом случае новая формула совпадает с предыдущей.

Вот математическая запись новой формулы:

Поскольку истинных средних (то есть средних по совокупности) мы не знаем, то и вычислить значение t по этой формуле мы не можем. Но эта формула и не предназначена для нахождения t. Она позволяет сделать другое — оценить разность μ1 - μ2. то есть истинную величину различий. Для этого вместо вычисления t выберем его подходящее значение и, подставив в формулу, вы числим величину μ1 - μ2. Как выбрать «подходящее» значение?

По определению 100α процентов всех возможных значений t расположены левее -tа или правее +tа. Остальные 100(1 - α) процентов значений t попадают в интерл от -tа до +t„. Например, 95% значений t находится в интервале от -t0.05 до +t0.05 Значит, в 100(1 -а) процентах всех случаев

Преобразуя это неравенство получаем

Таким образом, разность истинных средних отличается от разности выборочных средних менее чем на произведение tа и стандартной ошибки разности выборочных средних. Это неравенство задает доверительный интервал для разности средних μ1 - μ2 K примеру, 95% доверительный интервал для разности средних определяется неравенством

В этот интервал разность истинных средних попадет в 95% случаев.

Формула 100(1 -а)-процентного доверительного интервала для среднего:

где tа — критическое значение (для уровня значимости а и числа степеней свободы V = n-1 (n — объем выборки).

Смысл доверительного интервала для среднего совершенно аналогичен смыслу доверительного интервала для разности средних. Приводя k-процентный доверительный интервал среднего, мы утверждаем, что вероятность того, что истинное среднее находится в этом интервале, равна к. Иными словами, если по лучить все возможные выборки из некоторой совокупности и для каждой рассчитать k-процентный доверительный интервал, то доля интервалов, содержащих среднее по совокупности (ис тинное среднее), составит к.

Вычислить доверительный интервал несложно, однако — ес ли объем выборки достаточно велик — можно пользоваться и приведенным выше «правилом двух стандартных ошибок». Для выборок, имеющих объем от 20 и выше, t0.05 приблизительно равно 2 (см. табл. 4.1), и мы получим достаточно точный результат. Если же объем выборки меньше 20, доверительный интервал окажется зауженным, а наше представление о точности, с какой мы можем судить об истинном среднем, — преувеличенным.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]