Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лисицын 2013_1 / Глава 2.doc
Скачиваний:
270
Добавлен:
20.05.2015
Размер:
243.2 Кб
Скачать

2.9. Описание выборочной совокупности на основе теоретической модели распределения вероятностей

Полученные в выборочных исследованиях данные и характер их распределения могут только приблизительно охарактеризовать генеральную совокупность. Эмпирические (т.е. полученные опытным путем) данные можно сравнить с теоретическими моделями распределения вероятностей, которые описываются математическими методами. Когда полученное в исследовании распределение частоты вариант приближается к определенной теоретической модели (что оценивается специальными методами), можно применить теоретические знания об этой модели к исследуемой статистической совокупности и облегчить ее анализ, в том числе оценить возможность экстраполяции данных на генеральную совокупность.

Теоретические модели распределения вероятностей

Любой варьирующий признак называется в математике случайной переменной, а ее конкретные значения называют вариантами. Распределение вероятности показывает вероятность всех возможных значений случайной переменной, или вариант (см. также раздел 2.5). Теоретические модели распределения могут иметь свои закономерности, в зависимости от того, относится случайная переменная к дискретным (целочисленным) или непрерывным данным (т.е. которые могут принимать любые значения). К дискретным распределениям относятся, например, биноминальное распределение, распределение Пуассона. При дискретном распределении можно получить вероятность, соответствующую каждому значению случайной переменной. К непрерывным распределениям относятся нормальное распределение (Гауссовское) и хи-квадрат (х2). При непрерывном распределении можно получить вероятность только для определенных интервалов случайной переменной х (потому что существует бесконечное множество значений х).

Каждое теоретическое распределение характеризуется определенными показателями - среднее (), дисперсия (), а также другими показателями (например, показателями формы распределения и его симметричности). Все эти параметры в совокупности входят в аналитическое выражение, описывающее закон распределения данной переменной. Знание этих показателей позволяет описать статистическую совокупность.

Нормальное Гауссовское распределение. Это наиболее важное распределение в статистике. Большинство количественных признаков в биологии и медицине не имеют нормального распределения. Это необходимо учитывать при выборе статистических методов анализа таких признаков, в частности, отдавая предпочтение так называемым непараметрическим методам анализа. Графически такое распределение может быть описано кривой в форме колокола, симметричной относительно среднего (рис. 2.4). Теорией статистики установлено, что при нормальном распределении вариационного ряда в интервале:

находится 68% всех вариант, т.е. 68% всех вариант при нормальном распределении находится в интервале 1 квадратичного отклонения () от среднего М ();

находится 95% всех вариант, т.е. 95% всех вариант при нормальном распределении находится в интервале около 2 квадратичных отклонений () от среднего М ();

находится 99,7% всех вариант. т.е. почти 100% всех вариант при нормальном распределении находится в интер-

Рис. 2.4. Площади (% общей вероятности) под кривой для (а) нормального распределения х, со средним u и дисперсией о2 и (б) стандартного нормального распределения z

вале около 2,6 квадратичных отклонения () от среднего стандартного или нормального распределения - z. Для качественной оценки того, является ли выборочное распределение близким к нормальному, т.е. можно ли применить теоретические знания о нормальном распределении к выборочному, обычно выстраивают гистограмму (заключение о приблизительной "нормальности" распределения делают на основании того,

что оно имеет форму колокола и симметрично). Для надежной количественной проверки соответствия распределения нормальному закону используются специальные статистические критерии (Шапиро-Уилка, Колмогорова-Смирнова и др.). Все эти критерии имеются в большинстве популярных статистических пакетов (в частности, в таких, как STATISTICA и SPSS).

Оценка отклонения выборочных показателей от генеральных

Возможность экстраполяции показателей (среднее и среднее квадратичное отклонение), полученных в выборочном исследовании, на генеральную совокупность оценивают по ряду показателей и методов, которые рассчитывают с использованием теоретических моделей распределения вероятностей. Наиболее важные среди них: стандартная ошибка среднего, доверительный интервал и метод проверки гипотез (при сопоставлении 2 выборок и более).

Статистической ошибкой называют величину отклонения выборочного показателя от его генерального значения. Генеральное среднее можно оценить, делая выборки из генеральной совокупности. Затем можно оценить среднее на основе распределения среднего каждой из этих выборочных совокупностей.

В большинстве случаев у нас только одна выборка. Для измерения стандартной ошибки среднего (СОС или SEM - Standard Error

Means) используют формулу:

Большая стандартная ошибка среднего показывает, что оценка генерального среднего не точна. Небольшая ошибка показывает, что оценка среднего в выборке близка к генеральному среднему в популяции.

Для дополнительной оценки надежности выводов о параметрах выборочной совокупности вычисляют доверительные интервалы (ДИ), т.е. определяют интервалы, в которых с той или иной вероятностью находится значение генерального среднего. Вероятность того, что генеральное среднее попадет в этот интервал, называется доверительной (p) вероятностью. В медико-биологических исследованиях считается приемлемым значение p = 0,95 (или 95%), при этом вероятность выхода истинного значения параметра за пределы границ ДИ, не превышает 1-0,95 = 0,05 (5%).

ДИ для генерального среднего при объемах выборки порядка 50-100 наблюдений рассчитывают исходя из того, что распределение средних подчиняется нормальному закону, соответственно границы 95% ДИ могут быть рассчитаны на основе закономерностей нормального распределения:

Где 1,96 - это 95% квантиль нормального распределения, а SEM (СОС) - стандартная ошибка среднего.

При малых объемах выборки (<30-50) вместо квантиля нормального распределения используется квантиль ^-распределения Стьюдента. В этом случае нижняя и верхняя границы ДИ для генерального среднего имеют следующий вид:

Все значения коэффициента t, необходимые для расчета ДИ, берут из специальных таблиц; оно зависит от объема выборки n и уровня доверительной вероятности. В статистических пакетах границы ДИ вычисляются автоматически вместе с оценкой среднего и других параметров распределения.

При интерпретации ДИ важно понимать, что широкий интервал говорит о неточности оценки, узкий указывает на точную оценку.

Пример: доверительный интервал для среднего.

Мы заинтересованы в определении среднего возраста женщин при первых родах, у которых наблюдаются беспорядочные кровотечения. На выборке 49 таких женщин:

► средний возраст при рождении ребенка,= 27,01 года;

► стандартное отклонение, s = 5,1282 года;

► стандартная ошибка среднего

В этом случае двусторонний доверительный интервал для генерального среднего имеет следующие границы:

27,01 ± (2,011 х 0,7326) = (25,54; 28,48) лет,

где 2,011-95% точка (квантиль) t-распределения с 48= (49-1) степенями свободы.

Мы на 95% уверены, что истинный средний возраст женщин при первых родах с беспорядочными кровотечениями в популяции колеблется от 25,54 до 28,48 года. Этот интервал довольно узкий, отражает точную оценку. В общей популяции в 1997 г. средний воз-

раст при первых родах был 26,8 года. Так как 26,8 попадает в наш ДИ, это свидетельство того, что женщины с беспорядочными кровотечениями имеют тенденцию рожать в более старшем возрасте, чем другие женщины.

Заметим, что 99% ДИ (25,05; 28,97 года) немного шире, чем 95% ДИ, отражает наше увеличенное доверие, что среднее в популяции расположено в этом интервале.

Проверка статистических гипотез

Для подтверждения значимости различий при сравнении 2 выборок или более используют метод статистических гипотез, чтобы определить статистическую значимость предполагаемых различий между статистическими показателями, в частности, средними (X).Например, мы заинтересованы в сравнении распространенности курения среди мужчин и женщин. Но вполне возможно, что различий нет: это предположение принято называть нулевой гипотезой -. Гипотетически мы предполагаем, что эти показатели различаются - это альтернативная гипотеза Н1. Важно получить надежные подтверждения того, что нулевая гипотеза неверна. Смысл метода в том, что необходимо найти надежные аргументы в пользу того, что разница между сравниваемыми показателями 2 популяций не равна нулю, т.е. что различия между выборочными характеристиками носят неслучайный характер, и эти выборки относятся к совокупностям с разными генеральными параметрами. Этапы применения метода

► Сформулировать нулевую гипотезу. Например, распространенность курения у мужчин такая же, как и у женщин. Задать критический уровень статистической значимости - р (или пороговой величины вероятности ошибочного отклонения нулевой гипотезы). Чаще всего эту величину принимают равной 5%.

► Отобрать данные из выборок пациентов. Для нашего примера - это данные о распространенности курения у мужчин и у женщин.

► Выбрать тестовый статистический критерий, проверить корректность его использования в конкретных условиях (вид переменных, проверяемые статистические гипотезы и т.д.). Большинство ошибок использования тестовых статистических критериев обусловлено игнорированием этого этапа проверки корректности использования данного метода1. Статистика критерия (или величина критерия) - это математический показатель, имеющий определенные значения известного распределения вероятности, которые представлены в специальных таблицах (например, /-распределение Стьюдента, распределение хи-квадрат 2). Статистика вычисляется по специальной формуле из имеющихся данных по этим выборкам (например, для /-распределения Стьюдента - это коэффициент /). Упрощенно можно сказать, что статистика количественно определяет отношение разности соответствующих выборочных средних к ошибке такой разности (это верно, например, для критерия Стьюдента). Значение рассчитанной статистики критерия можно сравнить с табличными (если оно больше или равно табличному, то различие статистически значимо). Однако при использовании современных статистических пакетов необходимость обращения к таблицам отпадает, так как в результатах анализа содержится как сама величина этой статистики (критерия), так и достигнутый уровень статистической значимости. Чем больше значение рассчитанной статистики критерия и соответственно меньше достигнутый уровень статистической значимости р, тем сильнее аргументы против нулевой гипотезы, т.е. тем менее вероятно, что имеющаяся разница между выборочными показателями случайна. Для нашего случая статистика критерия исследует статистически значимую разницу между показателями распространенности курения в популяции мужчин и популяции женщин. ► Следующим шагом проверки статистической гипотезы является сравнение достигнутого уровня значимости используемого статистического критерия с критической, пороговой величиной уровня значимости (т.е. значимости ошибки суждения), например, равной 5%. Если достигнутый уровень значимости меньше критического, то нулевая гипотеза равенства распространенности курения в популяции мужчин и популяции женщин отвергается. И наоборот, если

1 См., например: http://www.biometrica.tomsk.ru/error. pdf

достигнутый уровень значимости критерия больше критического, например более 5%, это означает, что надежных аргументов, чтобы отвергнуть гипотезу равенства распространенности курения в популяции мужчин и популяции женщин, у нас нет. Однако не исключено, что в действительности в популяции есть различие в распространенности курения в популяции мужчин и популяции женщин. Но в силу ряда причин мы не смогли получить необходимые аргументы, отвергающие нулевую гипотезу равенства. Например, вследствие недостаточного объема наблюдений (малые объемы выборок). В этом случае имеет место малая мощность используемого статистического критерия либо фактическое различие распространенности курения в популяции мужчин и популяции женщин весьма мало, и для его обнаружения требуются гораздо большие объемы выборок.

► Интерпретировать вероятность (р) нулевой гипотезы. Теоретически мы полагаем, что если полученное достигнутое значение уровня значимости р <0,05, то нулевая гипотеза равенства не имеет оснований для принятия. При представлении результата очень важно всегда указывать точное значение р, поскольку это позволяет судить о надежности вывода. Например, нельзя принять нулевую гипотезу только на том основании, что р = 0,06. Также будет не совсем верно сказать, что нулевая гипотеза отвергнута, если р = 0,04. Поскольку эти значения уровней значимости близки к критическому уровню, имеет смысл использовать и другие методы проверки гипотез.

► Особое внимание следует обратить на обязательную проверку корректности использования выбранных статистических критериев. Практически все статистические критерии имеют те или иные ограничения для применения. В силу ряда причин традиционно в отечественной медицинской науке доминирует использование /-критерия Стьюдента, разработанного еще в 1908 г. английским ученым В. Госсетом. Данный критерий имеет 2 условия корректного использования:

1) нормальность распределения количественного признака в обеих сравниваемых группах;

2) равенство генеральных дисперсий количественного признака в 2 сравниваемых группах. Как видим, для проверки этих 2 ограничений следует использовать уже другие статистические критерии. Нарушение этих ограничений влечет за собой ошибочные выводы, причем чаще о наличии значимых различий 2 сравниваемых генеральных средних, когда в действительности таких различий нет1.

Соседние файлы в папке Лисицын 2013_1