- •Генеральная совокупность и выборка
- •Статистическое распределение выборки
- •1. Статистическое дискретное распределение. Полигон.
- •Генеральная средняя
- •Выборочная средняя
- •Включает ли ди какие-либо значения, представляющие особый интерес?
- •1. Способ оценки достоверности с помощью определения ошибок репрезентативности
- •2. Определение доверительных границ средних и относительных величин
- •Метод стандартизации
- •2. Проверка гипотезы о виде распределения
- •Задачи анализа.
- •Расчет теоретических данных.
- •Определение соответствия эмпирических и теоретических данных. Критерий χ2.
- •Критерий χ2 для произвольной таблицы.
- •Аналитические методы
- •Элементы теории корреляции
- •Линейная регрессия
- •Метод наименьших квадратов (мнк)
- •Проверка гипотезы о значимости коэффициента регрессии.
- •Корреляционный анализ.
- •Линейная корреляция
- •Выборочный коэффициент корреляции.
- •Проверка гипотезы о значимости коэффициента корреляции.
- •Проверка гипотезы о значимости коэффициента регрессии.
- •Проверка гипотезы о значимости коэффициента корреляции.
Насколько широк ДИ? Широкий ДИ указывает на менее точную оценку, узкий - на более точную оценку.
Какой клинический (биологический) смысл можно извлечь из рассмотрения ДИ? Верхние и нижние пределы показывают, будут ли результаты клинически (биологически) значимы.
Включает ли ди какие-либо значения, представляющие особый интерес?
Можно проверить, попадает ли вероятное значение для параметра популяции в пределы ДИ. Если да, то результаты согласуются с этим вероятным значением. Если нет, то маловероятно (для 95% ДИ шанс меньше 5%), что параметр имеет это значение.
1. Способ оценки достоверности с помощью определения ошибок репрезентативности
Средняя ошибка средней арифметической величины определяется по формуле:
,
где σ - среднеквадратическое отклонение;
n
-
число наблюдений.
Ошибка относительного показателя определяется по формуле:
,
где p — показатель, выраженный в %, %о,%оо
и
т.д.
q = (100 – p) при p, выраженном в %; или (1000 – p) при p, выраженном в %о;
(10 000 — p) при p, выраженном в %оо и т.д.
При числе наблюдений меньше 30 ошибки репрезентативности определяются, соответственно, по формулам:
и
Результат
считается достоверным (Р или
),
если он, соответственно, превышает
удвоенную или утроенную ошибку
репрезентативности:
≥2-3
;
Р≥2-3
(при n>30).
2. Определение доверительных границ средних и относительных величин
Формулы определения доверительных границ представлены следующим образом:
для средних величин ( ): ген= выб ± t
для относительных показателей (Р): Рген=Рвыб ± t , где ген и Рген — соответственно, значения средней величины и относительного показателя генеральной совокупности;
выб и Рвыб - значения средней величины и относительного показателя выборочной совокупности; - ошибка репрезентативности; t - критерий достоверности (доверительный коэффициент).
Данный способ применяется в тех случаях, когда по результатам выборочной совокупности необходимо судить о размерах изучаемого явления (или признака) в генеральной совокупности.
Обязательным условием для применения способа является репрезентативность выборочной совокупности. Для переноса результатов, полученных при выборочных исследованиях, на генеральную совокупность необходима степень вероятности безошибочного прогноза (Р), показывающая, в каком проценте случаев результаты выборочных исследований по изучаемому признаку (явлению) будут иметь место в генеральной совокупности.
При определении доверительных границ средней величины или относительного показателя генеральной совокупности исследователь сам задает определенную (необходимую) степень вероятности безошибочного прогноза Р.
Для большинства медико-биологических исследований считается достаточной степень вероятности безошибочного прогноза Р=95,5%, т.е. число случаев генеральной совокупности, в которых могут наблюдаться отклонения от закономерностей, установленных при выборочном исследовании, не будет превышать 5%. При ряде исследований, связанных, например, с применением высокотоксичных веществ, вакцин, оперативного лечения и т.п., в результате чего возможны тяжелые заболевания, осложнения, летальные исходы, применяется степень вероятности Р=99,7%, т.е. не более чем у 1% случаев генеральной совокупности возможны отклонения от закономерностей, установленных в выборочной совокупности.
Заданной степени вероятности Р безошибочного прогноза соответствует определенное, подставляемое в формулу, значение критерия t, зависящее также и от числа наблюдений.
При n>30 степени вероятности безошибочного прогноза Р=99,7% соответствует значение t=3, а при Р=95,5% - значение t=2. При n<30 величина t при соответствующей степени вероятности безошибочного прогноза определяется по специальной таблице (Н.А.Плохинского).
ЗАДАЧА-ЭТАЛОН
на определение ошибок репрезентативности ( ) и доверительных границ средней величины генеральной совокупности ( ген) при числе наблюдений больше 30.
Условие задачи: при изучении комбинированного воздействия шума и низкочастотной вибрации на организм человека было установлено, что средняя частота пульса у 36 обследованных водителей сельскохозяйственных машин в кооперативном хозяйстве через 1 ч работы составила 80 ударов в 1 минуту; σ= ±6 уд/мин.
Задание: определить ошибку репрезентативности ( м) и доверительные границы средней величины генеральной совокупности ( ген).
РЕШЕНИЕ
1. Вычисление стандартной ошибки средней арифметической (ошибки репрезентативности) ( ):
уд./мин
2. Вычисление доверительных границ средней величины генеральной совокупности ( ген). Для этого необходимо:
а) задать степень вероятности безошибочного прогноза (Р=95,5%);
б) определить величину критерия t. При заданной степени вероятности (Р=95,5%) и числе наблюдений больше 30 величина критерия t равна 2 (t=2).
Тогда ген= выб±t = 80±2*1=80 ± 2 уд/мин.
Вывод: установлено с вероятностью безошибочного прогноза Р=95,5%, что средняя частота пульса в генеральной совокупности, т.е. у всех водителей сельскохозяйственных машин в этом хозяйстве, через 1 ч работы в аналогичных условиях будет находиться в пределах от 78 до 82 ударов в минуту, т.е. средняя частота пульса менее 78 и более 82 ударов в минуту возможна не более чем у 5% случаев генеральной совокупности.
ЗАДАЧА-ЭТАЛОН
на определение ошибок репрезентативности (m) и доверительных границ относительного показателя генеральной совокупности (Рген)
Условие задачи: при медицинском осмотре 164 детей 3-летнего возраста, проживающих в одном из районов города Н., в 18% случаев обнаружено нарушение осанки функционального характера.
Задание: определить ошибку репрезентативности (mР) и доверительные границы относительного показателя генеральной совокупности (Рген).
РЕШЕНИЕ
1. Вычисление ошибки репрезентативности относительного показателя:
2. Вычисление доверительных границ средней величины генеральной совокупности (Рген) производится следующим образом:
а) необходимо задать степень вероятности безошибочного прогноза (Р =95%);
б) при заданной степени вероятности и числе наблюдений больше 30 величина критерия t равна 2 (t = 2).
Тогда Рген=Рвыб ±t = 18% ± 2*3 = 18% ± 6%.
Вывод: установлено с вероятностью безошибочного прогноза Р=95%, что частота нарушения осанки функционального характера у детей 3-летнего возраста, проживающих в городе Н., будет находиться в пределах от 12 до 24% случаев на 100 детей.
Нормальное распределение и его параметры.
Нормальное распределение впервые было найдено Абрахамом де Муавром в первой половине XVIII в. (1733г). Затем в начале XIX в. было использовано в работах Гаусса и Лапласа и, по существу, было открыто заново. Под влиянием классических работ Гаусса и Лапласа долгие годы считалось непререкаемой истиной, что все возможные распределения при достаточно большом количестве наблюдений приближаются к нормальному распределению, как некоему идеалу. Подобное утверждение, безусловно, слишком смелое, но тем не менее множество биологических и медицинских показателей, таких как показатели физического развития (вес, рост, давление, температура тела, уровень гормонов), составляющие плазмы крови, демографические и другие показатели следуют нормальному распределению.
Нормальное распределение представляет собой семейство кривых. Каждая кривая это колоколообразный график, на котором по горизонтальной оси откладывается величина эффекта, а на вертикальной – количество пациентов, у которых наблюдался эффект данной величины.
Кривая
полностью определяется двумя параметрами,
средним и среднеквадратическим
отклонением. Факт
указанного распределения записывают
таким образом:
.
Основные характеристики нормального распределения:
-
равенство
числовых характеристик
(среднее, мода и медиана равны между
собой);
- симметричность отклонений от среднего значения;
- общая площадь под кривой равна 1;
- хвосты кривой в обоих направлениях уходят в бесконечность, непрерывно приближаясь, но,
никогда не касаясь, горизонтальной оси, т.е. хвосты асимптотически стремятся к
горизонтальной оси;
- форма кривой определяется среднеквадратическим отклонением генеральной совокупности;
- распределениям с малыми среднеквадратическими отклонениями соответствуют узкие,
вытянутые вверх кривые, а распределениям с большими среднеквадратическими отклонениями
более пологие кривые с менее выраженными вершинами (малые отклонения более вероятны,
большие - менее вероятны);
Правило 3-х сигм
68,25%
всех значений лежит в интервале
±σ
(±1 среднеквадратическое отклонение от
среднего);
95,44% всех значений лежит в интервале ±2σ (±2 среднеквадратических отклонений от среднего);
99,73% всех значений лежит в интервале ±3σ (±3 среднеквадратических отклонений от среднего).
Пример. Приведены результаты измерения частоты пульса у некурящих студентов-медиков в возрасте 20 лет: 68, 58, 65, 55, 70, 62, 60, 65, 70, 58, 62, 58, 62, 60, 60, 65, 62, 55, 62, 58, 60, 70, 62, 65, 60, 68, 65, 62, 68, 65, 60, 62, 60, 68, 65, 60, 62, 60, 65, 62, 68. Найти дискретный, интервальный ряды распределения, моду, медиану, выборочную среднюю, дисперсию, среднее квадратическое отклонение, доверительный интервал. Построить полигон частот, гистограмму частот, гистограмму относительных частот. Проверить подчиняется ли выборка нормальному закону распределения (выполнение правила 3-х сигм).
Решение. Построим вариационный ряд: 55, 55, 58, 58, 58, 58, 60, 60, 60, 60, 60, 60, 60, 60, 60, 62, 62, 62, 62, 62, 62, 62, 62, 62, 62, 65, 65, 65, 65, 65, 65, 65, 65, 68, 68, 68, 68, 68, 70, 70, 70.
Дискретный статистический ряд распределения
|
55 |
58 |
60 |
62 |
65 |
68 |
70 |
|
2 |
4 |
9 |
10 |
8 |
5 |
3 |
|
|
|
|
|
|
|
|
Полигон частот
Мода
М0=62.
Медиана
Выборочная
средняя
– средняя
частота пульса у некурящих студентов-медиков.
Выборочная дисперсия
Выборочное
среднее квадратическое отклонение:
.
Найдем меру относительного разброса данных: коэффициент вариации
.
Величина коэффициента вариации, равная 6,2%, свидетельствует о слабом разнообразии признака. Таким образом, изучаемую совокупность можно считать однородной.
Величину
отклонения выборочного показателя от
его генерального параметра
называют стандартной
ошибкой среднего (нельзя путать со
средним квадратичным отклонением
изучаемой случайной переменной):
Доверительный
интервал для выборочного среднего
значения
находится между границами
и
,
где
- стандартная
ошибка среднего,
-
коэффициент Стьюдента, величина,
зависящая от объема выборки
(или
соответствующего числа
степеней свободы
)
и выбранного уровня доверительной
вероятности, определяется по таблице
распределений Стьюдента.
Интервальный статистический ряд распределения
Определим количество интервалов по формуле Стерджеса.
Определим
величину шага интервала
.
Интервалы группировки |
|
|
|
|
|
|
|
Частоты |
2 |
4 |
9 |
10 |
8 |
5 |
3 |
Гистограмма частот
0
x
4,5
4,1
3,64
2,27
2,27
1,82
1,34
0,91
55
57,2
66
68,2
70,4
Правило 3-х сигм
68,25% всех значений лежит в интервале ±σ;
95,44% всех значений лежит в интервале ±2σ;
99,73% всех значений лежит в интервале ±3σ.
,
т.е. в интервале
расположено 27 вариант из 41, что составляет
65,85% от объема выборки.
,
.
Согласно этим данным можно сделать вывод, что выборка подчиняется нормальному закону распределения.
Задания
1. Рост 20 мальчиков в возрасте двух лет (в см) равен: 96, 96, 95, 86, 88, 90, 91, 90, 91, 90, 90, 92, 92, 89, 88, 88, 87, 93, 93, 97. Найти дискретный, интервальный ряды распределения, моду, медиану, выборочную среднюю, дисперсию, среднее квадратическое отклонение, коэффициент вариации, доверительный интервал. Построить полигон частот, гистограмму частот, гистограмму относительных частот. Проверить подчиняется ли выборка нормальному закону распределения (выполнение правила 3-х сигм).
2. При измерениях в однородных группах обследуемых получены следующие выборки: 12, 14, 12, 13, 14, 15, 14, 14, 12, 14 (частота дыхания). Найти дискретный, интервальный ряды распределения, моду, медиану, выборочную среднюю, дисперсию, среднее квадратическое отклонение, коэффициент вариации, доверительный интервал. Построить полигон частот, гистограмму частот, гистограмму относительных частот. Проверить подчиняется ли выборка нормальному закону распределения (выполнение правила 3-х сигм).
3. Из продукции, произведенной фармацевтической фабрикой за месяц, случайным образом отобраны 15 коробочек некоторого гомеопатического препарата, количество таблеток в которых оказалось равным соответственно 50, 51, 48, 52, 50, 49, 50, 47, 50, 51, 49, 50, 52, 48, 49. Найти дискретный, интервальный ряды распределения, моду, медиану, выборочную среднюю, дисперсию, среднее квадратическое отклонение, коэффициент вариации, доверительный интервал. Построить полигон частот, гистограмму частот, гистограмму относительных частот. Проверить подчиняется ли выборка нормальному закону распределения (выполнение правила 3-х сигм).
