Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка полностью - от sunflower.doc
Скачиваний:
7
Добавлен:
01.07.2025
Размер:
3.74 Mб
Скачать

Глава 17. Разнообразие признака в статистической совокупности. Оценка достоверности результатов исследования.

Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Например, в группе людей, однородной по возрасту, полу и месту жительства, рост и вес каждого человека отличается от роста и веса других людей. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности, а значит и средняя арифметическая величина находится в зависимости от колеблемости вариационного ряда. Чем меньше колеблемость ряда, то есть чем меньше амплитуда колебания ряда (разность между самой большой и самой малой вариантой), тем более точно его будет характеризовать средняя арифметическая.

Наиболее полную характеристику разнообразию признака в совокупности, степень варьирования вариационного ряда, дает так называемое среднее квадратическое отклонение, обозначаемое греческой буквой «сигма» - .

Существует два способа расчёта среднего квадратического отклонения: среднеарифметический и способ моментов.

При среднеарифметическом способе расчёта применяется формула:

, где

d – истинное отклонение варианты от истинной средней (v-).

Эта формула используется при небольшом числе наблюдений (n  30; р=1). При достаточно большом числе наблюдений (n>30; р>1) определяется средневзвешенное квадратическое отклонение по формуле:

, где

d2p – сумма произведения квадрата отклонения на частоту каждой варианты.

По способу моментов расчет среднего квадратического отклонения производится по формуле:

, где

а – условное отклонение варианты от условной средней (а=v);

- момент второй степени (при n>30);

- момент первой степени, возведенный в квадрат.

При числе наблюдений, равном 30 и менее, в момент второй степени n заменяется на (n-1).

Описанные способы расчета среднего квадратического отклонения требуют значительной вычислительной работы. Поэтому можно использовать приближенный способ вычисления среднего квадратичного отклонения по амплитуде вариационного ряда, с использованием формулы:

, где

А – коэффициент для определения , соответствующий числу наблюдений (табл.15).

Таблица 15

Определение среднего квадратического отклонения по амплитуде

Число наблюдений, n

Коэффициент для сигмы, А

Число наблюдений, n

Коэффициент для сигмы, А

Число наблюдений, n

Коэффициент для сигмы, А

1

2

3

4

5

6

7

8

9

10

-

1,13

1,69

2,06

2,33

2,53

2,70

2,85

2,97

3,08

32

34

36

38

40

4,14

4,19

4,24

4,28

4,32

420

440

460

480

500

5,98

6,00

6,02

6,06

6,09

50

60

70

80

90

4,50

4,64

4,76

4,85

4,94

520

540

560

580

600

6,12

6,13

6,14

6,17

6,18

11

12

13

14

15

16

17

18

19

20

3,17

3,26

3,34

3,41

3,47

3,53

3,59

3,64

3,69

3,74

100

120

140

160

180

200

5,01

5,15

5,26

5,35

5,43

5,50

620

640

660

680

700

6,21

6,23

6,26

6,27

6,28

220

240

260

280

300

5,57

5,61

5,68

5,72

5,77

750

800

850

900

950

6,33

6,34

6,37

6,43

6,47

22

24

26

28

30

3,82

3,90

3,96

4,03

4,09

320

340

360

380

400

5,80

5,84

5,88

5,92

5,94

1000

6,48

Помимо среднего квадратического отклонения (), существует еще один критерий, характеризующий уровень разнообразия величин признака в совокупности, – коэффициент вариации (Cv), который является относительной мерой разнообразия, так как исчисляется как процентное отношение  к средней арифметической величине (М) и высчитывается по формуле:

Для ориентировочной оценки степени разнообразия признака в практике пользуются следующими градациями коэффициента вариации: если коэффициент составляет более 20%, то говорят о сильном разнообразии; при 20-10%-среднее разнообразие; если же коэффициент менее 10%- то считается, что разнообразие слабое.

Коэффициент вариации применяют при сравнении степени разнообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Например, если необходимо сравнить степень разнообразия массы тела у новорожденных и 7-летних детей. Ясно, что у новорожденных  всегда будет меньше, чем у 7-летних детей, так как их индивидуальная масса меньше (табл. 16).

Таблица 16

Группа детей (мальчики)

Средняя масса (М), кг

, кг

Сv, (%)

Новорожденные

3,5

0,35

10

7-летние

24,7

3,88

15,7

Как видно из таблицы 16, в этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение (), а на относительную меру разнообразия – коэффициент вариации (С).

Кроме того, коэффициент вариации имеет большое значение для оценки и сопоставления степени разнообразия нескольких признаков с разной размерностью. Например, из данных таблицы 17 видно, что по среднему квадратическому отклонению нельзя судить о различии в степени разнообразия указанных признаков.

Таблица 17

Сравнение различных признаков совокупности по , и С.

Признак

М

Сv, (%)

Общий белок сыворотки крови

68г/л

4 г/л

5,8

СОЭ

9 мм/час

2 мм/час

22,0

Лейкоциты

8000/мм3

800

10,0

Только С позволяет сделать вывод, что наиболее разнообразным признаком в данном примере является СОЭ и менее разнообразным - общий белок крови.

Среднее квадратическое отклонение связано со структурой ряда распределения признака. Теорией статистики доказано, что при нормальном распределении в пределах М находится 68% всех случаев, в пределах М - 95,5% всех случаев и в пределах М3 - 99,7% всех случаев, составляющих совокупность, т.е. охватывает почти весь вариационный ряд (рис.2)

Рис.2 Теоретическая кривая распределения вариант в однородном вариационном ряду по сигмальным отклонениям (кривая Гаусса).

Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического применения среднего квадратического отклонения, особенно при разработке проблемы нормы и патологии. Так, в медицине (в здравоохранении) интервал М обычно принимается за пределы нормы.

Если при исследовании выясняется, что индивидуальные измерения находятся в пределах 95,5% всех наблюдений, т.е. стандартное отклонение от средней (М) составляет 2, то можно говорить о принадлежности исследуемого признака к фактору риска. В этом случае врач должен взять исследуемого пациента под диспансерное наблюдение, а в случае, когда стандартное отклонение от средней (М) составляет 3 врач должен направить исследуемого на консультацию к специалисту по выявленному признаку у данного индивидуума. Таким образом, среднее квадратическое отклонение является стандартным отклонением, позволяющим предвидеть вероятность появления первых признаков формирования патологии у пациента.

Кроме того, по среднему квадратическому отклонению можно определить коэффициент вариации при сравнении степени разнообразия разных признаков в одной совокупности или однородных признаков в разных совокупностях; определить структуру вариационного ряда; судить о типичности средней арифметической; оценить отдельные признаки у каждого индивидуума по стандартному отклонению t; определить ошибку средней арифметической величины mM (ошибки репрезентативности).

Оценка достоверности результатов исследования.

При изучении сплошной (генеральной) совокупности для ее числовой характеристики достаточно рассчитать М и .

На практике, как правило, врачу в большинстве медицинских исследований приходится иметь дело с частью изучаемого явления, т.е. с выборочной совокупностью, а выводы по результатам такого исследования переносить на все явления в целом – на генеральную совокупность. Для этого необходимо чтобы полученные результаты не искажали и правильно отображали объективную реальность, т.е. чтобы они были достоверными.

Под достоверностью статистических показателей следует понимать степень их соответствия отображаемой ими действительности. Оценивать достоверность результатов исследования означает определить с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность. Таким образом, оценка достоверности необходима для того, чтобы по части явления можно было бы судить о явлении в целом, о его закономерностях.

Оценка достоверности результатов исследования предусматривает определение:

  1. ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) – м;

  2. доверительных границ средних (или относительных) величин;

  3. достоверности разности средних (или относительных) величин – по критерию t;

  4. достоверности различия сравниваемых групп по критерию (хи-квадрата);

  5. «ожидаемого» уровня показателя (оценка нулевого эффекта).

Ошибка репрезентативности (m) является важнейшей стратегической величиной, необходимой для оценки достоверности результатов исследования. По величине ошибки репрезентативности определяют насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генеральной совокупности. Ошибки репрезентативности можно свести к достаточно малой величине, т.е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточного количества наблюдений (n):

Как видно из формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия () возможно путем увеличения числа наблюдений.

Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается mp:

mp где,

р – относительная величина, выраженная в долях единицы (%, %0, %00 и т.д.). Если показатель выражен в процентах, то q=100-р, если р – в промиллях, то q=1000-р, если р- в продецимиллях, то q=10000-р и т.д. n – число наблюдений; при числе наблюдений менее 30 в знаменатель следует взять n-1:

mp

Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представлена со своей средней ошибкой. Это дает возможность рассчитать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых показателей (результатов исследования).

Доверительные границы – это границы средних или относительных величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность.

Доверительные границы средней арифметической в генеральной совокупности определяются по формуле:

Мгенвыборtmм

Доверительные границы относительной величины в генеральной совокупности определяются по следующей формуле:

Ргенвыборtmр, где

Мген и Рген – значения средней и относительной величин, полученных для генеральной совокупности;

Мвыбор и Рвыбор – значения средней и относительной величин, полученных для выборочной совокупности;

mр и mм – ошибки репрезентативности выборочных величин;

t – доверительный критерий или критерий точности, который устанавливается при планировании исследования;

tm – доверительный интервал, причем tm=, где

 - предельная ошибка показателя, полученного при выборочном исследовании:

n – число наблюдений;

Для большинства медико-биологических и социальных исследований достоверными считаются доверительные границы, установленные с вероятностью безошибочного прогноза р=95% и более.

Определение достоверности разности средних или относительных величин по критерию t (критерий Стьюдента).

В медицине и здравоохранении во всех случаях при сопоставлении двух сравниваемых величин возникает необходимость не только определить их разность, но и оценить ее достоверность.

Достоверность разности величин, полученных при выборочных исследованиях, означает, что вывод об их различии может быть перенесен на соответствующие генеральные совокупности. Достоверность выборочной разности измеряется доверительным критерием (критерием точности t или критерием Стьюдента), который рассчитывается для средних и относительных величин по формулам:

  • для средних величин:

  • для относительных величин: где,

М1212- параметры, получаемые при выборочных исследованиях;

m1,m2- их средние ошибки; t- критерий точности.

Разность достоверна при t ,что соответствует вероятности безошибочного прогноза, равной 95% и более (р ). Такая степень вероятности является вполне достаточной для большинства исследований, проводимых в медицине и здравоохранении.

При величине критерия t<2 степень вероятности безошибочного прогноза составляет p<95%,что требует необходимости получить дополнительные данные, увеличив число наблюдений, т.к. при такой степени вероятности невозможно утверждать, что полученная разность показателей достоверна с достаточной степенью вероятности.

Однако может случиться, что при увеличении численности выборки разность остается недостоверной. В этих случаях можно считать доказанным, что между сравниваемыми совокупностями не обнаружено различий по изучаемому признаку.

Рассмотренная методика оценки достоверности и разности результатов исследования позволяет проводить только попарное сравнение групп при обязательном наличии обобщающих параметров - средних арифметических (М1иМ2) или относительных величин(Р1 и Р2) и их средних ошибок(m).

Оценка достоверности различия сравниваемых групп по критерию соответствия или Хи-квадрату (2), в отличие от критерия t, проводится в тех случаях, когда нет необходимости знать величину того или оного параметра (среднюю или относительный показатель) и требуется оценить достоверность различия не только двух, но и большего числа групп.

Критерий 2 определяется по формуле:

, где

 - фактические (эмпирические) данные;

1 – «ожидаемые» (теоретические) дынные, вычисленные на основании «нулевой гипотезы»

 - знак суммы

В медицине и здравоохранении критерий соответствия 2 может быть использован для ответа на следующие вопросы: существенно ли отличаются друг от друга группы вакцинированных и невакцинированных по распределению их на больных и здоровых, т.е. эффективна ли вакцинация; существенно ли отличаются группы населения с разным среднедушевым доходом по распределению их на больных и здоровых, т.е. влияет ли материальное обеспечение на уровень заболеваемости.

«Нулевая гипотеза» («нулевой» эффект) – это предположение о том, что в сравниваемых группах отсутствует различие в распределении частот, т.е. когда показатель равен нулю (Р=0) или близок к нулю, а q=100% или когда показатель равен 100% (Р=100%), или близок к 100%, а q=0. В этом случае, если необходимо узнать, а каким бы мог быть показатель изучаемого явления при других условиях отбора (другое число наблюдений, другой состав больных по полу, возрасту и т.д.), пользуются формулой, по которой можно вычислить «ожидаемый» уровень показателя:

, где

а – результативный показатель (р)