Учебник (Лисицын) - общественное здоровье и здравоохранение
.pdf
Рис. 9. Основные типы распределения признаков статистической совокупности.
Второе свойство статистической совокупности - средний уровень признака - число, являющееся обобщенной характеристикой того или другого количественного признака статистической совокупности.
Средний уровень признака определяется средними величинами:
1.Мода (Мо) - самая частая варианта.
2.Медиана (Ме) - варианта, расположенная посередине ряда.
3.Средняя арифметическая (М).
где А - условная средняя арифметическая, а = (V-A)/i - отклонение (отличие) каждой варианты от условной средней в интервалах,
i ZaP/n - первый момент средней арифметической (среднее отклонение всех вариант ряда от условной средней).
М по способу моментов вычисляется при большом числе наблюдений. Составление простого вариационного ряда и вычисление средней арифметической как средневзвешенной при большом числе наблюдений показано на примере:
Рост студентов в см V |
Число студентов Ρ |
VxP |
158 |
1 |
158 |
160 |
3 |
480 |
162 |
2 |
324 |
163 |
4 |
652 |
164 |
6 |
984 |
165 |
8 |
1320 |
166 |
7 |
1162 |
168 |
5 |
840 |
169 |
6 |
1014 |
170 |
5 |
850 |
172 |
4 |
688 |
174 |
2 |
348 |
175 |
2 |
350 |
176 |
1 |
176 |
|
Ρ=η=56 |
VΡ=9346 |
Составление группированного вариационного ряда и вычисление средней арифметической по способу моментов при большом числе наблюдений показано в табл.
38
Таблица 38.
Рост в см |
V средняя |
Ρ |
a=(V-A)/i |
АР |
a2P |
Vi=3 |
|
|
|
|
|
158-160 |
159 |
4 |
-1 |
-8 |
16 |
161-163 |
162 |
6 |
-1 |
-6 |
6 |
164-166 |
165 |
21 |
0 |
0 |
0 |
167-169 |
168 |
11 |
+ 1 |
+ 11 |
11 |
170-172 |
171 |
9 |
+2 |
+ 18 |
36 |
173-175 |
174 |
4 |
+3 |
+ 12 |
36 |
176-178 |
177 |
1 |
+4 |
+4 |
16 |
|
Σρ=η=56 |
|
Σap=+31 |
|
Σa2P=121 |
Средние величины должны характеризовать однородную статистическую
совокупность. |
|
|
|
Третье |
свойство |
статистической |
совокупности - разнообразие |
признаков: величина того или другого количественного признака неодинакова у всех единиц однородной статистической совокупности.
Это свойство иллюстрируют 3 группы мальчиков, одинаковые по численности и имеющие одинаковую среднюю арифметическую роста (табл. 39).
Среднее квадратичное отклонение (G) - учитывает разнообразие всех вариант со знаком «+» или «-» при числе признаков (n) меньше 30 (n<30):
Таблица 39.
Вычисление среднеквадратичного отклонения (G) при малом числе наблюдений
(n<30), например (табл. 40):
Таблица 40.
Особенности статистической обработки данных при малом числе наблюдений (n<30):
1.Средняя арифметическая находится как простая.
2.Среднее квадратичное находится как простое, n - 1.
3.Значение t находят по таблице Стьюдента.
Основной смысл названных особенностей - повышение требований к вычислениям.
Вычисление среднего квадратичного отклонения (G) при большом числе наблюдений как средневзвешенного показано на примере (табл. 41).
Таблица 41.
Получаются очень громоздкие вычисления, их упрощают - рассчитывают среднеквадратичное отклонение по способу моментов в сгруппированном вариационном ряду.
Вычисление среднего квадратичного отклонения по способу моментов (второй момент) показано на примере (табл. 42).
Таблица 42.
Теорией статистики установлено, что при нормальном распределении М ? σ находится 68% всех вариант, М ? 2σ находится 95,5% всех вариант, М ? 3σ находится 99,7% всех вариант (рис. 10).
По G (среднему квадратичному отклонению) можно определить структуру вариационного ряда; судить о точности (типичности) средней арифметической: если 95% всех вариант находится в пределах Μ?2σ, то средняя арифметическая является типичной (увеличивать число наблюдений не следует); судить о показателях, оценивать отдельные признаки у каждого индивидуума по стандартному отклонению t: сколько сигм составляет отклонение индивидуального признака от средней арифметической:
Рис. 10. Связь среднего квадратичного отклонения со структурой вариационного ряда.
Если t<2σ, то отличие индивидуального признака от стандарта незначительно; если t>=2σ, то отличие индивидуального признака от стандартного значительно.
6.2.3.4. Определение необходимого числа наблюдений
Вся мудрость статистики состоит в том, что по части можно судить о целом. Эта часть - выборочная совокупность должна быть репрезентативна, т.е. представительна по отношению к генеральной совокупности по количеству и качеству (см. ниже).
Формула определения необходимого числа наблюдений (репрезентативной выборки) выводится из формулы «ошибки» путем алгебраических преобразований.
Признак, по которому производится расчет, может быть выражен абсолютной или относительной величиной. Если признак выражен абсолютной величиной, формула определения необходимого числа наблюдений следующая:
Эти формулы для случайного повторного отбора определяют самый большой объем наблюдений. Определение оптимального объема выборки в комплексных социальногигиенических исследованиях затруднено тем обстоятельством, что единицы исследуемых совокупностей характеризуются множеством учетных признаков (трудность), так как изучается комплекс показателей здоровья различных групп населения и комплекс факторов, на них воздействующих. Существующие формулы для расчета необходимого числа наблюдений основываются на конкретном единственном признаке. Вести расчет по всем исследуемым признакам невозможно.
Исследователи выделяют основной или результирующий признак и по нему рассчитывают необходимый объем наблюдений.
В ходе анализа собранного материала определяются различные параметры, характеризующие исследуемую совокупность. Это разные параметры с разной вариабельностью. Исследователи определяют их репрезентативность при одном и том же числе единиц наблюдения.
О вариабельности (G, pq) данного признака в генеральной совокупности исследователь судит по данным литературы, если они есть. При отсутствии данных литературы, если признак выражен абсолютным числом, то G определяется по данным пробного исследования, объем которого обычно составляет 30-70 единиц наблюдения. Если признак выражен относительным числом, то пробное исследование, как правило, не проводится, так как проценты вычислять не рекомендуется при числе наблюдений менее 100. В таком случае берут максимальное значение pq=0,25 (p=q=0,5) или pq=2500%
(p=q=50%).
Степень уверенности в заданной неточности результата в социально-гигиенических исследованиях обычно составляет 0,95 (t=2).
Другая трудность для исследователя состоит в определении доверительного интервала (Δ), т.е. величины расхождения между средним значением признака генеральной и выборочной совокупности (Δ = Мг - Мв). Эта величина выражается в единицах изучаемого признака и характеризует допускаемую неточность искомой величины генеральной совокупности. Она задается самим исследователем в разумных пределах, исходя из сути изучаемого явления. Незначительное увеличение ведет к резкому сокращению необходимого объема выборки, напротив, незначительное уменьшение резко его увеличивает.
Приведем два примера расчета необходимого числа наблюдений для получения достоверного результата.
Пример 1. Сколько семей нужно исследовать, чтобы дать социально-гигиеническую характеристику детородной функции молодых женщин? Подобного исследования раньше не проводилось.
За результирующий признак автор взял число беременностей у молодых женщин за 5 лет брака, провел пробное исследование, опросив 50 женщин. Получены следующие данные:
М - среднее арифметическое число беременностей у молодых женщин за 5 лет брака составило 2;
G - среднее квадратичное отклонение = 5;
m=0,25; = 0,5 (p=0,95; t=2).
Расчет проведен следующим образом:
Вывод: для получения статистически достоверных социально-гигиенических характеристик детородной функции молодых женщин за 5 лет брака нужно обследовать 400 семей.
Пример 2. Определить, сколько левшей необходимо взять под наблюдение для выявления среди них детей с расстройствами речи.
Доверительная вероятность 95% (0,95). Ошибка показателя не должна превышать 5%. При ранее проводившихся исследованиях расстройств речи у детей дошкольного возраста выявлено, что ими страдают 15% левшей.
Вывод: для получения статистически достоверных данных о числе детей с расстройствами речи среди левшей нужно обследовать примерно 200 детей-левшей.
Сомнения исследователя в определении основного (результирующего) признака и его неточности (доверительного интервала) при изучении совсем не знакомых совокупностей помогает разрешить следующий прием (Плохинский Н.А., 1961):
и G не определяют заранее, сразу берут ориентировочное отношение Δ/G, которое обозначают К. Это коэффициент точности, уровень которого выбирает сам исследователь (от 0,5 до 0,1). Примерное необходимое число наблюдений в зависимости от желаемой точности и уверенности в результатах исследования приводится в табл. 43.
Таблица 43. Необходимый объем выборки
Как видно из табл., необходимый объем выборки для получения устойчивых результатов с достаточной степенью уверенности и точности составляет 400 (К=0,1;
р=0,95).
В большинстве комплексных социально-гигиенических исследований на основной ступени исследования по достаточно подробной программе объем выборки составляет 400-800 единиц наблюдения. Такие исследования вполне надежные и достаточно точные
(К=0,1; р=0,95).
Однако в ходе анализа исследуемая совокупность делится на различные группы по разным признакам, репрезентативность которых определяется исследователем. Результирующий признак, положенный в основу расчета статистической совокупности, не является признаком конечной группы анализа. Бывает, что в конечных группах насчитывается лишь несколько единиц наблюдения, и параметры, их характеризующие, могут оказаться недостоверными.
Необходимое число единиц наблюдения для получения устойчивого результата при минимальной точности и достоверности составляет 16-25 (К=0,4; 0,5; р=0,95).
