
- •Виды статистической совокупности
- •Простые (однофакторные).
- •Групповые.
- •Комбинационные.
- •Статистические величины
- •Абсолютные величины
- •Средние величины
- •Среднее квадратическое отклонение
- •Коэффициент вариации
- •Применение средних величин
- •Динамические ряды
- •Показатели динамического ряда
- •Выравнивание динамического ряда
- •Стандартизованные показатели
- •Прямой метод стандартизации
- •Косвенный метод стандартизации
- •I. Коэффициент корреляции рядов (гxy) вычисляется по формуле:
I. Коэффициент корреляции рядов (гxy) вычисляется по формуле:
Алгоритм расчета коэффициента корреляции рядов (г^,) приведен в примере 18 (табл. 14).
При сопоставлении показателей содержания железа и гемоглобина в крови отмечается увеличение уровня гемоглобина с ростом количества железа. Следует определить степень и направление связи между этими показателями и достоверность полученного результата.
Таблица 14 Зависимость уровня гемоглобина от количества содержания железа в крови
Показатели |
Отклонения |
dxdy |
Квадрат отклонения |
|||
Железа, г % |
Гемоглобина, |
dx |
dy |
d'x |
<Р, |
|
<К<) |
в % (К„) |
|
||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
48 |
65 |
-4 |
-4 |
16 |
16 |
16 |
48 |
66 |
-4 |
—3 |
12 |
16 |
9 |
49 |
68 |
-3 |
-1 |
3 |
9 |
|
50 |
68 |
-2 |
-I |
2 |
4 |
|
51 . |
70 |
-1 |
+1 |
-1 |
1 |
|
53 |
70 |
+ 1 |
+ 1 |
1 |
1 |
|
54 |
70 |
+2 |
+1 |
2 |
4 |
1 |
57 |
72 |
+5 |
+3 |
15 |
25 |
9 |
58 |
72 |
+6 |
+3 |
18 |
36 |
9
|
M.t=468/9=52 ! |
Му=621/9=69 |
|
|
1=68 |
1=112 |
1=48 |
Вычисления проводятся по следующему алгоритму: 1. Вычисляем средние арифметические рядов .Y и У: ΣVx=468 ΣVy=62l
2. Определяем отклонения вариант каждого ряда от своей средней (dx и dy) (графы 3 и 4. табл. 14):
dx=Vх-Mх; dy = Vy - My
Находим произведение dx на dy (графа 5, табл. 14). Полученные значения суммируются с учетом знаков.
Возводим в квадрат dx и dy суммируем полученные значения (графа 6 и 7, табл. 14):
Вычисляем коэффициент корреляции:
Вывод: Так как коэффициент корреляции гxy = +0,92, следовательно, между содержанием в крови железа и гемоглобина отмечается сильная и прямая корреляционная связь, т. е. чем больше содержание железа в крови, тем выше уровень гемоглобина.
Поскольку исследование проводилось на выборочной совокупности, необходимо оценить достоверность коэффициента корреляции.
Для оценки достоверности коэффициента корреляции вычисляется его средняя ошибка:
— при числе
наблюдений более 100;
— при числе
наблюдений от 30 до 100;
— при числе
наблюдений менее 30.
В рассмотренном примере 18 следует использовать последнюю формулу, поскольку число наблюдений равно 9:
Для оценки величины полученной ошибки следует использовать критерий достоверности (t).
Значение критерия (t) оценивается по специальной таблице Стьюдента. Если полученное значение (t) больше табличного для выбранного уровня доверия и числа степеней свободы, то коэффициент корреляции считается достоверным. В рассмотренном примере t = 37,1.
Это значение больше табличного, что подтверждает достоверность выяв-пенной сильной связи и взаимозависимости анализируемых явлений.
II. Коэффициент корреляции рангов (р) относится к непараметриче-:ким критериям и предложен Спирменом. Он используется при необходимости получения быстрого результата, при малом числе наблюдений, а также в тех случаях, когда изучаемые признаки не имеют точных количественных значений дли носят описательный характер. Этот метод основан на определении ранга места) каждого из значений ряда.
Для вычисления
коэффициента корреляции рангов
используется следующая формула:
где р — (греческая буква «ро») — коэффициент корреляции рангов; d — разность между ранговыми номерами; п — число парных членов в коррелируемых рядах.
Пример 19: вычислить коэффициент корреляции рангов между величиной расходов на здравоохранение на душу населения и смертностью детей в возрасте до 5 лет (таблица 15).
Таблица 15 Зависимость смертности детей в возрасте 5 лет от расходов на здравоохранение на душу населения в странах в 1997 г.
Страны |
Смертность детей в возрасте до 5 лет (на 1000 жив.) |
Расходы на здравоох. на 1 жителя (SCШA) |
Ранги |
Разность рангов 4 |
Квадрат разности рангов d2 |
|
X |
У |
|||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Индия |
90 |
24 |
4 |
3 |
1 |
1 |
Иран |
57 |
139 |
3 |
5 |
-2 |
4 |
Ливан |
33 |
503 |
2 |
7 |
-5 |
25 |
Пакистан |
99 |
18 |
5 |
2 |
3 |
9 |
Польша |
18 |
228 |
1 |
6 |
-5 |
25 |
Ирак |
113 |
125 |
6 |
4 |
2 |
4 |
Афганистан |
246 |
6 |
7 |
1 |
6 |
36 |
При сопоставлении показателя смертности детей в возрасте до 5 лет и расходов на здравоохранение на 1 жителя (SCIIIA) отмечается снижение частоты смерти детей в возрасте до 5 лет с увеличением расходов на здравоохранение. Следует определить степень связи между этими показателями и достоверность полученного результата.
Вычисления проводятся по следующему алгоритму:
Определить ранги по значению каждой величины ряда. Если первый ряд (х) ранжируется от меньшего значения к большему, то второй ряд (у) следует ранжировать в том же порядке (графа 4 и 5, табл. 15).
Определить разность рангов каждой пары ряда (х) и ряда (у): (dxy)= (х) - (у) (графа 6, табл. 15). Они в сумме с учетом знаков равны нулю.
Возвести в квадрат полученные разности и суммировать их. В нашем примере Σd2xy = 8 (графа 7, табл. 15).
Рассчитываем коэффициент корреляции рангов:
Вывод: связь сильная, обратная (р = -0,86). Между смертностью детей в возрасте до 5 лет и расходами на здравоохранение на 1 жителя существует сильная и обратная связь, с увеличением расходов на здравоохранение снижается смертность детей в возрасте до 5 лет.
Прежде чем судить о степени связи между изучаемыми признаками, необходимо оценить достоверность коэффициента корреляции рангов. При п > 9 следует рассчитать критерий t по формуле:
Полученное значение критерия t оценивается по таблице Меритерия Стьюдента для числа степеней свободы n' = л-2. Если п < 9, оценка достоверности коэффициента корреляции рангов проводится по специальной таблице критических значений коэффициента корреляции Спирмена (р). Коэффициент корреляции незначим, если рассчитанное значение меньше табличного.
РЕГРЕССИЯ
Прямолинейная корреляция отличается тем, что при этой форме связи каждому значению одного признака соответствует определенное в среднем значение другого признака. Рассмотренный нами коэффициент корреляции указывает лишь на направление и силу связи двух величин, не дает судить о том, как количественно меняется величина признака по мере изменения другой величины. Применение метода регрессии позволяет ответить на этот вопрос.
Та величина, на которую в среднем изменяется второй признак при изменении первого на единицу, называется коэффициентом регрессии.
Для расчета коэффициента регрессии (Rx) используется следующая формула:
где σх и σу — среднеквадратические отклонения ряда X и ряда Y; г^ — коэффициент корреляции.
Рассмотрим методику расчета коэффициента регрессии на примере 20.
При анализе физического развития 7-летних мальчиков были получены следующие средние значения роста M(x) и массы тела М(у):
М(х) = 118,4 см σх = ± 6,0 см;
М(у) = 24,0 кг σу = ± 2,6 кг.
Коэффициент корреляции (гху) между весом и ростом составил +0,7.
Расчет коэффициента регрессии выполняется по формуле:
Вывод: с изменением роста 7-летних мальчиков на 1 см, масса тела в среднем изменяется на 0,3 кг.
С помощью коэффициента
регрессии без специальных измерений
можно
определить величину одного из признаков,
например, массы тела, зная значение
другого (роста). С этой целью используется
уравнение линейной регрессии:
где у — искомая величина массы тела; Му — среднее значение массы тела, характерное для данного возраста; Rxy —- коэффициент регрессии массы тела по росту; х — известная величина роста; Мх— среднее значение роста.
Пример 21: определим, какова будет масса тела 7-летних мальчиков при росте 120 см, если среднее значение массы My равно 24 кг, а средний рост равен 118 см. Подставим в уравнение линейной регрессии известные данные и получим:
Вывод: группа 7-летних мальчиков с ростом 120 см должна иметь среднюю массу тела 24,6 кг.
Коэффициенты регрессии и уравнения линейной регрессии широко применяются для составления шкал регрессии, которые используются при индивидуальной оценке физического развития.
ГРАФИЧЕСКИЕ ИЗОБРАЖЕНИЯ
Результаты статистического исследования могут быть представлены в виде графических изображений, что позволяет более наглядно продемонстрировать полученные данные и облегчает проведение анализа.
Диаграммы можно классифицировать различными способами. По назначению — диаграммы сравнения, структурные, динамики явления; по форме — линейные, плоскостные и объемные. Графические изображения отражают закономерность развития, пространственные распределения, взаимосвязь явлений. Графические изображения помогают эффективному анализу статистических данных.
Наиболее часто используют диаграммы (линейные, радиальные, столбиковые, ленточные, секторные, внутристолбиковые и др.), картограммы, картодиаграммы (рис. 2-8).
Линейные диаграммы позволяют отображать динамику явления (изменение показателей во времени). Линейная диаграмма строится в системе прямоугольных координат, при ее построении следует учитывать соотношение между основанием (ось абсцисс —x) и высотой (ось ординат—у), оно должно быть 1,6:1. На ось абсцисс откладываются отрезки, обозначающие периоды времени. На ось ординат наносятся размеры изучаемого явления. Обязательное условие при построении графика — соблюдение масштаба.
На одной диаграмме можно изобразить несколько линий, отличающихся Друг от друга цветом, толщиной или формой пунктира.
Радиальные диаграммы (полярных координат, линейно-круговые, векторные) применяются для изображения сезонных (подекадных, помесячных, поквартальных) и других колебаний, имеющих замкнутый, циклический характер (за сутки, неделю и т. д.)- Для их построения круг делится на столько секторов, на сколько частей разделен период времени, взятый для изучения явления (например, на 12 — при изучении помесячных колебаний в течение года; на 7 — при изучении явления за неделю).
На каждом из радиусов с соблюдением масштаба отмечаются показатели, полученные точки соединяются прямыми линиями. Маркировка начинается с радиуса, соответствующего нулю градусов, и продолжается по движению часовой стрелки.
Столбиковые диаграммы строятся по такому же принципу, как и линейные, в системе координат. В них размеры изучаемого явления изображены в виде прямоугольников. Эти диаграммы используются для сравнения величины изучаемого явления за определенные промежутки времени или на какой-то момент времени, например: сравнительной численности населения по странам мира; обеспеченности населения врачами в разные годы и т. д.
Гистограммы — это изображения в виде прямоугольников, треугольников и других фигур однородных статистических показателей, не связанных друг с другом. Эти диаграммы используются для графического изображения статистических величин, рассчитанных в разных совокупностях. Они также строятся в системе прямоугольных координат с соблюдением масштаба. Например, гистограммы применяются для графического изображения уровней смертности в разных возрастных группах населения; для демонстрации показателей больничной летальности в различных стационарах города; для изображения распространенности туберкулеза в различных социальных группах населения и т. д.
Секторные диаграммы используются для демонстрации структуры изучаемого явления, изображения части в целом явлении. Они представляют собой круг, принимаемый за целое (100%, при этом 1% соответствует 3,6 градуса окружности), в котором отдельные секторы соответствуют частям отображаемого явления. Этот вид диаграмм применяется для графического изображения экстенсивных показателей. Секторы, изображающие отдельные части изучаемого явления, располагаются в порядке возрастания или убывания по движению часовой стрелки и имеют разный цвет или штриховку.
Внутристолбиковые диаграммы также могут применяться для изображения структуры явления. При этом высота столбика принимается за 100%, весь столбик делится на составные части, которые соответствуют долям явления в процентах.
Картограммы — это графические изображения, нанесенные на географической карте, где различным цветом или штриховкой изображена степень распространенности явления по территории. Они иллюстрируют интенсивность статистических показателей в географических, административных районах, по-
зволяют установить соответствие между статистической величиной и ее пространственным распределением.
Картодиаграммы — графические изображения, при построении которых на карту или схему карты изучаемой территории наносятся диаграммы (столбиковые, фигурные, линейные).
При построении графических изображений необходимо соблюдать следующие правила:
данные на графике размешаются слева направо и снизу вверх;
обязательное условие при построении графика — соблюдение масштаба;
нулевые точки шкал изображаются на диаграмме;
цифры, показывающие деление шкал, располагаются слева или внизу соответствующей шкалы;
линии, изображающие явление, представляются в ином виде, чем вспомогательные (цвет, толщина);
на кривой, отражающей динамику явления, отмечаются все точки, соответствующие отдельным наблюдениям;
в диаграммах, показывающих структуру, должна быть оттенена как нулевая, так « 100%-ная линия:
изображенные графические величины должны иметь цифровые обозначения на самом графике или в прилагаемой к нему таблице;
символы, используемые при построении диаграммы (цвет, штриховка, фигуры, знаки), должны быть пояснены;
каждый график должен иметь четкое, краткое название, отражающее его содержание, порядковый номер;
название диаграммы располагается под рисунком.
Таблица значений критерия / (Стьюдента)
Число степеней свободы (л') |
Вероятность ошибки (р) |
||
0,05 = 5% |
0,01 = 1% |
0,001 =0,1% |
|
1 |
12,70 |
63,66 |
637,59 |
2 |
4,30 |
9,92 |
31,60 |
3 |
3,18 |
5.84 |
12,94 |
4 |
2,78 |
4,60 |
8,61 |
5 |
2,57 |
4,03 |
6,86 |
6 |
2.42 |
3,71 |
5,96 |
7 |
2,36 |
3.50 |
5,31 |
S |
2.31 |
3.36 |
5,04 |
9 |
2.26 |
3.25 |
4,78 |
10 |
2.23 |
3,17 |
4.59 |
11 |
2,20 |
3.17 |
4,44 |
12 |
2.18 |
3.06 |
4.32 |
13 |
2,16 |
3,01 |
4.22 |
14 |
2.14 |
2,98 |
4.14 |
15 |
2,13 |
2.95 |
4,07 |
16 |
2,12 |
2.92 |
4,02 |
17 |
2.11. |
2.90 |
3,96 |
18 |
2,10 |
2.88 |
3,92 |
19 |
2,09 |
2.86 |
3,88 |
20 |
2.09 |
2,84 |
3,85 |
21 |
2,08 |
2.83 |
3,82 |
22 |
2,07 |
2,82 |
3,79 |
23 |
2.07 |
2,81 |
3,77 |
24 |
2,06 |
2.80 |
3,75 |
25 |
2,06 |
2,79 |
3,73 |
26 |
2,06 |
2,78 |
3.71 |
27 |
2,05 |
2,77 |
3.69 |
28 |
2,05 |
2,76 |
3,67 |
29 |
2,04 |
2,76 |
3,66 |
30 |
2,04 |
2,75 |
3,64 |
00 |
1,96 |
2,58 |
3,29 |