Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Зайцев_книга2[1].doc
Скачиваний:
648
Добавлен:
15.03.2015
Размер:
8.87 Mб
Скачать
  1. Показатели описательной статистики.

Широкое внедрение в практику лечебно-профилактических учреждений компьютеризации позволяет широко применять специальные методы математико-статистического анализа. Эти методы позволяют в условиях существования той или иной практической ситуации получать в оперативном режиме прогноз развития заболеваемости обслуживаемых контингентов, изменение нагрузки врачей-специалистов, вспомогательных диагностических служб и т.п.

Решение любой задачи математико-статистической обработки данных требует описания исследуемой совокупности с той или иной степенью детализации. Под термином «статистическое описание» подразумевается нахождение параметров, представляющих в обобщенном виде распределение данной статистической совокупности.

В целом, решение задач статистического описания связано с обязательным последовательным решением следующих вопросов:

- установление закона распределения эмпирических (полученных опытным путем) статистических совокупностей и параметров этого распределения (свойств эмпирических совокупностей);

- числовое оценивание причинно-следственных отношений и взаимосвязи между явлениями;

- решение проблем, связанных с репрезентативностью (представительностью) выборочных исследований и точностью статистического прогноза;

Таблица 87

Статистические показатели распределения

Показатели

Назначение показателя

Примеры показателей

Средние величины

Описывают положение середины распределения

Степенные средние:

- среднее арифметическое

- среднее гармоническое

- среднее квадратическое

- среднее геометрическое

Структурные средние

- мода Мо

- медиана Ме

Показатели разброса

Описывают степень

разброса (вариабельности, изменчивости) данных

лимит - Lim

амплитуда- Amрl

дисперсия D

среднеквадратическое (стандартное) отклонение –σ

коэффициент вариации - V

Квантили

Показатели формы распределе-ния

Характеризуют симметрию и островершинность распределения данных

коэффициент асимметрии - As

коэффициент эксцесса- E

гистограмма

полигон распределения

Примечание. Приведенные в таблице условные обозначения статистических показателей и статистических критериев не являются общепринятыми или стандартными.Например,среднее арифметическое может обозначаться символамиМ или, коэффициент вариацииСV илиV и т.д. Таким образом, использование условных обозначений в статистических работах обязательно должно сочетаться с пояснениями их смыслового значения.

Ряды распределений. Вариационные ряды.

Первым шагом любого статистического анализа является получение параметров ряда распределения. Строго говоря, при использовании современной вычислительной техники и специальных программ статистической обработки данных, построение рядов распределений, а также проведение других вспомогательных операций, связанных с получением характеристик этих распределений, почти полностью исключено. Однако, базовые понятия и термины, используемые в процессе статистического анализа и при толковании отдельных результатов, могут быть поняты только на основе усвоения логической последовательности основных "ручных" операций статистической обработки данных.

Значительную долю статистических данных составляют количественные признаки, принимающие некоторое числовое значение у каждой единицы статистического наблюдения. Эти числовые значения выражаются в виде различных вариант. Например: в качестве статистической совокупности рассматривается группа студентов Вуза. Каждый студент - отдельная единица наблюдения. Если нас интересует вопрос, о каком-либо показателе физического развития (учетном признаке единицы наблюдения), скажем, массе тела, то масса каждого студента является в данном случае вариантой. Масса тела колеблется, варьирует: у первого студента масса тела 51 кг, у второго - 67 кг и т.д. Таким образом, варьирующий признак встречается в различных вариантах.

Варьирующие признаки (варианты) могут быть двух видов - прерывные и непрерывные.

Прерывный или дискретный признак - признак, принимающий конкретные значения в виде целых конечных чисел, между которыми нет промежутков. Например: число ударов пульса, число дней госпитализации и т.п. Прерывный признак всегда является результатом счета.

Непрерывный - это признак, варианты которого могут принимать любые значения в некоторых пределах и выражаются лишь приближенно, с определенным приближением (точностью). Получаются эти признаки в результате измерения и могут выражаться дробно: вес, рост, длина и т.д.

При наблюдении какого-либо варьирующего признака, так или иначе, ведется регистрация полученных значений. Например, масса тела у обследованных студентов составила: 64, 57, 63, 62, 57, 61, 61, 59, 60, 60, 63, 59, 62, 59, 64, 60, 59, 60, 60, 60, 60, 63, 60, 59, 59, 61, 61, 58, 61, 61, 65, 61, 61, 58, 64, 62, 62, 60, 62, 62, 62, 58, 63, 63, 59, 60, 58, 63, 58, 60, 64, 63, 58, 61, 57 кг.

Здесь числа расположены в порядке регистрации данных. Такой ряд называется неупорядоченным рядом отдельных наблюдений.

Рисунок 86. Неупорядоченный ряд исходных данных

Началом статистического анализа числовых рядов является их упорядочение, ранжирование, в возрастающем или убывающем порядке: 57, 57, 57, 58, 58, 58, 58, 58, 58, 59, 59, 59, 59, 59, 59, 59, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 60, 61, 61, 61, 61, 61, 61, 61, 61, 61, 62, 62, 62, 62, 62, 62, 62, 63, 63, 63, 63, 63, 63, 63, 64, 64, 64, 64, 65.

В ранжированном ряду каждый отдельный случай еще сохраняет свою индивидуальность. Более компактной формой описания вариации является образование рядов распределений, которые состоят из групп с одинаковыми или близкими значениями варьирующего признака. По своей конструкции ряд распределения состоит из двух столбцов (граф). В одном столбце располагаются варианты (V), в другом - частоты (P). Частоты указывают, сколько раз встречаются одинаковые значения признака в этом ряду, то есть, сколько студентов имели одинаковый вес. (Таблица 88)

Показатели частостей выражаются в относительных единицах: процентах от общего числа наблюдений или долях от единицы. Частости показывают долю частот отдельных вариант от общего числа наблюдений.

Таблица 88

Пример вычисления накопленных частот и частостей

Вес

V (кг)

Частоты (Р)

Частости

Число студентов (частоты)

Накопленные

частоты

%

р

р

накопленные

57

3

3

5,5

0,05

0,05

58

6

9

10,9

0,11

0,16

59

7

16

12,7

0,13

0,29

60

11

27

20,0

0,20

0,49

61

9

36

16,4

0,16

0,65

62

7

43

12,7

0,13

0,78

63

7

50

12,7

0,13

0,91

64

4

54

7,3

0,07

0,98

65

1

55

1,8

0,02

1,00

Итого

n=Р=55

-

100,0

1,00

-

Иногда бывает уместным осуществить еще одно преобразование вариационного ряда: построение ряда накопленных частот или частостей. Накопленные частоты и частости позволяют при оценке распределений игнорировать неравную величину интервала в отдельных группах.

Если ряд распределения состоит из дискретных величин, то он называется дискретным вариационным рядом. Наглядность тенденций распределений повышается при графическом представлении вариационных рядов. Графически дискретный вариационный ряд изображается в системе прямоугольных координат как многоугольник, так называемый полигон распределения (Рисунок 88). По оси абсцисс откладываются различные возможные значения варьирующего признака (V), по оси ординат - частоты (P), число случаев. Иногда в диаграмму включаются накопленные частоты или частости. Например:

Рисунок 87. Гистограмма распределения студентов по весу

Приведенная форма ряда распределения применима лишь для тех случаев, когда дискретный варьирующий признак принимает небольшое количество значений. Если таких вариант большое количество или бесконечно большое (в случае непрерывного ряда), то для каждой варианты образовать свою группу невозможно. Объединение отдельных наблюдений в группы возможно лишь на базе интервала (класса, разряда), то есть в группы, имеющие определенные пределы значений. Эти группы образуют интервальный сгруппированный вариационный ряд. Графически такой ряд изображается гистограммой распределения (Рисунок 87).

Рисунок 88. Полигон распределения

Всякая сводка или группировка уничтожает очертания отдельных единиц, растворяет их в группе, поэтому соблюдение правил формирования групп является необходимым условием сохранения основных тенденций распределения признака в сгруппированном ряду.

В группах пределы обозначаются или подразумеваются "от" (верхняя граница) и "до" (нижняя граница). Желательно, чтобы интервалы во всех группах конкретного ряда были одинаковы. Ряды распределений, где группировка данных проведена в неодинаковых интервалах, требуют применения специальных методик дальнейшей статистической обработки.

Универсального ответа о величине интервала и, соответственно, о числе групп не существует. Этот вопрос решается отдельно в каждом конкретном случае. Главное чтобы характерные особенности распределения не были завуалированы, а не характерные, случайные колебания были бы сглажены. Лучше допустить некоторую потерю в точности, но зато выиграть в наглядности, в аналитических возможностях.

В принципе, рекомендуется руководствоваться следующими соображениями: во-первых, число групп должно быть нечетным; во вторых, желательно, чтобы при большом объеме наблюдений (более 100) число групп было больше (9-11-13), а при малом объеме, - меньше (5-7-9). Если величина интервала берется равной для всех групп ряда, то размер интервала обычно устанавливается на основе крайних значений ранжированного ряда. В этом случае, чтобы определить наиболее оптимальный интервал группировки, необходимо:

1.Найти разность между максимальным и минимальным значением вариант в ряду и разделить на число групп, которое хотят получить.

2.Полученную в результате деления величину округлить, и таким образом получить интервал.

При незначительном разбросе вариант для определения интервала группировки можно воспользоваться формулой Стерджесса:

,

где n- число наблюдений, Vmax и Vmin - соответственно, минимальное и максимальное значения вариант.

Для подобных целей можно использовать и формулу, основанную на рекомендациях К.Брукса и Н.Краузерса:

Интервалы могут быть открытыми. Такие интервалы имеют одну границу, либо верхнюю, либо - нижнюю. Например: "От 100 лет и более". Или "До 10 лет".

Закрытые интервалы имеют обе границы, нижнюю и верхнюю. Соответственно, формируются открытые или закрытые вариационные ряды (Таблица 89). Чтобы не возникало сомнений, в какую группу относится та или иная варианта, границы интервала (границы групп) не должны пересекаться, то есть границы каждой группы должны отличаться от границ соседних групп. Например: если имеются группы 180-185, 185-189 см, то непонятно, в какую группу следует отнести варианту 185 см.? Для исключения неопределенности, когда границы групп по каким-то причинам все же совпадают, делаются специальные оговорки ("от" и "до"). Оговорки однозначно указывают, в какую группу попадают пограничные значения вариант.

Таблица 89