Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АОЭД(лекции).doc
Скачиваний:
26
Добавлен:
13.09.2019
Размер:
1.37 Mб
Скачать

2.7Статистические ряды.

Особую форму представления данных и их группировки представляют собой статистические ряды. Статистическим называется ряд числовых значений признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на вариационные, атрибутивные ряды динамики и регрессии, а также ряды ранжированных значений признаков, ряды накопленных частот, являющихся производными вариационных рядов.

Среди группировки видное место занимают вариационные ряды. Вариационным рядом или рядом распределения называют второй ряд чисел, показывающих каким образом числовые значения признака связаны с их повторяемостью в данной статистической совокупности.

Например, из данных биопроб на содержание сахара в крови человека млмоль/л. случайным способом отобрано 25 результатов. Результаты оказались следующими:

6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12,9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 11, 9, 10.

Варианты xi:

6

9

5

7

10

8

11

12

Число вариантов fi:

1

7

1

2

6

4

3

1

Это и есть вариационный ряд числа, показывающий сколько раз отдельные варианты, встречающиеся в данной совокупности называются частотами или весами вариантов и обозначаются fi. Общая сумма таких частот вариационного ряда равна объему данной совокупности:

,

где обозначает суммирование частот вариационного ряда от i=1 до k класса , где n - общее число наблюдений (объем совокупности). Частоты (веса) выражают не только абсолютными, но и относительными числами, т. е. в долях единицы или в процентах от общей численности вариантов, составляющих данную совокупность. В таких случаях веса называют относительными частотами. Общая сумма таких частот равна единице,

т.е.

или

(если это выражено в процентах).

Под ранжированием понимают расположение членов вариационного ряда или статистической совокупности в возрастающем или убывающем порядке. Ранжирование позволяет наилучшим образом проиллюстрировать закономерность варьирования признаков. В зависимости от того, как варьируют признаки дискретно или непрерывно, в широком или узком диапазоне, статистическая совокупность распределяется в безинтервальный или интервальный ряд.

В первом случае частоты относятся непосредственно к ранжированным значениям признака, во втором подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам, на которые разбивается общая вариация признака в пределах от минимума до максимума варианты в данной совокупности . Отсюда различают равно- и неравно- интервальные вариационные ряды. В неравно-интервальных рядах характер распределения частот меняется по мере изменения ширины классовых интервалов. В то же время неравно-интервальную группировку в медицине применяют сравнительно редко. Как правило, биометрические данные распределяются в равно-интервальные ряды. Приступая к построению равно-интервального вариационного ряда, важно правильно наметить ширину классового интервала. Следует разбить вариацию признака в пределах от минимума до максимума варианты на такое число групп и классов, которое удовлетворяло бы требованиям точности.

Данную задачу решают делением размаха варьирования признака на число групп и классов, намечаемых при построении вариационного ряда.

λ= ,

где λ - величина классового интервала, Xmax и Xmin - минимальные и максимальные варианты совокупности, а k - число классов, на которые разбивается вариация признаков. Число классов можно приблизительно наметить, используя таблицу.

Число наблюдений n (от и до)

Число классов k

25-40

5-6

40-60

6-8

60-100

7-10

100-200

8-12

>200

10-15

Величину k можно определить по формуле Стерджеса:

k=1+ 3,32*lgn,

где n 100,

если n 100, то

k=5*lgn.

Если признак варьирует дискретно и слабо, т.е. в узких границах (λ=1 или λ 1), то данные распределяются в безинтервальный вариационный ряд. Если же признак варьирует в широких границах, то независимо от того, как он варьирует дискретно или непрерывно, по данным строят интервальный ряд.

При этом точность величины классового интервала должна соответствовать точности, принятой при измерении признака, т.е. или сотые или десятые доли единицы. При построении интервального вариационного ряда следует поступить так, чтобы минимальная варианта совокупности попадала примерно в середину первого классового интервала. Для определения нижней границы первого классового интервала наметим классовые интервалы и распределим по ним все варианты совокупности, т.е. определим частоты каждого класса.

Возникает вопрос, в какие классы относить варианты, которые по своей величине совпадают с верхней границей одного и нижней границей другого соседнего класса. Чаще поступают следующим образом: верхние границы классов уменьшают на величину, равную точности, принятой при измерении признака, чем и достигается необходимое разграничение класса. Однако можно помещать в один и тот же класс варианты, которые больше нижней, но меньше или равны верхней границе (по принципу: от и до - включительно).

Необходимо превращение интервального ряда в безинтервальный вызывается тем, что обобщающие числовые характеристики, такие, как среднее, дисперсия, СКО и др. вычисляются по безинтервальным рядам. При этом срединные значения классовых интервалов Xi отстоят от их нижних границ Xn на величину, равную половине классового интервала. Центральную величину классового интервала вычисляют по формуле:

Xi= (Xn+Xk), где

X k - конечная точка интервала, равная (Xn+1)-ξ, т.е. начало следующего класса, уменьшенного на точность измерения признака. Середины классов называют классовыми вариантами. При определении частот каждого класса удобно применять следующую таблицу.

Классы (интервалы)

Шифр частот

Частоты

8-9

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]