Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_3_4.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
309.76 Кб
Скачать

Распределение учащихся по росту

Рост, см х

Число учащихся, f

Накопленные частоты

160-165

165-170

170-175

175-180

180-185

185-190

190-195

3

7

16

10

9

3

2

3

10

26

36

45

48

50

Всего

50

-

,

В соответствии с полученным значением, равным 12,75, определяется по накопленной частоте квартильный интервал для нахождения первого квартиля: 170-175, , , , .

;

.

Полученное значение, равное 38,25, позволяет по накопленной частоте определить квартильный интервал для нахождения третьего квартиля: 180-185, , , , .

.

Для определения медианы находим номер медианы:

.

Медианным интервалом будет являться интервал 170-175, а значение медианы составит:

.

Следовательно, в ряду распределения по данным о росте учащихся первый квартиль составляет 170,8 см, третий – 180,8 см, то есть 25% учащихся имеют рост не выше 170,8 см, а у 75% учащихся рост не превышает 180,8см. При этом согласно значению медианы у 50% учащихся рост меньше 174,7 см, а у другой половины – выше 174,7 см.

Положение первого дециля:

Интервал для нахождения первого дециля: 165-170.

Положение девятого дециля:

Интервал для нахождения девятого дециля: 185-190.

Таким образом, значения децилий указывают на то, что среди первых 10% учащихся максимальный рост будет 166,4 см, а среди 10% учащихся с наибольшим ростом, самый маленький рост будет составлять 185 см, то есть в 1,1 раз больше.

4.2. Показатели степени вариации

Размах вариации ( R ) является наиболее простым измерителем вариации признака: ,

где хmax – наибольшее значение варьирующего признака;

xmin – наименьшее значение признака.

Среднее линейное отклонение ( ) представляет собой среднюю величину из отклонений вариантов признака от их средней. Его можно рассчитать по формуле средней арифметической, как невзвешенной, так и взвешенной, в зависимости от отсутствия или наличия частот в ряду распределения:

- невзвешенное среднее линейное отклонение;

- взвешенное среднее линейное отклонение.

Рассмотренные показатели имеют ту же размерность, что и признак, для которого они вычисляются.

Рассмотрим пример. На основе данных таблицы рассчитаем среднее линейное отклонение для дискретного ряда распределения.

Таблица 4.4

Распределение учителей школы по стажу работы

Стаж работы, лет

xi

Число учителей в % к итогу

fi

xi*fi

8

9

10

11

12

14

20

30

24

12

112

180

300

264

144

Итого

100

1000

Решение: размах вариации стажа равен: R = 12 - 8 =4 года. Средний стаж работы определяем по формуле средней арифметической взвешенной: лет

Вспомогательные расчеты оформим в табличной форме.

Таблица 4.5

Вспомогательные расчеты

xi

fi

xi*fi

xi -

fi

8

9

10

11

12

14

20

30

24

12

112

180

300

264

144

-2

-1

0

1

2

2

1

0

1

2

28

20

0

24

24

Итого

100

1000

0

96

Среднее линейное отклонение стажа работа учителей средних школ района:

года.

Показатели дисперсии и среднего квадратического отклонения являются общепринятыми мерами вариации и широко используются в статистических расчетах.

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины:

- невзвешенная;

- взвешенная.

Дисперсию используют не только для оценки вариации, но и при измерении взаимосвязей, для проверки статистических гипотез.

Среднее квадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней, т.е. оно рассчитывается путем извлечения квадратного корня из дисперсии:

- невзвешенное;

- взвешенное.

Среднее квадратическое отклонение – величина именованная, имеет размерность осредняемого признака. Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, на сколько в среднем отклоняются конкретные варианты признака от его среднего значения.

Расчет дисперсии прямым способом в ряде случаев трудоемок, поэтому используя свойства дисперсии логичнее упростить ее вычисления:

или .

Для целей сравнения колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%. Различают следующие относительные показатели вариации (V):

  • Коэффициент осцилляции:

  • Линейный коэффициент вариации:

  • Коэффициент вариации:

Наиболее часто в практических расчетах применяется коэффициент вариации.

4.3. Правила сложения дисперсий

Если данные представлены в виде аналитической группировки, то можно вычислить дисперсию общую, межгрупповую и внутригрупповую.

Допустим, имеется распределение исходной совокупности, представленное в табл. 4.6.

Таблица 4.6

Распределение исходной совокупности по группам

Значение признака х

Число единиц в j-й совокупности

Итого

1

2

m

х1

f1

s1

t1

f1 + s1+…+ t1 = n1

х2

f2

s2

t2

f2+ s2+…+ t2 = n2

хk

fk

sk

tk

fk + sk+…+ tk = nk

Итого

N1

N2

Nm

N

Сначала вычисляются m частных средних, т.е. среднее значение признака в каждой группе:

, , … .

На основе частных средних , , …, определяем общую среднюю по формуле:

,

где N = .

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловливающих эту вариацию:

.

Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:

.

Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней :

или ,

или ,

……………………………

или .

В общем виде данная дисперсия имеет вид:

,

где Nij - частоты от i =1 до k в каждой j-й группе.

Для всех групп в целом вычисляется средняя из внутригрупповых:

Существует закон, связывающий три вида дисперсий. Общая дисперсия равна сумме дисперсии средней из групповых и межгрупповой дисперсии частных:

.

Данное соотношение называют правилом сложения дисперсий. Согласно этому правилу общая дисперсия, возникающая под влиянием всех факторов, равна сумме дисперсий, возникающих под влиянием всех прочих факторов и дисперсии, возникающей за счет группировочного признака. На основании правила сложения дисперсий можно определить показатель тесноты связи между группировочным (факторным) и результативным признаками. Он называется эмпирическим корреляционным отношением и рассчитывается по формуле: .

21