3. Характеристики вариационного ряда
Среди характеристик вариационного ряда можно выделить:
средние величины;
показатели вариации.
I. Средние величины
Средние величины характеризуют значения признака, вокруг которого концентрируются наблюдения. Наиболее распространенной из них является средняя арифметическая.
Определение 2: средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот
(1),
где
хi
– варианты дискретного ряда или середины
интервалов интервального ряда, ni
– соответствующие им частоты, .
Очевидно, что
(2),
где
–
частости вариантов или интервалов.
При решении практических задач могут применяться и иные формы средней:
средняя гармоническая;
средняя геометрическая;
средняя квадратическая и т.д.
Кроме рассмотренных средних величин, называемых аналитическими, в статистическом анализе применяют структурные или порядковые средние. Из них наиболее широко используются медиана и мода.
Определение 3: медианой Ме вариационного ряда называется значение признака, приходящееся на середину ранжированного (упорядоченного) ряда наблюдений.
Для дискретного вариационного ряда с нечетным числом членов медиана равна серединному варианту, а для ряда с четным числом членов – полусумме двух серединных вариантов.
Пример 7:
Для вариационного ряда из примера 1 найти медиану.
Решение:
Запишем ранжированный ряд вариантов:
0 1 1 1 1 2 2 2 2 3 3 3 3 3 3 3 4 4 4 6.
Данный дискретный
вариационный ряд имеет четное число
членов n
= 20, значит
медиана .
Определение 4: Модой Мо вариационного ряда называется вариант, которому соответствует наибольшая частота.
Пример 7: Для вариационного ряда из примера 1 найти моду.
Решение:
Для данного
вариационного ряда наибольшая
частота
nmax
= 7 соответствует
варианту х
= 3, значит мода .
II. Показатели вариации
Средние величины, рассмотренные выше, не отражают изменчивости (вариации) значений признака.
Простейшим показателем вариации является вариационный размах R, равный разности между наибольшим и наименьшим вариантами ряда:
R = xmax – xmin (3) Наибольший интерес представляют меры вариации (рассеяния) наблюдений вокруг средних величин, в частности, вокруг средней арифметической.
Определение 5: дисперсией s2 вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:
(4)
или ,
(5)
где
Дисперсию s2 часто называют эмпирической или выборочной, подчеркивая, что она находится по опытным или статистическим данным.
Характеристикой рассеяния, имеющей ту же размерность, что и значения признака, является среднее квадратическое отклонение s – арифметическое значение корня квадратного из дисперсии:
(6)
Рассматривается также безразмерная характеристика – коэффициент вариации, равный процентному отношению среднего квадратического отклонения к средней арифметической:
()
(7)
Вычисление средней
арифметической
и
дисперсии s2
вариационного
ряда можно упростить, если использовать
не первоначальные варианты x1,
x2,…,
xm
, а новые условные
варианты
(8),
где
с и
k –
специально подобранные числа.
В качестве с целесообразно выбирать одно из средних наблюдаемых значений, а в качестве k – разность между двумя соседними вариантами. В этом случае формулы для упрощенного вычисления принимают следующий вид:
средняя арифметическая
(9);
дисперсия
(10).
Пример 8:
Для вариационного ряда из примера 1
найти, используя упрощенные формулы.
а) среднюю
арифметическую ,
б) дисперсию s2,
в) среднее квадратическое отклонение
s, г) коэффициент
вариации V.
Решение:
Для вычисления условных вариант ui положим с = 3, k = 1 и составим расчетную таблицу.
xi |
ni |
|
ui ni |
ui2 ni |
0 |
1 |
-3 |
-3 |
9 |
1 |
4 |
-2 |
-8 |
16 |
2 |
4 |
-1 |
-4 |
4 |
3 |
7 |
0 |
0 |
0 |
4 |
3 |
1 |
3 |
3 |
6 |
1 |
3 |
3 |
9 |
Сумма |
20 |
|
-9 |
41 |
Используя суммы, полученные в таблице, найдем необходимые числовые характеристики
а) Найдем среднюю арифметическую по формуле (9):
б) По формуле (10) найдем дисперсию вариационного ряда s2:
в) По формуле (6) найдем среднее квадратическое отклонение s
г) коэффициент вариации V найдем по формуле (7)
Пример решения типовой задачи.
Задача .
Путем опроса
получены следующие данные ()
:
1 2 3 2 2 4 3 3 5 1 0 2 4 3 2 2 3 3 1 3 2 4 2 4 3 3 3 2 0 6
3 3 1 1 2 3 1 4 3 1 7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5
3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3 5
Необходимо:
1) Составить вариационный ряд (статистическое распределение выборки), предварительно записав ранжированный дискретный ряд вариантов.
2) Построить полигон частот и кумуляту.
3) Составить ряд распределения относительных частот (частостей).
4) Найти основные
числовые характеристики вариационного
ряда (использовать упрощенные формулы
для их нахождения): а) среднюю арифметическую
,
б) медиану Ме
и моду Мо,
в) дисперсию s2,
г) среднее квадратическое отклонение
s, д) коэффициент
вариации V.
5) Пояснить смысл полученных результатов.
Решение.
1) Для составления ранжированного дискретного ряда вариантов отсортируем данные опроса по величине и расположим их в порядке возрастания
0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
5 5 5 5 6 6 6 7 7.
Составим вариационный ряд, записав в первую строку таблицы наблюдаемые значения (варианты), а во вторую соответствующие им частоты (таблица 1)
Таблица 1.
Варианты xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
∑ |
Частота ni |
4 |
13 |
14 |
24 |
16 |
4 |
3 |
2 |
80 |
Накопленная частота niнак |
4 |
17 |
31 |
55 |
71 |
75 |
78 |
80 |
- |
2) Полигон частот представляет собой ломаную, соединяющую точки (хi; ni), i=1, 2,…, m, где m – число различных значений признака X.
Изобразим полигон частот вариационного ряда (рис. 1).
Рис.1. Полигон частот
Кумулятивная кривая (кумулята) для дискретного вариационного ряда представляет ломаную, соединяющую точки (хi; niнак), i=1, 2,…, m.
Найдем накопленные частоты niнак (накопленная частота показывает, сколько наблюдалось вариантов со значением признака меньшим х). Найденные значения заносим в третью строку таблицы 1.
Построим кумуляту (рис. 2).
Рис.2. Кумулята
3)
Найдем относительные частоты (частости)
,
где ,
где m
– число различных значений признака
X,
которые будем вычислять с одинаковой
точностью.
Запишем ряд распределения относительных частот (частостей) в виде таблицы 2
Таблица 2
Варианты xi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
∑ |
Частость wi |
0,0500 |
0,1625 |
0,1750 |
0,3000 |
0,2000 |
0,0500 |
0,0375 |
0,0250 |
1 |
Накопленная частость wiнак |
0,0500 |
0,2125 |
0,3875 |
0,6875 |
0,8875 |
0,9375 |
0,9750 |
1,0000 |
|
4) Найдем основные числовые характеристики вариационного ряда:
а) Среднюю арифметическую , которая характеризует среднее значение признака X в пределах рассматриваемой выборки найдем, используя упрощенную формулу:
,
где - условные варианты
Положим с = 3 (одно из средних наблюдаемых значений), k = 1 (разность между двумя соседними вариантами) и составим расчетную таблицу (табл. 3).
Таблица 3.
xi |
ni |
ui |
ui ni |
ui2 ni |
0 |
4 |
-3 |
-12 |
36 |
1 |
13 |
-2 |
-26 |
52 |
2 |
14 |
-1 |
-14 |
14 |
3 |
24 |
0 |
0 |
0 |
4 |
16 |
1 |
16 |
16 |
5 |
4 |
2 |
8 |
16 |
6 |
3 |
3 |
9 |
27 |
7 |
2 |
4 |
8 |
32 |
Сумма |
80 |
|
-11 |
193 |
Тогда средняя арифметическая
б) Медианой Ме вариационного ряда называется значение признака, приходящееся на середину ранжированного ряда наблюдений. Данный дискретный вариационный ряд содержит четное число членов (n=80), значит, медиана равна полусумме двух серединных вариантов.
Модой Мо вариационного ряда называется вариант, которому соответствует наибольшая частота. Для данного вариационного ряда наибольшая частота nmax = 24 соответствует варианту х = 3, значит мода Мо=3.
в) Дисперсию s2, которая является мерой рассеяния возможных значений показателя X вокруг своего среднего значения, найдем, используя упрощенную формулу:
, где ui – условные варианты
Промежуточные вычисления также занесем в таблицу 3.
Тогда дисперсия
г) Среднее квадратическое отклонение s, которое описывает абсолютный разброс значений показателя X. Найдем по формуле:
.
д) Коэффициент
вариации
V, который
характеризует относительную изменчивость
показателя X,
то есть относительный разброс вокруг
его среднего значения .
()
,
Коэффициент вариации является безмерной величиной, поэтому он пригоден для сравнения рассеяния вариационных рядов, варианты которых имеют различную размерность.
Коэффициент вариации
.
5)
Смысл полученных результатов заключается
в том, что величина
характеризует
среднее значение признака X,
то есть среднее значение составило
2,86. Среднее квадратическое отклонение
s
описывает абсолютный разброс значений
показателя X
и в данном случае составляет s
≈ 1,55. Коэффициент вариации V
характеризует относительную изменчивость
показателя X,
то есть относительный разброс вокруг
его среднего значения ,
и в данном случае составляет .
Ответ:
;
;
;
.
