2. Вариационные ряды и их графическое изображение
Пусть из генеральной совокупности извлечена выборка объема n, при этом значение x1 наблюдалось n1 раз, x2 наблюдалось n2 раз и т.д. xm–nm раз, где n1+ n2+…+nm=n.
Наблюдаемые значения x1, x2,…, xm называются вариантами.
Числа наблюдений
n1,
n2,…,
nm
называются частотами,
а отношение их к общему числу наблюдений
– частостями
или относительными
частотами
.
Частоты и частости называются весами.
Определение 1: вариационным рядом называется ранжированный в порядке возрастания или убывания ряд вариантов с соответствующими им весами (частотами или частостями)
Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину
Пример 1: Путем опроса получены следующие данные (n=20):
2 4 2 4 3 3 3 2 0 6
3 3 1 1 2 3 1 4 3 1
Составить вариационный ряд, предварительно записав ранжированный ряд вариантов.
Решение:
Отсортируем данные опроса по величине и расположим их в порядке возрастания:
0 1 1 1 1 2 2 2 2 3 3 3 3 3 3 3 4 4 4 6
Составим вариационный ряд, записав в первую строку таблицы наблюдаемые значения (варианты), а во вторую соответствующие им частоты (таблица 1)
Таблица 1.
Варианты хi |
0 |
1 |
2 |
3 |
4 |
6 |
∑ |
Частоты ni |
1 |
4 |
4 |
7 |
3 |
1 |
20 |
Ряд распределения относительных частот (частостей) будет иметь вид:
Таблица 2.
Варианты хi |
0 |
1 |
2 |
3 |
4 |
6 |
∑ |
Частости wi |
1/20 |
4/20 |
4/20 |
7/20 |
3/20 |
1/20 |
1 |
Если число возможных значений исследуемого признака велико или если признак является непрерывным (варианты отличаются один от другого на сколь угодно малую величину), то рассматривают интервальный вариационный ряд. Для построения такого ряда промежуток изменения признака разбивается на ряд отдельных интервалов и подсчитывается частота попаданий значений величины в каждый из них.
Число интервалов
m
следует брать не очень большим, чтобы
после группировки ряд не был громоздким,
и не очень малым, чтобы не потерять
особенности распределения признака.
На практике обычно считают, что правильно
составленный интервальный вариационный
ряд содержит от 6 до 15 интервалов. Согласно
формуле
Стерджеса
рекомендуемое число интервалов ,
а величина интервала (ширина интервала)
.
Однако фактическое число интервалов и
ширина интервала, определяются условиями
конкретной задача.
При изучении вариационных рядов наряду с понятием частоты используют понятие накопленной частоты, которая обозначается niнак. Накопленная частота показывает, сколько наблюдалось вариантов со значением признака меньшим х.
Пример 2: По данным примера 1 составить ряд распределения накопленных частот.
Решение:
В первую строку таблицы запишем наблюдаемые значения, а во вторую накопленные частоты (таблица 3)
Таблица 3.
Варианты хi |
0 |
1 |
2 |
3 |
4 |
6 |
Накопленные частоты niнак |
1 |
5 |
9 |
16 |
19 |
20 |
Отношение накопленной
частоты niнак
к общему числу наблюдений n
называется накопленной
частостью
wiнак
= .
Для графического изображения вариационных рядов широко используются:
− полигон;
− гистограмма;
− кумулятивная кривая.
Полигон, как правило, служит для изображения дискретного вариационного ряда и представляет собой ломаную, соединяющую точки (хi; ni), i=1, 2,…, m. Для построения полигона частот по оси Ох откладывают варианты x1, x2,…, xm, а на оси ординат соответствующие этим вариантам частоты n1, n2,…, nm. Полигон может быть построен и для относительных частот (частостей wi).
Пример 3: Построить полигон для ряда из примера 1
Рис. 1. Полигон частот
Гистограмма служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями равными интервалам значений признака hi = хi+1 – хi, i=1, 2,…, m и высотами равными частотам ni (или частостями wi) интервалов.
Пример 4: Построить гистограмму для интервального вариационного ряда (таблица 4).
Таблица 4.
Интервалы |
1-3 |
3-5 |
5-7 |
7-9 |
9-11 |
11-13 |
Частоты ni |
4 |
3 |
6 |
2 |
3 |
2 |
Рис. 2. Гистограмма
Кумулятивная кривая (кумулята) – кривая накопленных частот (или частостей). Для дискретного вариационного ряда кумулята представляет ломаную, соединяющую точки (хi; niнак) или (хi; wiнак), i=1, 2,…, m. Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю. Другие точки этой ломаной соответствуют концам интервалов.
Пример 5: Построить кумуляты для вариационных рядов из примеров 1 и 4
На рисунке 3 представлены соответствующие кумулятивные кривые (а – для примера 1, б – для примера 4)
|
|
а |
б |
Рис. 2. Кумулятивная кривая |
|
