- •Часть 1. Общая теория статистики
- •Глава 1. Введение в теорию статистики
- •Предмет и методы статистики.
- •Основные понятия статистики.
- •Глава 2. Описательная статистика.
- •По способу учета факторов:
- •2.1.2 Статистическая группировка и сводка.
- •2.1.3. Ряды распределения и их виды.
- •2.1.4. Графическое представление ряда распределения.
2.1.4. Графическое представление ряда распределения.
Все множество графических представлений рядов распределения разделяют на два класса: линейные графики и диаграммы.
К классу линейных графиков относятся: полигон, кумулята, кривая концентрации (кривая Лоренца3).
При построении полигона частот на оси абцисс откладываются значения признака (для дискретного вариационного ряда) или центральные значения интервалов (для интервального вариационного ряда); по оси ординат наносится шкала для выражения величин частот fj или частости wj. Полигон представляет собой ломанную, отрезки которой соединяют точки с координатами (xj, fj) или (xj, wj). При построении полигона вводятся фиктивные значения признака x0, и xm+1, при этом значения частоты или частости в этих точках равно нулю. Таким образом, полигон всегда замкнут на ось абцисс.
На рис. 1 приведено графическое изображение дискретного ряда распределения в виде полигона частот по данным, приведенным в табл. 4.
При построении полигона частот для интервального вариационного ряда часто возникают сложности, которые рассмотрим на примере построения полигона частот по данным, приведенным в табл. 9.
Как отмечалось выше, при построении полигона частот для таких рядов в качестве значения признака выбираются центральные значения интервалов. Анализ данных, приведенных в табл. 9 показывает, что для всех интервалов, за исключением последнего, выбор центра интервала не представляет никакой сложности. Последний интервал является открытым, поэтому для выбора его величины и последующего расчета центрального значения принимаем его длину равной длине предшествующего интервала, т.е. 10 лет. Поскольку полигон частот должен быть замкнут на ось абцисс, необходимо выбрать крайние фиктивные значения признака. Очевидно, что крайнее левое значение может быть выбрано, исходя из физического смысла признака, т.е. количество человек, имеющих нулевой возраст равно нулю. Крайнее правое фиктивное значение признака, может быть выбрано исходя из того, что количество человек, имеющих возраст 80 лет и выше пренебрежимо мало по сравнению с количеством человек попадающих в возрастную категорию от 70 до 79 лет. Поэтому в качестве крайнего правого значения выбираем центральное значение интервала 80-89 лет. Окончательно, данные необходимые для построения полигона частот приведены в табл. 10.
Таблица 10. Возрастная структура русского населения в России по данным переписи 2002 года.
Возрастная группа, лет |
Центральное значение интервала, xj, лет |
Количество человек, fi |
Накопленные частоты, Fj |
Частость, wj, % |
Накопленная частость, Wj, % |
0 |
0 |
0 |
0 |
0 |
0 |
0-9 |
4,5 |
10270800 |
10270800 |
8,9 |
8,9 |
10-19 |
14,5 |
18498800 |
28769600 |
16,0 |
24,9 |
20-29 |
24,5 |
17814800 |
46584400 |
15,4 |
40,3 |
30-39 |
34,5 |
15366400 |
61950800 |
13,2 |
53,5 |
40-49 |
44,5 |
19054600 |
81005400 |
16,4 |
69,9 |
50-59 |
54,5 |
12715200 |
93720600 |
11,0 |
80,9 |
60-69 |
64,5 |
11743800 |
105464400 |
10,1 |
91,0 |
70-79 |
74,5 |
10424700 |
115889100 |
9,0 |
100,0 |
80-89 |
84,5 |
0 |
|
0 |
0 |
На рис. 2 приведено графическое изображение интервального ряда распределения в виде полигона частот по данным, приведенным в табл. 10.
1 Ахенваль (Achenwall), Готфрид, знаменитый статистик (1719-1772), профессор в Геттингене, основатель теории статистики в сочинении "Abriss d. neuesten Staatswissenschaft", 1749.
2 Стерджесс -
3 Макс Отто Лоренц (Max Otto Lorenz; 1876-1959) — американский экономист, автор знаменитой «кривой Лоренца» (опубликована в 1905 г.), геометрически отражающей степень дифференциации доходов. Учился в Висконсинском университете. Работал в различных государственных учреждения США.