
- •Конспект лекций По курсу «описательная статистика» для студентов 2 курса специальностей:
- •Введение
- •Основные понятия описательной статистики.
- •Основные этапы статистической обработки данных. Формы организации и виды статистического наблюдения.
- •Способы отбора выборки. Точность статистического наблюдения.
- •Раздел I. Одномерные статистические признаки
- •Табличное представление экспериментальных данных.
- •Тема. Графическое изображение статистических данных
- •Средние величины. Степенные средние.
- •Структурные (порядковые) характеристики.
- •Показатели вариации
- •Правило сложения дисперсий
- •Моменты распределения. Характеристики формы распределения
- •Раздел II. Статистическое изучение взаимосвязи между признаками
- •Измерение взаимной зависимости
- •Оба признака заданы в количественной шкале
- •Оба признака заданы в порядковой шкале
- •Оба признака заданы в номинальной шкале.
- •Регрессионная зависимость двух признаков
- •Множественная регрессия
- •Раздел III. Статистическое изучение динамики
- •Характеристики описания временных рядов.
- •Тренды во временных рядах.
Тема. Графическое изображение статистических данных
Определение. Полигоном абсолютных частот называется ломаная, отрезки которой соединяют точки с координатами (x(1), m1), (x(2), m2), …, (x(k), mk).
Если вместо абсолютных частот рассматривать относительные частоты, то получим полигон относительных частот.
Замечание. Полигон частот ИВР образуется ломаной линией, соединяющей точки, соответствующие срединным значениям интервалов группировки и частотам этих интервалов.
Определение. Гистограммой абсолютных частот называют ступенчатую фигуру, состоящую из прямоугольников, основанием которых служат интервалы длиной h, а высоты равны отношению mi/h.
Очевидно, что в этом случае площадь каждого прямоугольника-столбика будет равна абсолютной частоте mi.
Если вместо абсолютных частот взять относительные, то получим гистограмму относительных частот.
Рассмотрим характеристики, которые называются накопленными частотами, и определяются следующим образом:
.
Определение. Кумулятивной кривой (кумулятой) ДВР называют ломаную, отрезки которой соединяют точки с координатами
(x(1), m1 c), (x(2), m2 c), …, (x(k), mk c).
Кумулятивную кривую можно строить и на основе накопленных относительных частот. В этом случае кумулятивной кривой называют ломаную, отрезки которой соединяют точки с координатами (x(1), w1c), (x(2), w2c),…,(x(k), wkc).
Определение. Кумулятивной кривой ИВР называют ломаную, отрезки которой соединяют точки с координатами (а1,0), (а2, m1 c), …, (аk+1, mk c).
Кумулятивную кривую ИВР также можно строить и на основе накопленных относительных частот. В этом случае кумулятивной кривой называют ломаную, отрезки которой соединяют точки с координатами
(а1, 0), (а2, w1 c), …, (аk+1, wk c).
Определение. Кривой концентрации (кривой Лоренца) называют кривую, которая получается в результате нанесения на один график относительных накопленных величин двух взаимосвязанных признаков. Эта кривая показывает степень концентрации отдельных элементов совокупности по группам.
В качестве меры концентрации доходов используется коэффициент К.Джинни KG., 0 KG 1. Если KG = 0, то имеет место равномерное распределение дохода. Чем ближе KG к 1, тем выше уровень социального неравенства.
Средние величины. Степенные средние.
Общая формула суммальной средней получается из балансового тождества:
(1)
Тождество (1)
означает, что левая часть в нем должна
оставаться неизменной, если каждое из
индивидуальных значений xi
заменить на некоторую постоянную
величину, называемую средней и обозначаемую
.
Вид функции (х)
определяет вид средней.
Если (х) = xр, рZ, то тождество (1) можно записать в виде
(1')
где
–
степенная средняя порядка р
для выборки
X =
{x1,
x2,…,
xn}.
Из (1), (1') получаем:
(2)
(3)
Равенство (3) является определением степенной средней порядка р.
р =1 – среднее арифметическое;
р =2 – среднее квадратическое;
р =3 – среднее кубическое;
р =-1 – среднее гармоническое;
р 0 – среднее геометрическое.
Получить формулу
для среднего геометрического подстановкой
невозможно, поэтому ее определяют как
,
считая, что
.
Формула (3) применяется для несгруппированных данных. Если же данные сгруппированы, то формула (3) преобразуется к виду
=
(4)
Если рассматривается
интервальное распределение частот, то
сначала необходимо вычислить срединные
значения интервалов группировки
.
Порядок, р |
Название |
Формула вычисления для несгруппированного ряда |
Формула вычисления для сгруппированного ряда |
– 1 |
Средняя гармоническая |
|
|
0 |
Средняя геометрическая |
|
|
1 |
Средняя арифметическая |
|
|
2 |
Средняя квадратическая |
|
|
3 |
Средняя кубическая |
|
|
Теорема. Степенная средняя является неубывающей функцией своего порядка:
…
… (5)
Равенства в (5) будут иметь место в случае, когда признак Х принимает только одно значение.