
- •Конспект лекций По курсу «описательная статистика» для студентов 2 курса специальностей:
- •Введение
- •Основные понятия описательной статистики.
- •Основные этапы статистической обработки данных. Формы организации и виды статистического наблюдения.
- •Способы отбора выборки. Точность статистического наблюдения.
- •Раздел I. Одномерные статистические признаки
- •Табличное представление экспериментальных данных.
- •Тема. Графическое изображение статистических данных
- •Средние величины. Степенные средние.
- •Структурные (порядковые) характеристики.
- •Показатели вариации
- •Правило сложения дисперсий
- •Моменты распределения. Характеристики формы распределения
- •Раздел II. Статистическое изучение взаимосвязи между признаками
- •Измерение взаимной зависимости
- •Оба признака заданы в количественной шкале
- •Оба признака заданы в порядковой шкале
- •Оба признака заданы в номинальной шкале.
- •Регрессионная зависимость двух признаков
- •Множественная регрессия
- •Раздел III. Статистическое изучение динамики
- •Характеристики описания временных рядов.
- •Тренды во временных рядах.
Раздел I. Одномерные статистические признаки
Определение. Ряд чисел, характеризующий распределение элементов совокупности по тому или иному признаку, называется рядом распределения. Ряды распределения можно строить как для количественного признака (вариационные ряды), так и для качественного признака (атрибутивные ряды). Если данные систематизированы по времени, то моделью группировки будет временной ряд.
Табличное представление экспериментальных данных.
Рассмотрим некоторый одномерный количественный признак. На практике, как правило, исследовать всю совокупность невозможно. Из нее производят выборку X = {x1, x2,…,xn} объема n.
Пусть в выборке Х много одинаковых значений наблюдений. В этом случае, в целях более компактного обозначения, ее представляют в виде дискретного вариационного ряда (ДВР). Введем понятие вариационного ряда с помощью алгоритма его построения.
Определим число k различных значений из числа всех n наблюдений выборки Х. Упорядочим эти значения по возрастанию. Получим
x(1)< x(2)<… < x(k),
где x(i) – i-ая варианта, i = 1,…, k. Обозначим х = {x(1), x(2),…, x(k)}.
Для каждой варианты x(i) вычислим ее абсолютную частоту
, – число появлений i-ой варианты в выборке Х объема n. Справедливо
.
Для каждой варианты x(i) вычислим ее относительную частоту
. Выполняется условие нормировки
.
х(i) |
x(1) |
x(2) |
… |
x(k) |
mi |
m1 |
m2 |
|
mk |
wi |
w1 |
w2 |
|
wk |
Такой вариационный ряд называется дискретным.
Интервальный вариационный ряд (ИВР) используется в тех случаях, когда общее число вариант больше n > 50, или когда исследуемый признак – непрерывный.
Для построения равноинтервального вариационного ряда применяется следующий метод группировки.
Определяются минимальное и максимальное значения выборки:
,
.
Вычисляется размах (диапазон) выборки R = xmax – xmin.
Весь диапазон значений признака [xmin, xmax] разбивается на k интервалов одинаковой длины. Число k определяется одним из следующих способов:
a) субъективным ( задается непосредственно).
b) по формуле
k = 1 + [3,322 lgn ] = 1 + [log2n], где n – объем выборки.
Определяется величина интервала h = R / k = (xmax – xmin) / k.
Определяются границы интервалов (ai, ai+1).
a1= xmin, a2 = a1 + h = xmin + h, …, ak+1 = ak + h = xmin + kh.
Подсчитывается mi – число вариант, попавших в i-ый интервал (ai, ai+1).
Все записывается в виде таблицы:
(ai, ai+1) |
[a1, a2) |
[a2, a3) |
… |
[ak -1 , ak) |
[ak , ak+1] |
mi |
m1 |
m2 |
… |
mk -1 |
mk |
wi |
w1 |
w2 |
… |
wk -1 |
wk |
Такая форма записи называется интервальным вариационным рядом.