
- •Конспект лекций По курсу «описательная статистика» для студентов 2 курса специальностей:
- •Введение
- •Основные понятия описательной статистики.
- •Основные этапы статистической обработки данных. Формы организации и виды статистического наблюдения.
- •Способы отбора выборки. Точность статистического наблюдения.
- •Раздел I. Одномерные статистические признаки
- •Табличное представление экспериментальных данных.
- •Тема. Графическое изображение статистических данных
- •Средние величины. Степенные средние.
- •Структурные (порядковые) характеристики.
- •Показатели вариации
- •Правило сложения дисперсий
- •Моменты распределения. Характеристики формы распределения
- •Раздел II. Статистическое изучение взаимосвязи между признаками
- •Измерение взаимной зависимости
- •Оба признака заданы в количественной шкале
- •Оба признака заданы в порядковой шкале
- •Оба признака заданы в номинальной шкале.
- •Регрессионная зависимость двух признаков
- •Множественная регрессия
- •Раздел III. Статистическое изучение динамики
- •Характеристики описания временных рядов.
- •Тренды во временных рядах.
Измерение взаимной зависимости
Для измерения взаимной зависимости двух признаков используются коэффициенты корреляции, зависящие от шкал измерения признаков.
Существует 3 основных вида шкал:
Номинальная или шкала наименований;
Порядковая или ранговая;
Количественная.
Среди количественных шкал различают: интервальные и шкалы отношений.
Оба признака заданы в количественной шкале
Для оценки тесноты связи между признаками используется парный линейный коэффициент корреляции Пирсона, который определяется формулой:
,
где величина ху называется ковариацией.
Свойства коэффициента корреляции
rxy[-1; 1] или | rxy | 1.
Чем ближе | rxy | к 1, тем зависимость между признаками более тесная.
Чем ближе | rxy | к 0, тем более слабая зависимость между признаками.
Если rxy < 0,то зависимость обратная.
Если rxy > 0, то зависимость прямая.
rxy является симметричной характеристикой, т.е. rxy = ryх.
Используется коэффициент корреляции Фехнера:
,
где С, Н – это
взвешенные частотами mij
соответственно
число совпадений и несовпадений знаков
отклонений значений признаков Х
и Y
от своих средних значений
.
Оба признака заданы в порядковой шкале
В этом случае для анализа статистической зависимости используется коэффициент корреляции Спирмена, который называется коэффициентом корреляции ранга.
Определение. Ранг – порядковый номер значения признака в ранжированной (упорядоченной) совокупности.
Если некоторые из значений признаков Х или Y равны друг другу, то ранг всех таких значений полагается равным среднему арифметическому из тех номеров мест, которые эти значения занимают в ранжированной совокупности. Такие ранги называют связанными.
В случае отсутствия связанных рангов коэффициент Спирмена вычисляется по формуле:
,
–
разность рангов.
В случае присутствия связанных рангов используется коэффициент вида:
,
где
,
,
р – количество связанных рангов признака Х;
ti(x) – количество значений признака Х в i-ом связанном ранге;
q – количество связанных рангов признака Y;
tj(y) – количество значений признака Y в j-ом связанном ранге.
Оба признака заданы в номинальной шкале.
Пусть оба признака заданы в дихотомической шкале, т.е. принимают по два альтернативных значения 0 или 1, да или нет. В этом случае распределение признаков можно представить в виде таблицы
-
Х\Y
0
1
mx
0
m11
m12
mx0
1
m21
m22
mx1
my
my0
my1
n
my0 = m11+ m21; my1 = m12+ m22.
Для определения тесноты связи используются:
Коэффициент
ассоциации
;
Коэффициент
контингенции
.
Применяют коэффициент корреляции Пирсона:
,
где рх – доля выборочных значений признака X, равных 1;
ру – доля выборочных значений признака Y, равных 1;
рху – доля вариант (xi, yi) с единичными значениями у обоих признаков.