- •Теория статистики
- •Содержание
- •Тема 1. Предмет и метод статистической науки
- •1.1 Справочные материалы
- •1.2. Контрольные вопросы к теме 1
- •1.3. Контрольные задания к теме 1
- •Тема 2. Статистическое наблюдение
- •2.1. Справочные материалы
- •2.2. Контрольные вопросы к теме 2
- •2.3. Контрольные задания к теме 2
- •Тема 3. Сводка и группировка статистических данных
- •3.1. Справочные материалы
- •3.2. Контрольные вопросы к теме 3
- •3.3. Контрольные задания к теме 3
- •Тема 4. Абсолютные и относительные статистические величины
- •4.1. Справочные материалы
- •4.2. Контрольные вопросы к теме 4
- •4.3. Контрольные задания к теме 4
- •Тема 5. Средние величины
- •5.1. Справочные материалы
- •5.2. Контрольные вопросы к теме 5
- •5.3. Контрольные задания к теме 5
- •Тема 6. Меры вариации
- •6.1. Справочные материалы
- •Меры вариации для сгруппированных данных. Правило сложения дисперсий.
- •Вариация альтернативного (качественного) признака. Правило сложения дисперсий для доли признака.
- •Показатели дифференциации и концентрации
- •6.2. Контрольные вопросы к теме 6
- •6.3. Контрольные задания к теме 6
- •Тема 7.Статистическое изучение связи между явлениями
- •7.1 Справочные материалы Виды и формы связей, различаемые в статистике
- •Измерение тесноты связи в случае корреляционной зависимости
- •Оценка достоверности коэффициента корреляции
- •Ранговая корреляция
- •Корреляция альтернативных признаков
- •Множественная корреляция
- •7.2. Контрольные вопросы к теме 7
- •7.3. Контрольные задания к теме 7
- •Тема 8. Анализ динамики социально-экономических процессов
- •Справочные материалы
- •Анализ сезонных колебаний
- •Автокорреляция в рядах динамики
- •8.2. Контрольные вопросы к теме 8
- •8.3. Контрольные задания к теме 8
- •Тема 9. Индексы
- •9.1. Справочные материалы
- •Сводные индексы в среднеарифметической и среднегармонической формах
- •Индексный анализ изменения взвешенной средней: индексы переменного и постоянного состава и структурных сдвигов
- •Ряды индексов с постоянной и переменной базой сравнения (цепные и базисные)
- •Ряды индексов с постоянными и переменными весами
- •9.2. Контрольные вопросы к теме 9
- •9.3. Контрольные задания к теме 9
- •Список литературы
Оценка достоверности коэффициента корреляции
Для более наглядного представления об оценке достоверности (значимости) коэффициента корреляции построена таблица 7.4.
Таблица 7.4.
Оценка достоверности (значимости) коэффициента корреляции
Характеристики коэффициента корреляции |
Средняя квадратическая ошибка |
Вывод о значимости коэффициента корреляции делается, если: |
Большое число наблюдений, распределение приближенно нормальное, r < 0,9 |
|
|
Малое число наблюдений (n < 30), распределение далеко от нормального, r < 0,9 |
|
|
Малое число наблюдений (n < 30), распределение далеко от нормального, r > 0,9 |
|
z – преобразование Фишера |
Доверительные границы коэффициента корреляции рассчитываются как:
,
(7.8)
где
- генеральное значение коэффициента
корреляции;
-
заданный уровень вероятности.
Пример7.4. Проверить значимость коэффициента корреляции, рассчитанного по данным примера 7.1.
Решение:
,
,
тогда
,
что указывает на значимость коэффициента
корреляции.
Ранговая корреляция
В анализе социально-экономических явлений широко используются ранговые коэффициенты корреляции (коэффициенты корреляции рангов), когда коррелируют не непосредственные значения X и Y, а их ранги, т.е. номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию. К таким непараметрическим коэффициентам относятся коэффициенты рангов Спирмена и Кендэлла.
Коэффициент ранговой корреляции Спирмена:
(7.9)
Значимость коэффициента ранговой корреляции Спирмена:
(7.10)
Коэффициент
корреляции Спирмена считается
статистически значимым, если
,
где
находится по таблице распределения
Стьюдента с параметрами
.
Пример 7.5. Имеются данные о затратах на рекламу продукции и объеме выручки от реализации продукции (табл. 7.5.; графы А и Б)
Таблица 7.5.
Зависимость затрат на рекламу продукции и объема выручки от реализации продукции
Затраты на рекламу продукции, тыс. руб., Х |
Объем выручки от реализации продукции, млн. руб., У |
|
|
|
|
А |
Б |
1 |
2 |
3 |
4 |
1,5 |
26 |
2 |
1 |
1 |
1 |
2,4 |
71 |
3 |
3 |
0 |
0 |
8,6 |
45 |
10 |
2 |
8 |
64 |
1,3 |
95 |
1 |
4 |
-3 |
9 |
3,3 |
112 |
4 |
5 |
-1 |
1 |
4,0 |
130 |
6 |
6 |
0 |
0 |
5,1 |
145 |
7 |
7 |
0 |
0 |
6,1 |
190 |
8 |
8 |
0 |
0 |
3,5 |
220 |
5 |
9 |
-4 |
16 |
7,1 |
231 |
9 |
10 |
-1 |
1 |
Итого |
- |
- |
- |
- |
92 |
Вычислить коэффициент Спирмена.
Решение:
Определив
ранги значений X
и Y
и их разность (табл. 7.5.; графы 1,
2, 3, 4), получаем
.
При условии, что ранги не повторяются, коэффициент ранговой корреляции Кендэлла рассчитывается как:
,
(7.11)
где S – фактическая сумма рангов
При этом соблюдаем следующую последовательность действий:
Значения Х ранжируются в порядке возрастания или убывания.
Значения У располагаются в порядке соответствующем значениям Х.
Для каждого ранга У определяется число следующих за ним значений рангов, превышающих его величину. Результат записывается в столбец «+», суммируется и обозначается Р.
Для каждого ранга У определяется число следующих за ним меньших значений рангов. Результат записывается в столбец «-», суммируется и обозначается Q.
Определяется общая сумма S=P+Q.
Интерпретация коэффициентов Спирмена и Кендэлла аналогична интерпретации коэффициента корреляции Пирсона.
Пример 7.6. Рассчитаем значение коэффициента Кендэлла на основании данных примера 7.5
Решение:
Х |
У |
1-й шаг |
2-й шаг |
3-й шаг «+» |
4-й шаг «-» |
1,5 |
26 |
1,3 |
95 |
6 |
3 |
2,4 |
71 |
1,5 |
26 |
8 |
0 |
8,6 |
45 |
2,4 |
71 |
6 |
1 |
1,3 |
95 |
3,3 |
112 |
5 |
1 |
3,3 |
112 |
3,5 |
220 |
1 |
4 |
4,0 |
130 |
4,0 |
130 |
3 |
1 |
5,1 |
145 |
5,1 |
145 |
2 |
1 |
6,1 |
190 |
6,1 |
190 |
1 |
1 |
3,5 |
220 |
7,1 |
231 |
0 |
1 |
7,1 |
231 |
8,6 |
45 |
- |
- |
Итого |
- |
- |
|
P=32 |
Q=-13 |
5-й
шаг: S=P+Q=32+(-13)=19,
тогда
Существенность коэффициента корреляции рангов Кэндэлла проверяется по формуле:
,
(7.12)
где
- коэффициент, определяемый по таблице
нормальгого распределения для выбранного
уровня значимости
при больших п.
Коэффициент
Кендэлла всегда меньше по значению, чем
коэффициент Спирмена, точнее
.
Это соотношение выполняется при большом
числе наблюдений, т.е п>30,
и слабых либо умеренно тесных связях.
Если отдельные значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяются. Данные ранги называются связанными (или повторяющимися). Для случая связанных рангов есть особые скорректированные формулы для коэффициентов Спирмена и Кендэлла, однако на практике часто пользуются формулами приведенными выше.
