
- •1.1. Предмет юридической статистики
- •1.2. Отрасли юридической статистики
- •1.3. Методы юридической статистики
- •Литература
- •Лекция 2 Статистическое наблюдение
- •2. Статистическое наблюдение
- •2.1. Понятие статистического наблюдения и организация его проведения
- •2.2. Организационные формы статистического
- •2.3. Виды и способы статистического наблюдения
- •Литература
- •Лекция 3 Сводка и группировка материалов статистического наблюдения
- •3. Сводка и группировка материалов статистического наблюдения
- •3.1. Понятие статистической сводки и группировки
- •3.2. Виды статистических группировок
- •3.3. Статистические ряды распределения
- •3.4. Способы представления статистических показателей
- •Литература
- •Лекция 4 Обобщающие статистические показатели
- •4. Обобщающие статистические показатели
- •4.1. Абсолютные и относительные величины
- •4.2. Индексы
- •4.3. Средние величины
- •Литература
- •Лекция 5 Выборочный метод
- •5. Выборочный метод
- •5.1. Генеральная и выборочная совокупности
- •5.2. Статистическое распределение выборки
- •5.3. Показатели вариации признака
- •5.4. Расчет дисперсии качественных и количественных признаков
- •5.5. Определение ошибки выборки и объема выборки
- •6.2. Статистические показатели динамики
- •7.2. Моделирование тенденции временного ряда
- •7.3. Моделирование циклических колебаний ряда
- •Литература
- •Лекция 8 Статистические методы изучения взаимосвязей
- •8. Статистические методы изучения взаимосвязей
- •8.1. Понятие статистических взаимосвязей
- •8.2. Регрессионный анализ
- •Литература
- •Лекция 9 Корреляционный анализ
- •9. Корреляционный анализ
- •9.1. Исследование корреляционных зависимостей
- •9.2. Выявление корреляционной связи между двумя признаками
- •9.3. Количественная оценка тесноты связи между факторами
- •9.4. Множественная корреляция
- •Литература
9.2. Выявление корреляционной связи между двумя признаками
Простейшим приемом обнаружения связи является сопоставление ряда значений факторного признака и соответствующего ему ряда значений результативного признака.
Если при возрастании величины факторного признака наблюдается рост результативного признака, то говорят о возможном наличии прямой корреляционной связи. Если с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную корреляционную связь между признаками.
Между криминогенными факторами и преступностью существует прямая корреляционная связь. Например, чем выше уровень алкоголизации в обществе, тем выше преступность. Между факторами антикриминогенными и преступностью действует обратная корреляционная зависимость. Например, чем выше социальный контроль в обществе, тем ниже преступность.
И прямые, и обратные связи могут быть линейными и криволинейными. В случае линейной связи аналитическое выражение связи между признаками имеет вид линейной регрессии, а при криволинейной связи – нелинейной регрессии (параболической, гиперболической и т.д.).
Примером криволинейной связи может служить связь преступности и возраста правонарушителей. Вначале криминальная активность растет с увеличением возраста правонарушителей (примерно до 30 лет), а затем с увеличением возраста преступная активность снижается.
Пусть имеем два ряда наблюдений величин X и Y. Если пары наблюдаемых значений (xi, yi) встречаются по одному разу, то их записывают в виде табл. 9.1.
Таблица 9.1
i |
1 |
2 |
… |
n |
xi |
x1 |
x2 |
… |
xn |
yi |
y1 |
y2 |
… |
yn |
Здесь i – номер наблюдения.
Если каждому значению yi соответствуют несколько значений X, а каждому значению xi – несколько значений Y, то данные записывают в виде табл. 9.2.
Таблица 9.2
Y X |
y1 |
y2 |
… |
ym |
x1 |
n11 |
n12 |
… |
n1m |
x2 |
n21 |
n22 |
… |
n2m |
… |
… |
… |
… |
… |
xk |
nk1 |
nk2 |
… |
nkm |
Здесь числа nij – частоты, показывающие, сколько раз повторяются парные значения (xi, yi). Например, n24 показывает, сколько раз произошло событие, состоящее в том, что X = x2 и Y = y4.
Последняя таблица, в которой результаты наблюдений записаны в порядке возрастания X и Y, называется корреляционной таблицей.
В отличие от функциональной связи между признаками здесь нет строго соответствия между X и Y, но можно найти соответствие между значениями одной и средним значением другой величины.
Если X и Y (X или Y) имеют большое количество значений, то можно осуществлять группировку признаков. Для этого разность между максимальным и минимальным значениями признака (xmax – xmin или уmax – уmin) делится на число групп. В результате находим величину интервала, а затем определяем центральные значения интервалов.
Для определения числа групп l можно воспользоваться формулой Стэрджесса
l = 1,322 lg n,
где n – общее число наблюдаемых значений признака.
Предположим, что имеем два статистических ряда, характеризующих за 20 лет количество административных проступков (X) и преступлений (Y), совершенных на крупном предприятии.
Таблица9.3
i |
Число административных правонарушений (хi) |
Число преступлений (уi) |
1 |
72 |
8 |
2 |
80 |
9 |
3 |
80 |
8 |
4 |
82 |
9 |
5 |
85 |
8 |
6 |
85 |
9 |
7 |
88 |
9 |
8 |
90 |
10 |
9 |
90 |
11 |
10 |
92 |
10 |
11 |
95 |
9 |
12 |
95 |
10 |
13 |
100 |
10 |
14 |
100 |
11 |
15 |
100 |
12 |
16 |
106 |
10 |
17 |
110 |
12 |
18 |
115 |
11 |
19 |
120 |
11 |
20 |
120 |
12 |
Установим наличие или отсутствие корреляционной связи между факторным признаком X и результативным признаком Y.
В таблице данные расположены не хронологически, а в порядке возрастания числа административных правонарушений.
Можно видеть, что в целом с возрастанием числа правонарушений наблюдается и рост числа преступлений, хотя в отдельных случаях такая зависимость не усматривается.
Большое число различных значений факторного признака X затрудняет восприятие представленных рядов значений. Проведем группировку значений X. При этом группировку значений результативного признака Y проводить не будем, так как имеем всего пять различных значений Y.
Для признака X определим величину интервала h:
,
где xmax – xmin = 120 - 72 = 48.
По формуле Стэрджесса находим
l = 1,322 lg 20 ≈ 5.
Таким
образом,
.
Построим корреляционную таблицу, в которой добавим столбец с центральными значениями интервалов.
Таблица 9.4
Центральное значение интервала |
|
8 |
9 |
10 |
11 |
12 |
76,5 |
72-81 |
2 |
1 |
|
|
|
86,5 |
82-91 |
1 |
3 |
1 |
1 |
|
96,5 |
92-101 |
|
1 |
3 |
1 |
1 |
106,5 |
102-111 |
|
|
1 |
|
1 |
116 |
112-120 |
|
|
|
2 |
1 |
Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угла таблицы в правый нижний (как в примере), то можно предположить наличие прямой корреляционной зависимости между X и Y. Если частоты расположены по другой диагонали, то можно предположить обратную связь между признаками.
Для предварительного выявления наличия связи и раскрытия ее характера применяют графический метод. В прямоугольных координатах X, Y строят точечный график, который называют полем корреляции.
Нанесем
на поле корреляции средние значения
для каждого значения уi.
Соединяя эти значения отрезками прямых,
получим эмпирическую линию связи. По
виду ломаной выясняем вид корреляционной
связи (линейная, криволинейная). Исходя
из этого строим ту или иную регрессионную
модель, то есть строим уравнение
(или
),
которое называется уравнением регрессии
Y
на
X
(или уравнением регрессии X
на Y).
Эти уравнения определяют теоретические
линии регрессии.
Анализ поля корреляции и эмпирической лини связи для рассматриваемого примера показывает, что между X и Y существует прямая и линейная корреляционная связь.