- •Случайные величины и законы их распределения
- •Закон распределения случайной величины х
- •Нормальный закон распределения и функция Лапласа Нормальный закон распределения характеризуется плотностью
- •Корреляционный анализ
- •Основные показатели деятельности предприятий (данные условные)
- •Расчетная таблица для определения линейного коэффициента корреляции
- •Расчетная таблица для определения коэффициента конкордации
Нормальный закон распределения и функция Лапласа Нормальный закон распределения характеризуется плотностью
Задача 1. Определите математическое ожидание случайной величины с равномерным распределением.
Решение.
как это и должно быть в силу симметрии распределения.
Задача 2.
Вычислите дисперсию и среднее квадратичное отклонение для случайной величины с равномерным распределением.
Решение.
Для практического вычисления дисперсии удобно использовать формулу:
D(X) = M(X2) - M2(X).
Действительно,
D(X) = M(X - m)2 = M(X2 - 2mX + m2) =
M(X2) - 2mM(X) + m2 = M(X2) - 2 m2 + m2 = M(X2) - m2.
Отсюда
Следовательно,
Корреляционный анализ
Корреляция — математическое понятие, указывающее на статистическую связь, существующую между изучаемыми явлениями (признаками). Изучение зависимости вариации признака от окружающих условий составляет содержание теории корреляции.
К простейшим показателям степени тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г. Фехнером. Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем устанавливают знаки отклонений для всех значений взаимосвязанных пар признаков.
Формула коэффициента Фехнера выглядит так:
Основные показатели деятельности предприятий (данные условные)
Завод
|
Основные производственные фонды, млн. руб. xi |
Валовой выпуск продукции, млн. руб. yi |
Знаки отклонений от средней величины
|
|
|
|
|||
1 |
12 |
28 |
— |
— |
2 |
16 |
40 |
— |
— |
3 |
25 |
38 |
— |
— |
4 |
38 |
65 |
— |
— |
5 |
43 |
80 |
— |
— |
6 |
55 |
101 |
+ |
+ |
7 |
60 |
95 |
+ |
— |
8 |
80 |
125 |
+ |
+ |
9 |
91 |
183 |
+ |
+ |
10 |
100 |
245 |
+ |
+ |
∑ |
520 |
1000 |
|
|
Более совершенным показателем степени тесноты связи является линейный коэффициент корреляции (r), который был предложен английским ученым К. Пирсоном:
Линейный коэффициент корреляции может принимать любые значения в пределах от —1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками.
Выполнив несложные преобразования, можно получить следующую формулу для расчета линейного коэффициента корреляции:
Расчетная таблица для определения линейного коэффициента корреляции
№ п/п
|
Часовая оплата труда, руб. x |
Уровень текучести кадров, % y |
x2
|
х
|
у2
|
1
|
3
|
34
|
9
|
102
|
1156
|
2
|
4
|
35
|
16
|
140
|
1225
|
3
|
5
|
33
|
25
|
165
|
1089
|
4
|
6
|
28
|
36
|
168
|
784
|
5
|
7
|
20
|
49
|
140
|
400
|
6
|
8
|
24
|
64
|
192
|
576
|
7
|
9
|
15
|
81
|
135
|
225
|
8
|
10
|
11
|
100
|
110
|
121
|
Σ |
52
|
200
|
380
|
1152
|
5576
|
Средняя величина
|
6,5
|
25
|
47,5
|
144
|
697
|
(
|
(
|
( 2)
|
(
|
(
|
Найдем:
=
2,29;
Линейный коэффициент корреляции
2-ой вариант вычислений линейного коэффициента корреляции
№ п/п
|
x
|
y
|
x -
|
y-
|
(х - х)(у - )
|
(х - )2
|
(у - )2
|
1
|
3
|
34
|
-3,5
|
9
|
-31,5
|
12,25
|
81
|
2
|
4
|
35
|
-2,5
|
10
|
-25,0
|
6,25
|
100
|
3
|
5
|
33
|
-1,5
|
8
|
-12,0
|
2,25
|
64
|
4
|
6
|
28
|
-0,5
|
3
|
-1,5
|
0,25
|
9
|
5
|
7
|
20
|
0,5
|
-5
|
-2,5
|
0,25
|
25
|
6
|
8
|
24
|
1,5
|
-1
|
-1,5
|
2,25
|
1
|
7
|
9
|
15
|
2,5
|
-10
|
-25,0
|
6,25
|
100
|
8
|
10
|
11
|
3,5
|
-14
|
-49,0
|
12,25
|
196
|
∑
|
52
|
200
|
0
|
0
|
-148,0
|
42,00
|
576
|
Отсюда
Показатели, используемые для измерения степени связи между качественными признаками
Коэффициенты корреляции, основанные на использовании рангов, были предложены К. Спирмэном и М. Кендэлом.
Ранг — это порядковый номер, присваиваемый каждому индивидуальному значению х и у (отдельно) в ранжированном ряду. Оба признака необходимо ранжировать (нумеровать) в одном и том же порядке: от меньших значений к большим или наоборот. Чаще нумерация (присвоение ранга) от 1 до п идет по возрастанию значений признака. Если встречается несколько одинаковых значений х (или у), то каждому из них присваивается ранг, равный частному от деления суммы рангов (мест в ряду), приходящихся на эти значения, на число равных значений.
Коэффициент корреляции рангов Спирмэна основан на рассмотрении суммарной разности рангов факторного и результативного признаков.
Обозначим разность между соответствующими рангами через di. Тогда формула коэффициента корреляции рангов Спирмэна имеет следующий вид:
Расчетная таблица для определения коэффициента корреляции рангов Спирмэна
x
|
y
|
Ранги
|
Разность рангов d = Nx - Ny
|
d2
|
|
Nx
|
Ny |
||||
3
|
34
|
1
|
7
|
-6
|
36
|
4
|
35
|
2
|
8
|
-6
|
36
|
5
|
33
|
3
|
6
|
-3
|
9
|
6
|
28
|
4
|
5
|
-1
|
1
|
7
|
20
|
5
|
3
|
2
|
4
|
8
|
24
|
6
|
4
|
2
|
4
|
9
|
15
|
7
|
2
|
5
|
25
|
10
|
11
|
8
|
1
|
7
|
49
|
n = 8
|
|
|
|
|
Σd2 = 164
|
Подставим в вышеприведенную формулу рассчитанные значения Σd2= 164 и n = 8, получим:
Коэффициент конкордации
Если число ранжируемых признаков (факторов) больше двух, то для измерения тесноты связи между ними можно использовать предложенный М. Кендэлом и Б. Смитом коэффициент конкордации (множественный коэффициент ранговой корреляции)
где S — сумма квадратов отклонений суммы m рангов от их средней величины;
m — число ранжируемых признаков;
n — число ранжируемых единиц (число наблюдений).
Рассмотрим расчет коэффициента конкордации для случая, когда по каждому признаку ранги не повторяются.
Пример. Предположим, по четырем опрошенным семьям получены данные о их годовом доходе, числе детей и сбережениях за год (см. графы 2-4 табл.). В этой же таблице приведены расчеты всех необходимых показателей. В рассматриваемом примере m = 3, а n = 4.
Обозначив
через
ранг i-го
фактора (признака) у j-й
единицы, ранжируем каждый из трех
факторов (графы 5—7), а затем найдем сумму
рангов по каждой строке и итог по графе
8.
Расчет S можно выполнить двояко: используя итоги граф 8 и 9 или 8 и 10.
Таблица
