
- •1 . Корреляционный анализ
- •1.1. Построение рядов распределения по факторному и результативному признакам
- •1.2. Построение поля корреляции
- •1.3. Построение корреляционной таблицы
- •1.6. Измерение тесноты связи
- •2. Определение показателей вариации
- •2.1. Вычисление показателей вариации
- •3) Определение показателей вариации
- •2.2. Вычисление дисперсий
- •3. Анализ динамических рядов
- •3.1. Вычисление показателей динамики
- •3.2. Установление наличия тренда
- •3.3. Прогнозирование динамического ряда
- •3.4. Анализ полученных результатов
1.6. Измерение тесноты связи
Коэффициент
корреляции
является
одним из наиболее совершенных методов
измерения тесноты связи. Коэффициент
корреляции отвечает на вопрос, в какой
мере соблюдается строгая пропорциональность
в изменениях функционального и
факториального признаков.
Коэффициент
корреляции может принимать как
положительные, так и отрицательные
значения, т.е.
.
При
выполнении корреляционных расчетов,
когда связь между признаками x и y
выражается прямой линией, соблюдается
условие, при котором знак при коэффициенте
корреляции
должен совпадать со знаком при коэффициенте
регрессии а1.
Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков x и y.
.
(12)
В
нашем примере исходную информацию для
нахождения
принимаем
из таблицы 1.10.
. (13)
Выполненные расчеты показывают, что между выработкой на одного рабочего и объемом строительно-монтажных работ существует положительная слабая корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y увеличивается.
Знак при коэффициенте корреляции совпадает со знаком регрессии a1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают умеренное влияние на функцию, так как r=0,33, следовательно имеем по соотношению Чэддока умеренную связь между изучаемыми явлениями.
Имеются и другие формулы линейного коэффициента корреляции,
Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:
, (14) или
(
15)
Числитель
формулы Error: Reference source not found, деленный на
n, т.е.
,
представляет собой среднее произведение
отклонений значений двух признаков от
их средних значений, именуемое ковариацией.
Поэтому можно сказать, что линейный
коэффициент корреляции представляет
собой частное от деления ковариации
между х и у на произведение их средних
квадратических отклонений. Путем
несложных математических преобразований
можно получить и другие модификации
формулы линейного коэффициента
корреляции, например:
. (16)
Линейный
коэффициент корреляции может принимать
значения от –1 до +1, причем знак
определяется в ходе решения. Например,
если
,
то r по формуле Error: Reference source not found будет
положительным, что характеризует прямую
зависимость между х и у, в противном
случае (r<0) – обратную связь. Если
,
то r=0, что означает отсутствие линейной
зависимости между х и у, а при r=1 –
функциональная зависимость между х и
у. Следовательно, всякое промежуточное
значение r от 0 до 1 характеризует степень
приближения корреляционной связи между
х и у к функциональной. Таким образом,
коэффициент корреляции при линейной
зависимости служит как мерой тесноты
связи, так и показателем, характеризующим
степень приближения корреляционной
зависимости между х и у к линейной.
Поэтому близость значения r к 0 в одних
случаях может означать отсутствие связи
между х и у, а в других свидетельствовать
о том, что зависимость не линейная.
В нашей задаче для расчета r построим вспомогательную таблицу 1.11.
Таблица 1.11
Вспомогательные расчеты линейного коэффициента корреляции
i |
xi |
yi |
|
|
|
|
1 |
292 |
116 |
589,165 |
846,281 |
706,116 |
33872 |
2 |
243 |
130 |
611,438 |
227,736 |
2448,545 |
31590 |
3 |
260 |
126 |
59,711 |
364,463 |
18556,364 |
32760 |
4 |
256 |
132 |
137,529 |
171,372 |
28975,818 |
33792 |
5 |
295 |
150 |
743,802 |
24,099 |
864488,727 |
44250 |
6 |
254 |
141 |
188,438 |
16,736 |
1297333,545 |
35814 |
7 |
248 |
147 |
389,165 |
3,645 |
15340,909 |
36456 |
8 |
256 |
156 |
137,529 |
119,008 |
10325,636 |
39936 |
9 |
280 |
163 |
150,620 |
320,736 |
9237,273 |
45640 |
10 |
276 |
150 |
68,438 |
24,099 |
294708,364 |
41400 |
11 |
285 |
185 |
298,347 |
1592,736 |
200642,727 |
52725 |
Сумма |
2945 |
1596 |
3374,182 |
3710,909 |
2742764,024 |
428235 |
Среднее |
267,727 |
145,091 |
306,744 |
337,355 |
249342,184 |
38930,455 |
Пользуясь данными табл. 1.11 рассчитаем линейный коэффициент корреляции по формулам 15 и 16.
Расчеты по различным формулам для коэффициента корреляции совпадают
1.7. Заключение по разделу «Корреляционный анализ»
По данным в таблице 1.1. рядам мы построили интервальные и дискретные ряды, посредствам вторых сделали вывод: ряд распределения по потерям рабочего времени, показывает, что для него есть три характерных группы с центральными значениями интервалов 249,5, 262,5 и 288,5 чел.-часов.
Если рассматривать другой ряд, то там вывод такой: ряд распределения по себестоимости строительно-монтажных работ показывает, что наиболее характерными являются группы с центральными значениями интервала 124,625 и 141,875 тыс.руб., так как они составляют 36,3% всей себестоимости каждая
Следующим шагом было построение корреляционной таблицы с помощью которой мы пришли к выводу, что себестоимостью строительно-монтажных работ и потерями рабочего времени существует линейная прямая связь.
Далее последовал расчет эмпирической линии регрессии, значения, по определяющему признаку которой мы записали в четвертой итоговой строке таблицы 1.9. после окончания расчетов, мы сделали вывод, что расчет эмпирической линии регрессии вновь подтвердил наличие слабой корреляционной зависимости между себестоимостью строительно-монтажных работ и потерями рабочего времени.
Затем мы совершили расчеты по определению теоретической линии регрессии, она еще раз подтвердила наличие корреляционной связи между изучаемыми признаками. После решения системы, мы получили уравнение теоретической линии в виде:
y=44,603+0,362x
С
целью определения тесноты связи между
определяющим и факторным признаком
высчитали коэффициент корреляции
.
Он показал, что между признаками
существует положительная корреляция,
которая говорит о том, что с увеличением
факторного признака x функциональный
признак y тоже увеличивается.
Знак
при корреляции совпадает со знаком
регрессии
,
что свидетельствует о правильности
произведенных вычислений. Чем ближе
к 1, тем сильнее связь между факторным
признаком x функциональным признаком
y.
В нашем случае она умеренная.