- •1 . Корреляционный анализ
- •1.1. Построение рядов распределения по факторному и результативному признакам
- •1.2. Построение поля корреляции
- •1.3. Построение корреляционной таблицы
- •1.6. Измерение тесноты связи
- •2. Определение показателей вариации
- •2.1. Вычисление показателей вариации
- •3) Определение показателей вариации
- •2.2. Вычисление дисперсий
- •3. Анализ динамических рядов
- •3.1. Вычисление показателей динамики
- •3.2. Установление наличия тренда
- •3.3. Прогнозирование динамического ряда
- •3.4. Анализ полученных результатов
1.6. Измерение тесноты связи
Коэффициент корреляции является одним из наиболее совершенных методов измерения тесноты связи. Коэффициент корреляции отвечает на вопрос, в какой мере соблюдается строгая пропорциональность в изменениях функционального и факториального признаков.
Коэффициент корреляции может принимать как положительные, так и отрицательные значения, т.е. .
При выполнении корреляционных расчетов, когда связь между признаками x и y выражается прямой линией, соблюдается условие, при котором знак при коэффициенте корреляции должен совпадать со знаком при коэффициенте регрессии а1.
Для расчета коэффициента корреляции существует формула, представленная в упрощенных координатах признаков x и y.
. (12)
В нашем примере исходную информацию для нахождения принимаем из таблицы 1.10.
. (13)
Выполненные расчеты показывают, что между выработкой на одного рабочего и объемом строительно-монтажных работ существует положительная слабая корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y увеличивается.
Знак при коэффициенте корреляции совпадает со знаком регрессии a1, что свидетельствует о правильности произведенных вычислений. Случайные факторы оказывают умеренное влияние на функцию, так как r=0,33, следовательно имеем по соотношению Чэддока умеренную связь между изучаемыми явлениями.
Имеются и другие формулы линейного коэффициента корреляции,
Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:
, (14) или ( 15)
Числитель формулы Error: Reference source not found, деленный на n, т.е. , представляет собой среднее произведение отклонений значений двух признаков от их средних значений, именуемое ковариацией. Поэтому можно сказать, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений. Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например:
. (16)
Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле Error: Reference source not found будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) – обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.
В нашей задаче для расчета r построим вспомогательную таблицу 1.11.
Таблица 1.11
Вспомогательные расчеты линейного коэффициента корреляции
i |
xi |
yi |
||||
1 |
292 |
116 |
589,165 |
846,281 |
706,116 |
33872 |
2 |
243 |
130 |
611,438 |
227,736 |
2448,545 |
31590 |
3 |
260 |
126 |
59,711 |
364,463 |
18556,364 |
32760 |
4 |
256 |
132 |
137,529 |
171,372 |
28975,818 |
33792 |
5 |
295 |
150 |
743,802 |
24,099 |
864488,727 |
44250 |
6 |
254 |
141 |
188,438 |
16,736 |
1297333,545 |
35814 |
7 |
248 |
147 |
389,165 |
3,645 |
15340,909 |
36456 |
8 |
256 |
156 |
137,529 |
119,008 |
10325,636 |
39936 |
9 |
280 |
163 |
150,620 |
320,736 |
9237,273 |
45640 |
10 |
276 |
150 |
68,438 |
24,099 |
294708,364 |
41400 |
11 |
285 |
185 |
298,347 |
1592,736 |
200642,727 |
52725 |
Сумма |
2945 |
1596 |
3374,182 |
3710,909 |
2742764,024 |
428235 |
Среднее |
267,727 |
145,091 |
306,744 |
337,355 |
249342,184 |
38930,455 |
Пользуясь данными табл. 1.11 рассчитаем линейный коэффициент корреляции по формулам 15 и 16.
Расчеты по различным формулам для коэффициента корреляции совпадают
1.7. Заключение по разделу «Корреляционный анализ»
По данным в таблице 1.1. рядам мы построили интервальные и дискретные ряды, посредствам вторых сделали вывод: ряд распределения по потерям рабочего времени, показывает, что для него есть три характерных группы с центральными значениями интервалов 249,5, 262,5 и 288,5 чел.-часов.
Если рассматривать другой ряд, то там вывод такой: ряд распределения по себестоимости строительно-монтажных работ показывает, что наиболее характерными являются группы с центральными значениями интервала 124,625 и 141,875 тыс.руб., так как они составляют 36,3% всей себестоимости каждая
Следующим шагом было построение корреляционной таблицы с помощью которой мы пришли к выводу, что себестоимостью строительно-монтажных работ и потерями рабочего времени существует линейная прямая связь.
Далее последовал расчет эмпирической линии регрессии, значения, по определяющему признаку которой мы записали в четвертой итоговой строке таблицы 1.9. после окончания расчетов, мы сделали вывод, что расчет эмпирической линии регрессии вновь подтвердил наличие слабой корреляционной зависимости между себестоимостью строительно-монтажных работ и потерями рабочего времени.
Затем мы совершили расчеты по определению теоретической линии регрессии, она еще раз подтвердила наличие корреляционной связи между изучаемыми признаками. После решения системы, мы получили уравнение теоретической линии в виде:
y=44,603+0,362x
С целью определения тесноты связи между определяющим и факторным признаком высчитали коэффициент корреляции . Он показал, что между признаками существует положительная корреляция, которая говорит о том, что с увеличением факторного признака x функциональный признак y тоже увеличивается.
Знак при корреляции совпадает со знаком регрессии , что свидетельствует о правильности произведенных вычислений. Чем ближе к 1, тем сильнее связь между факторным признаком x функциональным признаком y.
В нашем случае она умеренная.