- •Содержание
- •2. Аналитическая группировка статистических данных
- •3. Корреляционно-регрессионный анализ статистических данных
- •Показатели тесноты корреляционной связи
- •Заключение
- •Список использованной литературы
- •Исходные статистические данные
- •Промежуточные данные для расчета коэффициента Фехнера
- •Промежуточные данные для расчета линейного коэффициента корреляции
3. Корреляционно-регрессионный анализ статистических данных
Показатели степени тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора. В известной мере они дополняют и развивают уже отмеченные приемы обнаружения связи.
К простейшим показателям степени тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г. Фехнером (1801 – 1887). Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков.
Если ввести обозначения: na – число совпадений знаков отклонений индивидуальных величин от средней, nb – число несовпадений знаков отклонений, то коэффициент Фехнера можно записать таким образом:
(3.1)
Коэффициент Фехнера может принимать различные значения в пределах от –1 до +1. Если знаки всех отклонений совпадут, то nb = 0 и тогда показатель будет равен 1, что свидетельствует о возможном наличии прямой связи. Если же знаки всех отклонений будут разными, тогда na = 0b и коэффициент Фехнера будет равен –1, что даёт основание предположить наличие обратной связи.
Более совершенным показателем степени тесноты связи является линейный показатель корреляции (r):
r
=
.
(3.2)
Линейный коэффициент корреляции может принимать любые значения в пределах от –1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи: прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.
Если с увеличением факторного признака x результативный признак y имеет тенденцию к увеличению, то величина коэффициента корреляции будет находиться между 0 и 1. Если же с увеличением значений x результативный признак y имеет тенденцию к снижению - коэффициент корреляции может принимать значения в интервале от 0 до –1.
Данные для определения коэффициента Фехнера, рассчитанные по исходным данным задачи, представлены в Приложении 2. Данные для расчета линейного коэффициента корреляции отражены в Приложении 3.
Результаты расчета показателей измерения степени тесноты связи между возрастом оборудования и эксплуатационными расходами отражены в табл. 3.1.
Таблица 3.1
Показатели тесноты корреляционной связи
Показатель |
1 объект |
2 объект |
3 объект |
Коэффициент Фехнера |
77,14 |
82,86 |
77,41 |
Линейный коэффициент корреляции |
93,34 |
96,07 |
96,30 |
Как свидетельствуют результаты расчетов, наиболее сильная связь между возрастом бурового оборудования и эксплуатационными расходами наблюдается на третьем объекте – 96,3 % вариации результативного признака обусловлено вариациями факторного признака, а 3,7% вариации обусловлено влияниям других факторов. Образованная связь между сроком эксплуатации оборудования и эксплуатационными издержками достаточно сильная.
Вторым этапом изучения статистической связи вслед за определением степени тесноты связи с помощью коэффициента корреляции идет этап установления формы связи или вида функции, объясняющей основную закономерность влияния факторного признака х на результативный признак у.
Под формой статистической связи понимают ту тенденцию, которая проявляется в изменении изучаемого результативного признака в связи с изменением факторного признака. Форму связи можно попытаться установить, построив в прямоугольной системе координат все множество пар значений признаков. По оси абсцисс откладываются значения факторного признака х, по оси ординат – значения признака у. Такое графическое построение называется полем корреляции или диаграммой рассеяния (рис.3.1-3.3).
Линия на графике, изображающая тенденцию в изменении результативного признака при возрастании факторного, называется линией регрессии. В случае прямолинейной связи линия регрессии ищется в виде уравнения прямой линии:
,
(3.3)
где
-
среднее значение результативного
признака у
при определенном значении факторного
признака х;
а - свободный член уравнения;
b – коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения.
Рис.3.1. Диаграмма рассеяния и линия регрессии первого объекта
Рис.3.2. Диаграмма рассеяния и линия регрессии второго объекта
Рис. 3.3. Диаграмма рассеяния и линия регрессии третьего объекта
Параметры уравнения а и b находятся методом наименьших квадратов (МНК). Система нормальных уравнений имеет вид:
;
(3.4)
В результате тождественных преобразований система принимает вид:
,
(3.5)
Из
первого уравнения находится параметр
:
,
(3.6)
Подставив это выражение во второе уравнение, получим:
,
(3.7)
Отсюда находим:
,
(3.8)
Тогда
.
(3.9)
Рассмотрим значения коэффициентов, полученных при расчете. Параметр а1 в уравнении регрессии называется коэффициентом регрессии. Коэффициент регрессии показывает среднее изменение результативного признака у при увеличении факторного признака х на единицу.
Получили уравнение прямолинейной связи для первого объекта:
y = 0,5099x + 19,983
можно утверждать, что при увеличении возраста бурового оборудования на один год эксплуатационные расходы возрастают в среднем на 0,5099 млн. руб.
Уравнение прямолинейной связи для второго объекта:
y = 0,7996x + 19,104
можно утверждать, что при увеличении возраста бурового оборудования на один год эксплуатационные расходы возрастают в среднем на 0,7996 млн. руб.
Уравнение прямолинейной связи для третьего объекта:
y = 0,7771x + 15,076
можно утверждать, что при увеличении возраста бурового оборудования на один год эксплуатационные расходы возрастают в среднем на 0,7771 млн. руб.
Следовательно, на втором объекте эксплуатационные затраты возрастают большими темпами, чем на первом и третьем объектах.
