Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТИСТИКА 10 Вариант.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
315.9 Кб
Скачать

3. Корреляционно-регрессионный анализ статистических данных

Показатели степени тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора. В известной мере они дополняют и развивают уже отмеченные приемы обнаружения связи.

К простейшим показателям степени тесноты связи относят коэффициент корреляции знаков, который был предложен немецким ученым Г. Фехнером (1801 – 1887). Этот показатель основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных пар признаков.

Если ввести обозначения: na – число совпадений знаков отклонений индивидуальных величин от средней, nb – число несовпадений знаков отклонений, то коэффициент Фехнера можно записать таким образом:

(3.1)

Коэффициент Фехнера может принимать различные значения в пределах от –1 до +1. Если знаки всех отклонений совпадут, то nb = 0 и тогда показатель будет равен 1, что свидетельствует о возможном наличии прямой связи. Если же знаки всех отклонений будут разными, тогда na = 0b и коэффициент Фехнера будет равен –1, что даёт основание предположить наличие обратной связи.

Более совершенным показателем степени тесноты связи является линейный показатель корреляции (r):

r = . (3.2)

Линейный коэффициент корреляции может принимать любые значения в пределах от –1 до +1. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. Знак при линейном коэффициенте корреляции указывает на направление связи: прямой зависимости соответствует знак плюс, а обратной зависимости – знак минус.

Если с увеличением факторного признака x результативный признак y имеет тенденцию к увеличению, то величина коэффициента корреляции будет находиться между 0 и 1. Если же с увеличением значений x результативный признак y имеет тенденцию к снижению - коэффициент корреляции может принимать значения в интервале от 0 до –1.

Данные для определения коэффициента Фехнера, рассчитанные по исходным данным задачи, представлены в Приложении 2. Данные для расчета линейного коэффициента корреляции отражены в Приложении 3.

Результаты расчета показателей измерения степени тесноты связи между возрастом оборудования и эксплуатационными расходами отражены в табл. 3.1.

Таблица 3.1

Показатели тесноты корреляционной связи

Показатель

1 объект

2 объект

3 объект

Коэффициент Фехнера

77,14

82,86

77,41

Линейный коэффициент корреляции

93,34

96,07

96,30

Как свидетельствуют результаты расчетов, наиболее сильная связь между возрастом бурового оборудования и эксплуатационными расходами наблюдается на третьем объекте – 96,3 % вариации результативного признака обусловлено вариациями факторного признака, а 3,7% вариации обусловлено влияниям других факторов. Образованная связь между сроком эксплуатации оборудования и эксплуатационными издержками достаточно сильная.

Вторым этапом изучения статистической связи вслед за определением степени тесноты связи с помощью коэффициента корреляции идет этап установления формы связи или вида функции, объясняющей основную закономерность влияния факторного признака х на результативный признак у.

Под формой статистической связи понимают ту тенденцию, которая проявляется в изменении изучаемого результативного признака в связи с изменением факторного признака. Форму связи можно попытаться установить, построив в прямоугольной системе координат все множество пар значений признаков. По оси абсцисс откладываются значения факторного признака х, по оси ординат – значения признака у. Такое графическое построение называется полем корреляции или диаграммой рассеяния (рис.3.1-3.3).

Линия на графике, изображающая тенденцию в изменении результативного признака при возрастании факторного, называется линией регрессии. В случае прямолинейной связи линия регрессии ищется в виде уравнения прямой линии:

, (3.3)

где - среднее значение результативного признака у при определенном значении факторного признака х;

а - свободный член уравнения;

b – коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения.

Рис.3.1. Диаграмма рассеяния и линия регрессии первого объекта

Рис.3.2. Диаграмма рассеяния и линия регрессии второго объекта

Рис. 3.3. Диаграмма рассеяния и линия регрессии третьего объекта

Параметры уравнения а и b находятся методом наименьших квадратов (МНК). Система нормальных уравнений имеет вид:

; (3.4)

В результате тождественных преобразований система принимает вид:

, (3.5)

Из первого уравнения находится параметр :

, (3.6)

Подставив это выражение во второе уравнение, получим:

, (3.7)

Отсюда находим:

, (3.8)

Тогда

. (3.9)

Рассмотрим значения коэффициентов, полученных при расчете. Параметр а1 в уравнении регрессии называется коэффициентом регрессии. Коэффициент регрессии показывает среднее изменение результативного признака у при увеличении факторного признака х на единицу.

Получили уравнение прямолинейной связи для первого объекта:

y = 0,5099x + 19,983

можно утверждать, что при увеличении возраста бурового оборудования на один год эксплуатационные расходы возрастают в среднем на 0,5099 млн. руб.

Уравнение прямолинейной связи для второго объекта:

y = 0,7996x + 19,104

можно утверждать, что при увеличении возраста бурового оборудования на один год эксплуатационные расходы возрастают в среднем на 0,7996 млн. руб.

Уравнение прямолинейной связи для третьего объекта:

y = 0,7771x + 15,076

можно утверждать, что при увеличении возраста бурового оборудования на один год эксплуатационные расходы возрастают в среднем на 0,7771 млн. руб.

Следовательно, на втором объекте эксплуатационные затраты возрастают большими темпами, чем на первом и третьем объектах.