Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
связи, корреляционный анализ - лекция 11.doc
Скачиваний:
14
Добавлен:
01.04.2025
Размер:
810.5 Кб
Скачать

1.3. Оценка направления и тесноты линейной связи

При анализе экономических процессов для измерения тесноты, т.е. меры связи между признаками используются корреляционное отношение и коэффициент корреляции r.

В общем случае существование и относительную силу связи между исследуемыми факторами можно оценить посредством корреляционного отношения. Анализ следует начинать с построения поля корреляции. На практике иногда трудно различить линейную связь от нелинейной. Поэтому часто определяется выборочный коэффициент парной корреляции r, который помимо силы связи показывает и ее направленность.

Коэффициент корреляции определяется по формуле:

, (1)

где n - число пар значений исследуемых факторов (объем выборки); , , X, Y - средние значения и среднеквадратические отклонения факторного и результативного признаков соответственно.

Средние арифметические значения входного и выходного параметров вычисляются соответственно по формулам:

, (2)

где Xi и Yi – единичные значения фактических значений факторного и результативного признаков соответственно; n - число пар исходных данных.

Дисперсии рассматриваемых факторов определяются по формулам:

; . (3)

Коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределения которых близки к нормальным.

Значение коэффициента корреляции находятся в пределах от –1 до 1.

Принято считать: при r = 0,3 - слабая связь,

при r = 0,3 - 0,7 - средняя связь,

при r = 0,7 - сильная связь,

при r  0,9 - весьма сильная связь.

Для удобства расчета коэффициента корреляции можно использовать формулу

. (4)

1.4. Оценка достоверности коэффициента корреляции

Коэффициент парной корреляции, рассчитанный по выборочным данным, является случайной величиной. С уменьшением числа наблюдений надежность коэффициента корреляции падает. С увеличением числа наблюдений (свыше 500) распределение коэффициента корреляции r (не превышающее 0,9) стремится к нормальному.

Определенный по выборке коэффициент корреляции г является оценкой коэффициента корреляции  генеральной совокупности.

Доверительный интервал для оценки истинного значения коэффициента корреляции в генеральной совокупности () имеет вид:

r – tтаблr    r + tтаблr, ( 5 )

где r — средняя квадратическая ошибка выборочного коэффициента парной корреляции; tтабл параметр распределения Стьюдента с числом степеней свободы k = п - 2 и уровнем значимости а.

Если коэффициент корреляции меньше 0,9 или выборка мала, среднеквадратическая ошибка выборочного коэффициента корреляции r рассчитывается по формуле

Значимость коэффициента корреляции можно проверить с помощью статистики t, распределения Стьюдента с n - 2 степенями свободы.

Наблюдаемое значение t (tнабл) вычисляется как

Критическое значение (tтабл) определяется по таблице распределения Стьюдента (приложение ) по уровню значимости а и числу степеней свободы k=п-2.

По общему правилу проверки статистических гипотез:

  • если tнабл < tтабл, принимается нулевая гипотеза Н0: r = 0 т.е. между Х и Y отсутствует корреляционная связь (при заданном уровне значимости);

  • если tнабл  tтабл, принимается альтернативная гипотеза Н1: r  0, т.е. коэффициент корреляции значимо отличается от нуля и можно говорить о наличии корреляционной зависимости между Y и Х.

Критерий t подчиняется закону распределения Стьюдента с п - 2 степенями свободы.

Для оценки значимости r при малом объеме выборки целесообразно использовать z-преобразование Фишера. Для этого применяется статистика z:

, (6)

Р аспределение z асимптотически приближается к нормальному. Вариация z выражается формулой, которая распределена по нормальному закону со средним z и дисперсией z2:

Область принятия гипотезы о нулевой корреляции имеет вид:

, (7)

где z – стандартная, нормально распределенная случайная величина. Если расчетное значение окажется вне этого интервала, то это будет признаком наличия статистической корреляции с уровнем значимости .

Для  = 0,05 z/2 = 1,96;  = 0,02 z/2 = 2,32;

 = 0,01 z/2 = 2,58;  = 0,1 z/2 = 1,64.

Пример 1. Менеджера туристической ком­пании интересует, насколько возрастает привлека­тельность гостиницы в зависимости от ее расстоя­ния до пляжа. С этой целью по 14 гостиницам горо­да была выяснена среднегодовая наполняемость но­меров и расстояние в километрах от пляжа. Статистические данные приведены в таблице 2

Таблица 2 - Данные к примеру 1

Расстояние, км

0,1

0,1

0,2

0,3

0,4

0,4

0,5

0,6

0,7

0,7

0,8

0,8

0,9

0,9

Наполняемость, %

92

95

96

90

89

86

90

83

85

80

78

76

72

75

На рисунке видно, что связь между исследуемыми факторами обратно пропорциональная, т. е. с увеличением расстояния гостиницы от пляжа ее наполняемость ее уменьшается.

Рисунок 4 – Поле корреляции для примера 1

Оценим силу связи между исследуемыми факторами с помощью коэф-фициента корреляции. Значение коэффициента корреляции r = 0,94 говорит о наличии достаточно сильной обратно пропорциональной зависимости между данными факторами. Так как выборка мала (n < 30), то целесообразно произвести проверку значимости коэффициента корреляции с помощью z-преоб-разования Фишера. Расчеты показали, что zрасч.=5,87 > z табл.= 1,96 при уровне значимости =0,05. Таким образом, нет оснований, сомневаться в присутствии связи между исследуемыми факторами.