Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LEKTsIYa_2_LINEJNYE_REGRESSIONNYE_modeli.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
557.06 Кб
Скачать

1.6.Оценка значимости коэффициента парной корреляции

Любая совокупность наблюдений представляет собой некоторую выборку. Значит, значение любого показателя, рассчитанное на основе этой выборке, не может рассматриваться как истинное. В связи с этим, возникает необходимость проверки значимости этого показателя.

Для оценки значимости коэффициента корреляции применяется t - критерий Стьюдента. Фактическое значение этого критерия рассчитывается по формуле:

.

Вычисленное по этой формуле значение сравнивается с табличным значением t-критерия, которое берется из таблицы значений t-Стьюдента с учетом заданного уровня значимости и числа степеней свободы (α = 0,05 или 0,01, k = n -2 ).

Если > , то полученное значение коэффициента корреляции признается значимым. Таким образом, делается вывод о том, что между исследуемыми переменными есть статистическая взаимосвязь.

1.7.Парный коэффициент детерминации

Зная линейный коэффициент корреляции, можно рассчитать парный коэффициент детерминации r2ху. Он показывает, какая доля вариации переменной Y учтена в модели и обусловлена влиянием на неё переменной X.

Пример

По представленным данным о спросе и доходе населения за ряд текущих лет определить степень влияния дохода населения на его спрос. Оценить значимость коэффициента корреляции.

Год

Доход, Х

Спрос, Y

1

10

6

-5

-3,3

16,5

25

10,89

2

12

8

-3

-1,3

3,9

9

1,69

3

14

8

-1

-1,3

1,3

1

1,69

4

16

10,3

1

1

1

1

1

5

18

10,5

3

1,2

3,6

9

1,44

6

20

13

5

3,7

18,5

25

13,69

Итого

90

55,8

0

0

44,80

70,00

30,40

Среднее

15

9,3

0

0

7,47

11,67

5,07

Средние значения случайных величин Х и Y рассчитаем по формулам, соответственно:

.

Стандартные ошибки случайных величин Х и Y рассчитаем по формулам, соответственно:

Рассчитаем ковариацию:

.

Аналогичные расчеты можно получить, используя встроенные возможности электронных таблиц Excel: КОВАР(массив1; массив2), которая возвращает ковариацию, то есть среднее произведений отклонений для каждой пары точек данных.

Синтаксис функции:

Массив1    — это первый массив или интервал данных.

Массив2    — это второй массив или интервал данных.

Рассчитаем коэффициент парной корреляции:

.

Аналогичные расчеты также можно получить, используя встроенные возможности электронных таблиц Excel: КОРРЕЛ(массив1;массив2), которая возвращает коэффициент корреляции меду интервалами ячеек массив1 и массив2.

Синтаксис функции:

Массив1    — это ячейка интервала значений.

Массив2    — это второй интервал ячеек со значениями.

Оценим значимость коэффициента корреляции.

Для этого рассчитаем значение t – статистики:

Табличное значение критерия Стьюдента равно:

Воспользуемся встроенными возможности электронных таблиц Excel: функция СТЬЮДРАСПОБР(вероятность;степени_свободы) возвращает t-значение распределения Стьюдента как функцию вероятности и числа степеней свободы.

Синтаксис функции:

Вероятность - вероятность, соответствующая двустороннему распределению Стьюдента (α = 0,05 или 0,01).

Степени_свободы— число степеней свободы, характеризующее распределение (k = n -2).

Сравним числовые значения критериев:

.

Полученное значение коэффициента корреляции значимо.

Вычислим парный коэффициент детерминации:

r2ху = 0,9432.

Таким образом, доход населения (Х) оказывает весьма высокое влияние на спрос (Y). На 94% спрос населения зависит от дохода. Оставшиеся 6% (100 – 94) - это влияние неучтённых факторов.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]