
- •Министерство образования и науки украины
- •Третий модуль Тема 3. Корреляционно-регрессионный анализ данных наблюдений
- •Последовательность проведения корреляционно-регрессионного анализа
- •Введение в тему
- •Последовательность проведения корреляционно-регрессионного анализа
- •3.2. Проверка данных статистического наблюдения на наличие выбросов
- •3.3. Общие сведения из корреляционно-регрессионного анализа
- •3.4. Форма корреляционной связи
- •3.5. Теснота корреляционной связи
- •Проверка на тесноту связи
- •3.6. Сила корреляционной связи
- •3.7. Методикаполученияуравнений линейной регрессии в случае малых выборок Последовательность проведения регрессионного анализа
- •Технологияопределения в среде эт коэффициентовлинейнойрегрессии в случае малых выборок
- •Прогнозирование на основе полученной модели регрессии
- •3.8. Понятие о многомерном корреляционном анализе
- •Определение Для расчета используем ту же матрицу третьего порядка. Расчет ведем по формуле:
- •Коэффициент множественной корреляции
- •3.9. Создание математических моделей регрессии
- •Парный нелинейный регрессионный анализ
- •Экономический смысл коэффициентов регрессии
- •Многомерный нелинейный регрессионный анализ
- •3.10. Методика получения уравнений парной линейной регрессии при большом объеме выборки
- •3.11. Понятие о мультиколлинеарности
- •Тесты для самоконтроля
- •Характеристика тестов темы 3:
- •Контрольные задания
Определение Для расчета используем ту же матрицу третьего порядка. Расчет ведем по формуле:
Результаты
расчета в среде ЭТ представлены в таблице
3.10. Частный коэффициент корреляции
Оценим статистическую значимость
частного коэффициента корреляции.
Расчетное значение
- статистики
Критическое значение - равно 2.
Так как расчетное значение
- статистики меньше критического, то
нет причин отвергать нулевую гипотезу.
Частный коэффициент корреляции
показывает, что при фиксированном
значении признака
корреляция
между признаками
и
отсутствует.
Таблица 3.10. Результаты расчета
Определение частного
коэффициента корреляции второго порядка
Расчетная формула имеет вид:
(3.26)
Результаты
расчета в среде ЭТ представлены в таблице
3.11. Значения миноров получены с помощью
матричной функции МОПР мастера функций.
Для рассматриваемого примера имеем
следующие алгебраические дополнения:
Тогда
частный коэффициент корреляции
Таблица 3.11. Результаты расчета
Оценим значимость частного коэффициента корреляции.
Следовательно, нулевую гипотезу
отвергаем. Можно говорить о наличии
корреляционной связи между признаками
и
при
фиксированном значении признаков
и
Коэффициент множественной корреляции
Часто представляет интерес оценить связь одного из признаков со всеми остальными. Делается это с помощью коэффициента множественной корреляции
(3.27)
где
-
определитель корреляционной матрицы
-
алгебраическое дополнение к элементу
Оценкой коэффициента множественной корреляции является выборочный коэффициент множественной корреляции, определяемый по формуле
(3.28)
где
-
определитель корреляционной матрицы
-
алгебраическое дополнение к элементу
Квадраты
соответствующих коэффициентов
множественной корреляции называют
коэффициентами множественной детерминации
и обозначают соответственно
Детерминация
выражает
долю дисперсии в исследуемом признаке,
связанную с дисперсией в остальных
признаках. Например, исследуется
зависимость рентабельности
предприятия
от признака
- «премии и вознаграждения» и получено
=0,458.
Это означает, что примерно 45,8% меры
изменчивости рентабельности связано
с мерой изменчивости признака «премии
и вознаграждения». В случае исследования
трех переменных и более, как правило,
>
и
показывает, что когда оптимальным
образом соединяются остальные признаки
в соответствии с уравнением регрессии,
то это оказывает благотворное влияние
на результативный признак. Рис.3.6
представляет геометрический смысл
коэффициента детерминации.
Рис. 3.6. Геометрический смысл коэффициента детерминации
Пример 3.7. Определить оценки коэффициентов множественной корреляции и детерминации первого признака со всеми остальными, используя данные примера 3.6.
Расчетная формула в этом случае имеет вид:
Результаты расчета в среде ЭТ представлены в таблице 3.12.
Статистическую значимость коэффициентов
множественной корреляции и детерминации
проверяют с помощью критерия Фишера.
Проверяется нулевая гипотеза
Для
этого вычисляют статистику
,
имеющую
-
распределение с
степенями
свободы (
-
число фиксированных признаков).
Таблица 3.12. Результаты расчета
По приложению 2 [10] находят критическое значение критерия Фишера. Если расчетное значение критерия Фишера больше критического, то нулевая гипотеза отвергается. В противном случае нет причин отвергнуть нулевую гипотезу.
Для рассматриваемого примера
Нулевая гипотеза отвергается.
Следовательно, можно говорить о
корреляционной связи признака
с
остальными признаками.
Пример 3.8. Для многомерной выборки объектов недвижимости получена корреляционная матрица, представленная в таблице 3.13. Обозначения в этой таблице:
- стоимость 1м2 внутренней площади, у.е.;
- величина физического износа, %;
- доля подвальных помещений в общей площади;
- стоимость улучшений на 1м2 внутренней площади, у.е.
Таблица 3.13. Корреляционная матрица
|
|
|
|
|
|
1 |
-0,47691 |
-0,26374 |
0,560895 |
|
-0,47691 |
1 |
-0,00362 |
-0,57971 |
|
-0,26374 |
-0,00362 |
1 |
0,051953 |
|
0,560895 |
-0,57971 |
0,051953 |
1 |
Определить выборочные
частные коэффициенты корреляции
результативного признака
с каждым факторным признаком и
коэффициенты множественной корреляции
и детерминации.
Решение. Расчетные формулы в данном случае имеют вид:
В таблице 3.14 приведены результаты расчета в среде ЭТ.
Сравнение частных коэффициентов
корреляции с соответствующими
коэффициентами парной корреляции
показывает, например, что в парной
корреляции между стоимостью 1 м2 и величиной износа высока доля влияния
остальных признаков, так как частный
коэффициент корреляции меньше парного
().
Это можно объяснить тем, что среди зданий
с высоким уровнем износа в выборке чаще
встречаются подвальные помещения, на
реставрацию которых мало кто желает
вкладывать средства.
Величина коэффициента множественной корреляции показывает, что наблюдается заметная связь между стоимостью 1 м2 внутренней площади недвижимости и показателями уровня износа, доли подвальных помещений в общей площади, стоимости улучшений на 1 м2 . Коэффициент множественной детерминации показывает, что только 43,2% общей дисперсии стоимости 1 м2 внутренней площади недвижимости объясняется влиянием исследуемых факторных признаков. Следовательно, в математической модели регрессии не учтены еще важные факторные признаки.
Таблица 3.14. Результаты расчета