
- •2. Суть корреляционного и регрессионного анализа. Основные задачи решаемые методами анализа
- •3. Поле корреляции
- •4. Линейная регрессия и корреляция, смысл и оценка параметров. Сопряженные регрессионные прямые
- •5. Метод наименьших квадратов (мнк). Обобщенный мнк
- •6. Свойства оценок мнк. Проверка качества уравнения регрессии.
- •7. Проверка значимости коэффициента корреляции и коэффициента детерминации
- •8. Оценка существенности параметров линейной регрессии и корреляции.
- •9. Интервалы прогноза по линейному уравнению регрессии. Проверка значимости оценок параметров регрессии
- •10 Влияние неучтенных факторов на коэффициент корреляции
- •11. Распределение коэффициентов регрессии и корреляции
- •12. Множественная регрессия.
- •13. Линейная модель множественной регрессии. Проверка линейности модели
- •14. Спецификация модели. Коэффициент множественной детерминации. Коэффициент частной детерминации. Коэффициент частной детерминации между объясняющими переменными
- •15. Отбор факторов при построении множественной регрессии
- •16. Мультиколлениарность
- •17. Выбор формы уравнения регрессии
- •18. Оценка параметров уравнения множественной регрессии.
- •19. Обобщенный метод наименьших квадратов
- •20. Частные уравнения регрессии
- •21. Множественная корреляция.
- •22. Частная корреляция.
- •23. Оценка надежности результатов множественной регрессии и корреляции.
- •24. Нелинейные модели регрессии. Множественная нелинейная регрессия
- •25. Логарифмические модели
- •26. Полулогарифмические модели
- •33. Метод максимального правдоподобия
- •34. Метод линеаризации
- •35. Коэффициент детерминации. Коэффициент конкордации
- •36. Функция правдоподобия в математической статистике - это совместное распределение выборки из параметрического распределения как функция параметра.
- •37. Метод Бокса-Кокса
- •38. Коэффициент ранговой корреляции Спирмена.
- •39. Коэффициенты эластичности
- •40. Фиктивные переменные
- •41. Проверка значимости для коэффициента корреляции
- •42. Проверка значимости для коэффициента детерминации.
- •43. Проверка линейной регрессии
- •44. Коэффициент детерминации при простой линейной регрессии.
- •45. Коэффициент множественной детерминации
- •46. Коэффициент частной детерминации
- •47. Коэффициент детерминации между объясняющими переменными
- •48. Стандартные ошибки оценок
45. Коэффициент множественной детерминации
Если изучаемое явление зависит не от одного, а от нескольких явлений, то зависимость между ними описывается с помощью множественной регрессии, а для установления доли дисперсии, обусловленной воздействием изменений объясняющих переменных, вычисляется коэффициент множественной детерминации.
Выражение коэффициента множественной детерминации можно получить путем обобщения формулы (7) с учетом соображений, из-ложенных в разделах 1 и 2:
(13)
Индекс при Вуказывает на то, чтоуявляется зависимой переменной и вариабельность всех объясняющих переменныхх1, ..., хmрассматривается одновременно в изучаемой регрессии.
Интерпретация
аналогична интерпретации коэффициента
детерминации для простой линейной
регрессии. Коэффициент
указывает, как велика доля объясненной
дисперсии в общей дисперсии, какая часть
общей дисперсии может быть объяснена
зависимостью переменнойуот
переменных х1, ..., хm. Величина коэффициента
множественной детерминации заключена
в интервале
.
Коэффициент
детерминации равен 1, если этом случае говорят о линейной
функциональной зависимости. Коэффициент
детерминации равен 0, если
.
В этом случае говорят об отсутствии
линейной зависимости в смысле представлений
регрессионного анализа.
Приведем теперь формулу коэффициента детерминации к виду, удобному для вычислений. При этом ограничимся вначале регрессией с двумя объясняющими переменными. Уравнение множественной линейной регрессии можно представить в таком виде:
или
(14)
Возведя
в квадрат обе части равенства (14) и
просуммировав все отклонения, раскроем
скобки. С учетом формул (=
)
и (
=
)
получим следующее выражение:
(15)
Подставим этот результат в (13):
(16)
или
(17)
С помощью формулы (17) сравнительно легко можно найти коэффициент множественной детерминации для двух объясняющих переменных.
Пример
Определим долю дисперсии производительности труда, обусловленную линейной зависимостью от уровня механизации работ и среднего возраста работников, по данным из приложения Б. По формуле (17) получим
Найденная величина коэффициента множественной регрессии означает, что на основе полученной оценки функции регрессии 94,47% общей дисперсии объясняется зависимостью производительности труда от уровня механизации работ и среднего возраста работников. Это свидетельствует о том, что данная регрессия хорошо соответствует эмпирическим данным. Лишь 5,53% общей дисперсии приходится на влияние прочих, не учтенных в регрессии факторов-переменных.
Формулу (16) обобщим для регрессии с mобъясняющими переменными:
(18)
Разделив
числитель и знаменатель формулы (18) на
, получим:
(19)
Введем вектор
(20)
элементами
которого являются ,k = 1, ..., m.
Вектор
— это вектор ковариацийmобъясняющих
переменных с зависимой переменнойу.
Далее, пусть
(21)
— вектор коэффициентов регрессии. Он получается путем вычеркивания первой компоненты (постоянной регрессии) из вектора параметров регрессии b. С учетом этого условия формула (19) принимает вид
(22)
—транспонированный векторb1.
Пример
Определим
с помощью формулы (22) по данным из
приложения Б долю дисперсии
производительности труда, обусловленную
зависимостью от уровня механизации
работ, среднего возраста работников и
среднего процента выполнения нормы.
Вектор b1получается из вектораbпараметров
регрессии путем вычеркивания постоянной
регрессииb0.
Векторковариаций объясняющих переменных с
зависимой переменной строим в виде
(20). Таким образом, можем записать
;
;
В результате получаем значение коэффициента детерминации:
Итак, 94,51% общей дисперсии обусловливается зависимостью производительности труда от перечисленных выше объясняющих переменных. И только 5,49% общей дисперсии не может быть объяснено этой зависимостью на основе полученной оценки функции регрессии. Таким образом, предполагая, что уравнение регрессии статистически значимо, его подбор выполнен очень хорошо.
Так
же, как коэффициент парной детерминации,
коэффициент множественной детерминации
не изменится, если изменится размерность
переменных или они подвергнутся линейным
преобразованиям. Отсюда следует важный
вывод: при применении стандартизованных
переменных ()
остается таким же процентное отношение
к общей вариации той ее части, которая
определена влиянием объясняющих
переменных на зависимую, выраженных в
натуральном масштабе. Если для
стандартизованных переменных
,
то (частный случай)
(23)
т. е. коэффициент детерминации равен «объясненной» дисперсии, а коэффициент неопределенности равен «необъясненной» дисперсии.
Часто,
особенно при небольшом объеме выборки
n, пользуются исправленным
коэффициентом детерминации,
так как число объясняющих переменных
существенно уменьшает число степеней
свободы. Итак, введение поправки на
число степеней свободы дает нам
исправленный, несмещенный коэффициент
детерминации. Число степеней свободы
общей дисперсии разлагается также на
две составляющие:
(24)
Соотношение между двумя коэффициентами — с поправкой и без нее — может быть после соответствующих выкладок представлено в виде
(25)
При
этом определяется по формуле (35) (см. раздел
6). Коэффициент детерминации без поправки
на число степеней свободы никогда не
уменьшается с добавлением к регрессии
новой объясняющей переменной (возможно
даже некоторое незначительное его
увеличение), в то время как для исправленного
коэффициента это оказывается возможным.
Следует учитывать, что всегда
(26)
Пример
Вычислим по данным из приложения Б исправленные коэффициенты множественной детерминации для регрессии с двумя и тремя объясняющими переменными:
Значения коэффициентов детерминации подтверждают приведенные выше утверждения. Введение новой переменной х3не привело к существенному дополнению в объяснении переменнойу, а точнее, в объяснении ее вариации. Поэтому при двух одинаково приемлемых с профессионально-теоретической точки зрения функциях регрессии рекомендуется отдавать предпочтение той, для которой исправленный коэффициент детерминации оказался больше.