- •1. Статистическое наблюдение, его формы, виды и способы.
- •2. Виды статистических группировок. Построение группировки по количественному признаку
- •3. Абсолютные, средние и относительные статистические показатели.
- •4 Аналитические показатели временного ряда
- •5. Индивидуальные и сводные индексы, их взаимосвязи.
- •6. Методы проверки временных рядов на наличие тенденции.
- •7. Методы выбора формы трендовой модели
- •8. Построение моделей авторегрессионных преобразований.
- •1. Основан на использовании, так называемых, последовательных или конечных разностей.
- •2. Метод отклонений эмпирических значений признака от теоретических по уравнению тренда полученных.
- •3. Метод Фриша-Воу
- •9. Прогнозирование на основе средних аналитических показателей временных рядов.
- •10. Прогнозирование на основе экстраполяции тренда.
- •11. Прогнозирование с учетом дисконтирования информации
- •12. Прогнозирование на основе кривых роста Гомперца и Перля-Рида.
- •13. Автокорреляция, ее выявление в уровнях временного ряда
- •14. Прогнозирование связных временных рядов
- •15. Оценка точности и надежности прогнозов.
- •16. Основные понятия теории выборочного наблюдения
- •17. Алгоритмы формирования выборочной совокупности
- •18. Простая случайная и систематическая выборки
- •19. Расслоенная выборка
- •20. Кластерная (сериальная) выборка
- •21.Предмет, задачи и система показателей макроэкономической статистики
- •22. Статистическое исследование результатов экономической деятельности
- •23. Статистическое исследование трудового потенциала и трудовых ресурсов
- •24. Статистическое исследование цен и ценообразования
- •25.Статистическое исследование внешней экономической деятельности
- •26. Сводный счет «Производство», его назначение и система показателей.
- •27. Методология исчисления валового внутреннего продукта и национального дохода
- •28. Межотраслевой баланс производства и распределения продукции в снс
- •29. Система макроэкономических показателей, применяемая в международной статистической практике
- •30. Предмет, метод, функции и система показателей социальной статистики
- •1. Общество, его основные характеристики и дифференциация
- •2. Условия жизни
- •3. Уровень жизни (материальная сторона)
- •4. Способ жизни и качественные аспекты жизни
- •Расчет коэффициентов корреляции Кэндела и Спирмена . [-1;1]
- •31.Статистическое исследование социальной структуры и социальной мобильности населения
- •32.Статистическое исследование жизненного уровня населения
- •33.Статистическое исследование дифференциации населения по денежным доходам
- •34.Статистическое исследование сферы обслуживания и охраны здоровья населения
- •35.Предмет, задачи и система показателей демографической статистики
- •36.Статистическое исследование численности, размещения и состава населения
- •37.Статистическое исследование естественного движения населения
- •38.Статистическое исследование миграционного движения населения.
- •39.Статистическое исследование воспроизводства населения
- •40. Понятие, принципы и методы демографического прогнозирования
- •41.Случайные величины. Закон распределение вероятностей дискретной случайной величины
- •42. Функция распределения и плотность вероятности случайной величины, их свойства
- •43. Основные числовые характеристики случайной величины и их свойства
- •44.Биноминальный и нормальный законы распределения случайной величины
- •45.Парные и частные коэффициенты корреляции, их свойства
- •46. Множественные коэффициенты корреляции и детерминации, их свойства
- •47. Понятие генеральной совокупности и выборки из нее
- •48. Определение точечной оценки (статистики) и основные требования, предъявляемые к точечной оценке (несмещенность, состоятельность, эффективность)
- •49. Интервальные оценки параметров генеральной совокупности
- •50. Интервальная оценка генеральной средней нормально распределенной генеральной совокупности.
- •51. Интервальная оценка генеральной дисперсии нормально распределенной генеральной совокупности.
- •52. Статистические гипотезы и правила их проверки. Статистические критерии.
- •53. Сущность дисперсионного анализа. Основные задачи, решаемые с его помощью
- •54. Определение оценок параметров классической линейной модели множественной регрессии с помощью метода наименьших квадратов
- •55. Факторный и компонентный анализ как методы снижения размерности
- •56. Кластерный анализ как метод многомерной классификации
- •57. Проверка значимости уравнения множественной регрессии и его коэффициентов. Интервальное оценивание коэффициентов уравнения регрессии
- •58. Гомо- и гетероскедастичность остатков в регрессионных моделях.
- •59. Обобщенный метод наименьших квадратов (омнк). Свойства омнк-оценок
- •60. Дискриминантный анализ как метод многомерной классификаций с обучением
58. Гомо- и гетероскедастичность остатков в регрессионных моделях.
Термин гетероскедастичность в широком смысле означает предположение о дисперсии случайных ошибок регрессионной модели. Случайная ошибка – отклонение в модели линейной множественной регрессии:
Величина случайной регрессионной ошибки является неизвестной, поэтому вычисляется выборочная оценка случайной ошибки регрессионной модели по формуле: , где - остатки регрессионной модели.
Нормальная линейная регрессионная модель строится на основании следующих предположения о случайной ошибке:
Матожидание случайной ошибки уравнения регрессии равно 0 во всех наблюдениях: , где
Дисперсия случайной ошибки уравнения регрессии является постоянной для всех наблюдений:
Случайные ошибки уравнения регрессии не коррелированны между собой, то есть ковариация случайных ошибок любых двух разных наблюдений равна 0: , где
Условие трактуется как гомоскедастичность (однородный разброс) дисперсий случайных ошибок регрессионной модели. Гомоскедастичность – это предположение от том, что дисперсии случайной ошибки является известной постоянной величиной для всех наблюдений регрессионной модели. На практике предположение о гомоскедатичности случайной ошибки или остатков регрессионной модели далеко не всегда оказывается верным. Предположение о том, что дисперсии случайных ошибок являются разными величинами для всех наблюдений, называется гетероскедастичностью (неоднородный разброс). , где .
Условие гетероскедастичности можно записать через ковариационную матрицу случайных ошибок регрессионной модели.
, где
Тогда подчиняется нормальному закону распределения с параметрами: , где - матрица ковариации случайной ошибки.
Если дисперсии случайных ошибок регрессионной модели известны заранее, то от проблемы гетероскедастичности можно было бы легко избавиться. Но на практике, как правило, неизвестна даже точная функция зависимости между изучаемыми переменными, которую предстоит построить и оценить. Чтобы в подобранной регрессионной модели обнаружить гетероскедастичность, необходимо провести анализ остатков регрессионной модели. Проверяются следующие гипотезы:
Основная гипотеза , утверждающая о постоянстве дисперсий случайных ошибок регрессии, то есть о присутствии в модели условия гомоскедастичности:
Альтернативной гипотезой является предположение о неодинаковых дисперсиях случайных ошибок в различных наблюдениях, то есть о присутствии в модели условия гетероскедастичности:
Обнаружение гетероскедастичности.
Существует несколько тестов на обнаружение гетероскедастичности в регрессионной модели.
Тест Глейзера.
На первом этапе строится обычная регрессионная модель:
Методом наименьших квадратов вычисляются оценки коэффициентов построенной модели:
На следующем этапе вычисляются остатки регрессионной модели: .
Полученные регрессионные остатки возводятся в квадрат .
С целью обнаружение гетероскедастичности определяется коэффициент Спирмена.
Коэффициент Спирмена является аналогом парного коэффициента корреляции, но позволяет выявить взаимосвязь между качественным и количественным признаками. Зависимой переменной является , в качестве независимой выступает . Переменная ранжируется и располагается оп возрастанию. Ранги обозначаются как . Далее проставляются ранги переменной , обозначаемые как .
Коэффициент Спирмена рассчитывается по формуле: , где d – ранговая разность ( - ); n – количество пар вариантов.
Значимость коэффициента Сирмена проверяется с помощью t-критерия Стьюдента.
Критическое значение определяется по таблице распределения Стьюдента: .
Если , то основная гипотеза отвергается, и между переменной и остатками регрессионной модели существует взаимосвязь, то есть в модели присутствует гетероскедастичность.
Если , то основная гипотеза принимается, и в модели парной регрессии гетероскедастичность отсутсвует. Для модели множественной регрессии вывод может быть следующий: гетероскедастичность не зависит от выбранной переменной .
Устранение гетероскедастичности.
Наиболее простым методом устранение гетероскедастичности является взвешивание параметров регрессионной модели. Суть метода состоит в том, что отдельным наблюдениям независимой переменной с максимальным среднеквадратическим отклонением случайной ошибки придается больший вес, а остальным наблюдениям с минимальным среднеквадратическим отклонением случайной ошибки придается меньший вес. Благодаря этому оценки коэффициентов уравнения остаются эффективными. Модель регрессии при таком подходе называется взвешенной регрессией с весами .
Рассмотрим процесс взвешивания для линейной модели парной регрессии, в которой доказано наличие гетероскедастичности: , где .
Разделим регрессионное уравнение на среднеквадратическое отклонение случайной ошибки :
Данное уравнение записывают в линейном виде с помощью метода замен. Введем обозначения:
Уравнение регрессии записывают в преобразованном виде:
Эта регрессионная модель является моделью с двумя факторными переменными и .
Дисперсия случайной ошибки взвешенной регрессионной модели:
Основной проблемой рассмотренного подхода к устранению гетероскедастичности является необходимость априорного знания среднеквадратических отклонений случайных ошибок регрессионной модели. Такое условие в реальности практически невыполнимо, приходится прибегать к другим методам устранения гетероскедастичности.
Методы коррекции гетероскедастичности сводятся к нахождению ковариационной матрицы случайных ошибок регрессионной модели.
, где
Оценки находятся с помощью метода Бреуше-Пайана:
На основании уравнения регрессии находятся остатки и сумма квадратов остатков
Оценкой дисперсии остатков регрессионной модели будет величина:
Строится взвешенная регрессия, где весами является оценка дисперсии остатков регрессионной модели
Если взвешенное уравнение получается незначимым, то и оценки матрицы ковариаций являются неточными.
После нахождения оценок дисперсий остатков можно воспользоваться доступным обобщенным или взвешенным методом наименьших квадратов для вычисления оценок коэффициентов уравнения регрессии, которые различаются лишь оценкой . Если нельзя выполнить коррекцию гетероскедастичности, то вполне возможно вычислить оценки коэффициентов уравнения регрессии по обычному МНК, но корректировать ковариационную матрицу оценок коэффициентов , так как условие гетероскедастичности приводит к увеличению данной матрицы.
содержание