Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ОТС, лекция № 71.docx
Скачиваний:
2
Добавлен:
23.11.2019
Размер:
706.52 Кб
Скачать
  1. Проверка независимости последовательных остатков.

Является важнейшим критерием адекватности модели и осуществляется с помощью коэффициента Дарбина-Уотсона:

(7.47) Для рядов с тесной взаимосвязью между последовательными значениями остатков значение близко к нулю, что свидетельствует о том, что закономерная составляющая не полностью отражена в модели и частично закономерность присуща ряду остатков, т.е. модель неадекватна исходному процессу.

Если последовательные остатки независимы, то близко к 2. Это свидетельствует о хорошем качестве модели и чистой фильтрации закономерной составляющей.

При отрицательной автокорреляции остатков (строго периодичном чередовании их знаков) близко к 4.

Для проверки существенности положительной автокорреляции остатков значение сравнивается с и из табл. 2 Приложения 2:

  • если , то гипотеза о независимости остатков отвергается и модель признается неадекватной по критерию независимости остатков;

  • если , то гипотеза о независимости остатков принимается и модель признается адекватной по данному критерию;

  • если , то значение критерия лежит в области неопределенности.

Если , то возникает предположение об отрицательной автокорреляции остатков, и тогда с критическими значениями сравниваются не , а и делаются аналогичные выводы.

  1. Проверка постоянства дисперсии остатков.

Если на графике остатков они укладываются в симметричную относительно нулевой линии полосу шириной (модуль стандартных остатков меньше 3) и не имеют как положительной так и отрицательной тенденций, то дисперсии ошибок наблюдений можно считать постоянными.

Кроме визуальной оценки постоянства дисперсии существуют и более точные методы, например, тест Гольдфельда-Квандта. Суть теста заключается в следующем. Все наблюдений упорядочиваются по возрастанию значений переменной и производится оценка параметров регрессий для первых и последних наблюдений с помощью метода наименьших квадратов. Для наибольшей мощности теста рекомендуется выбирать значение порядка Вычисляется расчётное значение статистики Фишера

(7.48)

где - суммы квадратов остатков для первых и последних наблюдений соответственно. Далее задаётся уровень значимости и определяется с помощъю статистических таблиц.

Если то делается вывод о постоянстве дисперсии.

По совокупности четырех критериев делается вывод о принципиальной возможности использования модели: если модель адекватна по критериям постоянства дисперсий и нулевого среднего и хотя бы по одному из двух других критериев, то она может быть принята для использования, хотя и не признается полностью адекватной.

Построение доверительных интервалов

Конечной целью моделирования является оценка или прогнозирование показателя Y в зависимости от значений X.

Прогноз подразделяется на точечный и интервальный и обычно осуществляется не более чем на одну треть размаха:

,

где - точка прогноза.

В точечном прогнозе показателя Y для определяется лишь одно число, которое представляет условное среднее и (при выполнении предпосылок регрессионного анализа) наиболее вероятное значение с точки зрения закономерности, отраженной в модели. В таком прогнозе не учитываются отклонения от закономерностей в результате воздействия случайных и неучтенных факторов.

В интервальном прогнозе отклонения от закономерностей в результате случайных воздействий определяются границами доверительных интервалов.

Доверительным интервалом называется такой интервал, которому с заданной степенью вероятности (называемой доверительной) принадлежат истинные значения показателя при условии, что закономерности, отраженные в модели, не противоречат развитию как на участке наблюдения, так и на участке оценки (или в периоде упреждения прогноза).

Случайные отклонения от модели проявляются в виде ошибок. Поэтому при определении границ, доверительных интервалов необходимо определить из чего складываются возможные ошибки моделирования, оценки и прогнозирования. При условии, что модель адекватна, и возможные ошибки носят случайный характер, следует различать два основных источника ошибок:

  1. ошибки аппроксимации (рассеяние наблюдений относительно модели);

  2. ошибки оценок параметров модели.

Наличие ошибок первого типа очевидно даже визуально. Величина ошибок аппроксимации характеризуется остаточной дисперсией или средней квадратической ошибкой . Распределение этих ошибок для адекватных моделей – нормально (нормальность ошибок – одно из условий адекватности).

Ошибки оценок параметров модели обусловлены тем, что их параметры, фиксированные в модели как однозначные, в действительности являются случайными величинами, так как они оцениваются на основе фактических данных, в которых присутствует как закономерная, так и случайная составляющие. Средние значения этих оценок при выполнении предпосылок регрессионного анализа соответствует истинным значениям параметров, а их дисперсии зависят от остаточной дисперсии, числа наблюдений и вида модели.

Общее среднее квадратическое отклонение истинных значений от расчетных может быть представлено как:

(7.49)

а в точке прогноза:

(7.50) Исходя из предпосылки нормального распределения остатков границы доверительных интервалов определяются по формулам:

(7.51) Анализ выражений (7.50, 7.51) позволяет для моделей парной регрессии сделать вывод, что доверительные интервалы тем шире, чем:

  • больше остаточная дисперсия (менее точна модель);

  • значение больше удалено от среднего значения ;

  • сложнее форма модели;

  • больше заданная доверительная вероятность.

7. Изучение множественной корреляционной зависимости начинается с анализа матрицы парных коэффициентов корреляции. Это позволяет произвести отбор факторов, включаемых в модель множественной зависимости.

Матрица имеет следующий вид (табл. 7.4):

Таблица 7.4

Признак

1

1

1

1

Анализ первой строку матрицы позволяет выявить факторы, у которых степень тесноты связи с результативным показателем значительна, а поэтому они могут быть включены в модель. Однако при построении многофакторных моделей должно соблюдаться требование возможно меньшей коррелированности включенных в модель признаков-факторов (отсутствие мультиколлинеарности).

В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

(7.52)

Если приведенные неравенства (или хотя бы одно из них) не выполняются, то исключается тот фактор или , связь которого с результативным признаком у будет менее тесной.

8. Отобранные факторы включаются в модель множественной зависимости. При этом следует учитывать, что число факторов, включаемых в модель, должно быть в 5 — 6 раз меньше, чем число единиц, входящих в совокупность.

Линейное уравнение множественной зависимости имеет следующий вид:

(7.53)

Параметры уравнения определяются из системы нормальных уравнений, отвечающей требованиям способа наименьших квадратов.

Мерой достоверности уравнения является процентное отношение средней квадратической ошибки уравнения к среднему уровню результативного показателя, так же как в случае парной корреляции.

9. Для измерения степени тесноты связи между изменениями величины результативного признака (у) и изменениями значений факторных признаков определяется коэффициент множественной (совокупной) корреляции (R). Для случая зависимости результативного признака от двух факторных признаков формула совокупного коэффициента корреляции имеет вид:

(7.54)

Если число факторов-признаков более двух, то совокупный

коэффициент корреляции определяется следующим образом:

(7.55)

где — матрица парных коэффициентов корреляции;

— соответствует матрице парных коэффициентов корреляции ( ) без верхней строки и первого столбца.

Величина называется коэффициентом детерминации, она показывает, в какой мере вариация результативного признака обусловлена влиянием признаков-факторов, включенных в уравнение множественной зависимости.

Величина совокупного коэффициента корреляции изменяется в пределах от 0 до 1 и численно не может быть меньше, чем любой из образующих его парных коэффициентов корреляции. Чем ближе он к единице, тем меньше роль неучтенных в модели факторов и тем более оснований считать, что параметры регрессионной модели отражают степень эффективности включенных в нее факторов.

Для оценки существенности (значимости) совокупного коэффициента корреляции используется критерий F-Фишера.

Для этого по формуле (7.41) определяется F-расчетное, которое сравнивается с табличным значением при заданном уровне значимости (например, ). Если , то с вероятностью 0,95 можно утверждать, что связь между результативным и факторными признаками существенна.

Кроме совокупного коэффициента корреляции познавательное значение имеют частные коэффициенты корреляции, позволяющие установить степень тесноты связи между результативным признаком у и каждым из факторных признаков при исключении искажающего влияния других факторных признаков. Следовательно, коэффициенты частной корреляции отражают степень «чистого» влияния факторного признака на результативный признак. Для их расчета могут быть использованы парные коэффициенты корреляции.

Для случая зависимости результативного признака у от двух признаков-факторов ( и ) определяются два коэффициента частной корреляции:

• частный коэффициент корреляции между результативным признаком у и фактором при элиминировании фактора :

(7.56)

• частный коэффициент корреляции между результативным признаком у и фактором при элиминировании фактора :

(7.57)

Для общего случая частные коэффициенты корреляции определяются по формуле

(7.58)

где — коэффициент детерминации результативного признака у с комплексом факторных признаков ;

- коэффициент детерминации результативного признака с комплексом признаков ;

- частный коэффициент корреляции результативного признака у с факторным признаком при исключении влияния факторных признаков .

Величина частного коэффициента корреляции лежит в пределах от 0 до 1, а знак определяется знаком соответствующих параметров регрессии.

Рассчитывая величины частных коэффициентов корреляции, следует иметь в виду, что каждый из них по своей абсолютной величине не может быть больше величины коэффициента множественной (совокупной) корреляции

10. Для сравнения роли различных факторов в формировании моделируемого показателя определяется коэффициент эластичности ( ) или -коэффициент ( ). Частный коэффициент эластичности показывает, на сколько процентов в среднем изменяется результативный признак у с изменением признака-фактора х на 1%, и определяется по формуле

, (7.59)

где — коэффициент регрессии при -м факторе.

-коэффициент показывает, на какую часть среднего квадратического отклонения изменится результативный показатель при изменении соответствующего фактора х на величину его среднего квадратического отклонения; его формула имеет вид:

(7.60)

30

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]