Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
tvims_le.doc
Скачиваний:
9
Добавлен:
09.12.2018
Размер:
2.64 Mб
Скачать

Коэффициент детерминации регрессий

Для линейной парной регрессии вводят критерий точности модели: коэффициент детерминации

где - невязка; .

Содержание : показывает отношение части вариации объясняемой переменной за счет воздействия вариации факторов, входящих в уравнение регрессии, к общей вариации объясняемой переменной относительно математического ожидания.

Для множественной линейной регрессии коэффициент детерминации показывает степень тесноты связи всех входящих в уравнение регрессии факторов с определяемой переменной .

, где , .

При помощи данной формулы можно определить , не вычисляя значений . При этом, если величина не удовлетворяет исследованию, то можно прекратить вычисления . Данное обстоятельство имеет значение, если выборка велика (сотни и тысячи наблюдений).

Для случая двух факторов коэффициент множественной детерминации вычисляется по формуле:.

Если - то, за счет вариации факторов объясняется 57,65% вариации .

Известны и более тонкие характеристики связи:

Используется коэффициент раздельной детерминации:

,

где - коэффициент парной корреляции, - стандартизированный коэффициент детерминации.

Например, если

то можно утверждать, что за счет вариации объясняется 24,18% вариации , а за счет вариации - 7,31%, за счет вариации - 58.3%.

.

Применяют и коэффициент частной детерминации с корректируемым коэффициентом детерминации.

Кроме количественных факторов могут рассматриваться и неколичественные (качественные).

Например, рассмотренная выше зависимость потребления (спроса на благо) может определяться не только доходом потребителей, но и вкусами, национальными, религиозными особенностями, полом, наличием образования и т.д.

Фиктивные переменные

Фиктивная (искусственная, двоичная) переменная (индикатор):

.

Можно ввести и несколько фиктивных переменных при возможности градации качественных факторов.

Пример: Пусть имеется 3 количественных фактора урожайности и 3 природных зоны, которые существенно влияют на урожайность. Уравнение регрессии можно представить в виде: .

Зоны

урожай-ности

Опреде-ляемые факторы

Факторы

Фиктивные переменные

1

0

0

0

0

0

0

2

1

0

1

0

3

0

1

0

1

Уравнения регрессии для зон: 1. ;

2. ;

3. .

Величина коэффициента означает, что все единицы второй зоны при тех же значениях количественных факторов, что и в первой зоне, будет иметь среднее значение на единиц > (<), чем в первой зоне.

Число фиктивных переменных должно быть на единицу меньше числа градации факторов.

В ряде случаев статистическая связь может показывать так называемую «ложную корреляцию», когда и объясняемые переменные, и объясняющие переменные испытывают общее влияние от некоторого фактора, например времени.

Пример «ложной корреляции»: Количество санаториев со временем растет, как и количество студентов. какой правильный вывод можно сделать?

Литература

  1. Гмурман В.Е. Теория вероятностей и математическая статистика. М.Высшая школа. 2003

  2. Теория статистики/ Р.А. Шмойлова и др. М.: Финансы и статистика. 2004.

  3. Елисеева И.И., Юзбашев М.М. Общая теория статистики. М.: Финансы и статистика. 2004.

  4. Вентцель Е.С. Теория вероятности. (Любой год издания)И. Грекова. Дамский мастер и др.

53

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]