
- •Что такое выборочный коэффициент корреляции. Формула
- •Как связаны теоретический и выборочный коэффициенты корреляции
- •Метод Монте-Карло
- •Эксперимент по методу Монте-Карло
- •Условия теоремы Гаусса-Маркова для модели парной регрессии
- •Опишите включение случайного члена в исходную модель, если преобразованная модель имеет вид
- •Опишите включение случайного члена в исходную модель, если преобразованная модель имеет вид
- •Метод Зарембки. Схема расчета
- •Тест Бокса-Кокса. Схема расчета
- •Опишите модель множественной регрессии
- •Постройте график зависимости общей величины расходов на питание от располагаемого личного дохода и цен на продукты питания.
Опишите включение случайного члена в исходную модель, если преобразованная модель имеет вид
Исходное
(т.е. непреобразованное) уравнение
будет иметь вид
u
Опишите включение случайного члена в исходную модель, если преобразованная модель имеет вид
Если
вернуться к исходному уравнению, то
формулу
следует переписать в виде
,
где v
и u
связаны соотношением
.
В этом случае соотношение имеет вид:
,
которое представляет собой уравнение
с
соответствующими изменениями определений.
Следовательно, для получения аддитивного
случайного члена в уравнении регрессии
необходимо начать с мультипликативного
случайного члена в исходном уравнении.
Случайный
член v
изменяет выражение
путем увеличения или уменьшения его в
случайной пропорции, а не на случайную
величину. Если u=0,
то
,
т.е. при v=1.
Метод Зарембки. Схема расчета
Метод Зарембки - процедура выбора между линейной и логарифмической моделями.
Данный тест предполагает такое преобразование масштаба наблюдений y, при котором обеспечивалась бы возможность непосредственного сравнения суммы квадратов отклонений в линейной и логарифмической моделях.
Метод Зарембки состоит из четырех шагов:
Вычисляется
-среднее геометрическое по выборке. Его удобно вычислять как экспоненту от среднего
;
Наблюдения y пересчитываются: новые
.
Рассматриваются линейная регрессия с наблюдениями
вместо и логарифмическая регрессии с наблюдениями
вместо
. В остальном модели не меняем. Находим остаточные суммы квадратов отклонений для полученных вспомогательных регрессий RSS1 и RSS2.
Составляем статистику
.
Если число превышает критическое значение распределения χ2 с одной степенью свободы, то выбираем логарифмическую модель, если не превышает, то выбираем линейную.
Тест Бокса-Кокса. Схема расчета
Тест Бокса-Кокса (решетчатый поиск) – прямой компьютерный метод выбора наилучших значений параметров нелинейной модели в заданных исследователем пределах с заданным шагом (решеткой). Метод является итерациональным. Итерациональные методы – компьютерные сходящиеся методы поиска наилучших значений параметров нелинейной модели.
Дж.Бокс
и Д.Кокс заметили, что
и
– это специальные случаи функции (
,
из которой получается функция y,
когда λ=1, и функция log(y)
(предельный случай), когда λ стремится
к нулю. Нет оснований предполагать, что
одно из этих значений λ является
оптимальным, а есть смысл попробовать
целый ряд значений с тем, чтобы определить,
какое из них дает минимальное значение
СКО (среднеквадратическое отклонение)
(после выполнения пересчета по методу
Зарембки). Эта процедура известна как
решетчатый поиск или поиск на сетке.
Опишите модель множественной регрессии
Модель
множественной регрессии – это линейная
модель зависимости между переменными:
,
содержащая более двух переменных.
Постройте график зависимости общей величины расходов на питание от располагаемого личного дохода и цен на продукты питания.
Рассмотрим модель множественной регрессии:
,
(1.1)
где y – общая величина расходов на питание, x – располагаемый личный доход, p – цена продуктов питания. Предполагаем, что существует лишь прямая связь за счет допущения о том, что расходы на питание не влияют на доход и цену. Это могло бы быть в том случае, если бы цены определялись на мировом рынке, однако в большинстве ситуаций расходы на продукты и их цены определяются совместно в результате взаимодействия предложения и спроса.
Геометрически данная зависимость изображается на рис. 1. Истинная модель с двумя независимыми переменными: расход как функция дохода и цены.
Основание
диаграммы содержит оси для x
и p,
если пренебречь текущим влиянием
случайного члена, то наклонная плоскость
над ними показывает величину y,
соответствующую любому сочетанию x
и p,
измеренную расстоянием по вертикали
от данной точки до этой плоскости. Так
как расходы на питание могут увеличиваться
с ростом доходов и уменьшаться с
увеличением цены, изображение на
диаграмме было построено на основе
допущения о том, что величина β1
является положительным, а β2
–
отрицательной. Если обе величины x
и p
оказались равными 0, то величина равнялась
бы α. При сохранении р=0 уравнение (1.1)
означает, что для любого положительного
дохода величина у будет равна (
)
и на рисунке приращение
обозначено как «чистый эффект дохода».
При сохранении ч=0 уравнение означает,
что для любой положительной цены величина
у будет равной (
),
приращение
на рисунке обозначено как «чистый эффект
цены». Поскольку β2
на
практике является отрицательной
величиной, отрицательным будет и этот
эффект. Показан также комбинированный
эффект дохода и цены (
).
Если
случайный член отсутствует на данный
момент в уравнении (1.1), то значения в
выборке наблюдений для y,x
и p
будут находиться точно на наклонной
плоскости, что позволит вывести точные
значения
и
.
Учет случайного члена приводит к тому, что фактические значения у будут лежать несколько выше или несколько ниже значений, соответствующих наклонной плоскости. Таким образом, мы имеем трехмерный аналог для двухмерной задачи.
Уравнение для выбранной плоскости будет иметь вид:
,
(1.2)
и
ее расположение будет зависеть от выбора
величин a,
b1
и b2,
являющихся соответственно оценками
.
В
случае m
независимых переменных плоскость
регрессии будет представлять собой
m-мерную
плоскость
в (m+1)-мерном
пространстве.