Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР6-2007Простая регрессия.doc
Скачиваний:
7
Добавлен:
26.11.2018
Размер:
202.75 Кб
Скачать

Интерпретация регрессии

Коэффициенты b0, b1 уравнения линейной регрессии представлены в столбце Коэффициенты. Коэффициент Y-пересечение равен 18,78946749 (ячейка E17) и является постоянным членом уравнения b0, а коэффициент Площадь равен 0,021010249 (ячейка E18) и является коэффициентом регрессии b1. Таким образом, уравнение регрессии имеет вид:

.

Замечание. Интерпретация уравнения регрессии была приведена выше при анализе линии тренда.

В таблице ВЫВОД ОСТАТКА значения столбца Предсказанное Цена (диапазон E25:E39) являются значениями функции регрессии , которые оценивают стоимость каждого объекта недвижимости. В столбце Остатки (диапазон F25:F39) указаны отклонения , определяющие разность между фактическими значениями и значениями функции регрессии (подобранными значениями). Например, первый объект имеет площадь в 521 квадратный метр. В среднем мы ожидаем, что его стоимость приблизительно равна =29,73580748 тысяч долларов ($29736), но реальная стоимость равна $26000. Отклонение для данного объекта (ячейка F25) составляет $26000 – $29736 = –$3736 тысяч долларов. Следовательно, реальная стоимость меньше ожидаемой на $3736.

Для ответа на вопрос «Насколько хорошо полученная функция регрессии соответствует данным?» используются характеристики: стандартная ошибка, R2, t-статистика и анализ дисперсии.

Стандартную ошибку можно интерпретировать как стандартное отклонение остатков, которое показывает, какой величины ошибку в среднем вы допускаете, когда вместо фактического значения Y используете значение функции регрессии. Стандартная ошибка измеряется в тех же единицах, что и Y. В ячейке E7 указана величина стандартной ошибки, равная 3,237774407 тысяч долларов (приблизительно $3238). Это означает, что фактическая стоимость объекта недвижимости отличается от стоимости, вычисленной с помощью полученной функции регрессии, в среднем на $3238. В случае нормального распределения остатков можно ожидать, что примерно 2/3 точек данных находится на расстоянии не более $3238 выше или ниже прямой.

Если стандартная ошибка оценки является абсолютной мерой величины ошибок, то коэффициент детерминации R2 является относительной мерой. Величина R2 находится в пределах от 0 до 1 и часто выражается в процентах. Значение R2 указано в ячейке E5 и составляет приблизительно 66%. Интерпретация R2 была дана выше при анализе линии тренда. Значение Нормированный R-квадрат, приведенное в ячейке E6, используется для сравнения с другими моделями, содержащими дополнительные независимые переменные.

Значения t-статистик в ячейках G17 и G18 являются частью проверок гипотез о наличии зависимости между переменными X и Y. Данные 15 объектов недвижимости рассматриваются как выборка из большей (генеральной) совокупности. Для заданного объема выборки по t-таблице распределения Стьюдента при двустороннем 95%-ом доверительном интервале (в Excel 95%-ый Уровень надежности принят по умолчанию) определяется критическое значение t-статистики (tтабл=2,16). Значение t-статистики в нашем случае равно 5,064667406 (ячейка G18), что существенно больше, чем tтабл (5,064667406>2,16). Это означает, что вычисленный коэффициент регрессии b1 является значимым и, следовательно, имеется зависимость между стоимостью и площадью.

Замечание. Для многих расчетов, исходя из предположения, что выборочные данные распределены нормально, принимают tтабл=2.

В ячейке H18 приведено Р-значение, равное 0,00021678. Эта величина является вероятностью получения результатов при выполнении нулевой гипотезы с 5%-ым уровнем значимости (нулевая гипотеза выдвигается в предположении, что зависимость между переменными отсутствует). Обычно нулевую гипотезу отвергают, когда Р-значение меньше 0,05. В данном случае мы можем отвергнуть нулевую гипотезу об отсутствии связи, так как 0,00021678 существенно меньше 0,05.

Таблица анализа дисперсии подытоживает проверку нулевой гипотезы. Более подробно этот анализ рассматривается при построении множественной модели регрессии.