Статистика практическая работа 3
.docxТаблица «Вывод остатка»
· Предсказанное у – это рассчитанное по решенному уравнению регрессии значение зависимой переменной при данном значении фактора в каждом конкретном наблюдении;
· Остаток- это отклонение отдельной точки (наблюдения) от линии регрессии (предсказанного значения).
· Так в первом наблюдении размер участка составляет 10 соток. Подставив это значение в уравнение регрессии, мы получим предсказанную или прогнозную стоимость участка:
=491,40+89,28*10=1384,206 (тыс.руб.). Также находим Предсказанное Y для всех остальных наблюдений.
Для первого наблюдения остаток равен -984,206=400-1384,206. Наличие остатка в каждом наблюдении объясняется тем, что уравнение регрессии в нашем случае включает только один фактор – размер участка, в то время как влияние других факторов не учтено. Аналогично рассчитываем остальные остатки.
Вывод: в результате использования инструмента «Регрессия» получено уравнение взаимосвязи у=491,3988+89,28074х. Коэффициент корреляции, равный 0,69, говорит о умеренной (средней) связи между переменными. Коэффициент детерминации позволяет сделать вывод, что 48,1% общей вариации стоимости участка с влиянием размера участка, а оставшиеся 51,9% вариации отражают влияние всех прочих факторов.
Уравнение регрессии в целом значимо. Фактическое значение критерия Фишера составило F=25,903. Значимость критерия (Значимость F на листе итогов) равна 2,17E-05=2,17·10-5, что гораздо меньше обычно принимаемой 5% области. Следовательно, уравнение статистически достоверно для исходной генеральной совокупности.
Коэффициент полной регрессии в=89,28074 оказался значимым (2,17·10-5<5%), следовательно, возможна его смысловая интерпретация. Коэффициент регрессии положительный, что указывает на прямую связь между переменными. Величина коэффициента регрессии говорит о том, что при увеличении размера участка на единицу, стоимость участка увеличивается в среднем по всем наблюдениям на 89,28074 тысячи рублей. Свободный член уравнения регрессии 491,3988 показывает, какой бы была стоимость при нулевом размере участка, но, поскольку в нашей выборке таких наблюдений нет, то в данном примере эта величина не имеет смысловой интерпретации.
Поскольку параметры выборочного уравнения регрессии оказались статистически достоверны, то можно дать интервальную оценку параметров генерального уравнения. Нижние и верхние границы параметров на листе вывода итогов обозначены как «Нижние 95%» и «Верхние95%».
Параметр λ в генеральной совокупности находится в пределах от -149,019 до 1131,816; параметр β: 53,34726≤β≤125,2142 при доверительном уровне вероятности суждения 95%. Иными словами, с вероятностью 95% мы можем утверждать, что в наблюдаемой выборке увеличение размера участка на единицу будет приводить к увеличению стоимости участка от 53,34726 до 125,214 тыс. руб.
Поскольку уравнение регрессии, полученное по выборочным данным, оказалось достоверным по критерию Фишера, со значимыми параметрами, то можно сделать вывод о достаточно высоком качестве модели и возможности построения прогнозов на ее основе. Однако следует помнить, что сравнительно невысокий коэффициент детерминации не сможет обеспечить высокую точность прогнозирования. Стандартная ошибка уравнения говорит о том, что в среднем для всех наблюдений в своих прогнозах стоимость будет ошибаться на ±1154,785 тысяч рублей.
Задача 3.2. Прогнозирование на основе парного линейного уравнения регрессии.
Условие: решено парное линейное уравнение связи между размером участка и стоимость участка, доказана достоверность взаимосвязи (задача 3.1.)
Требуется: выполнить точечный и интервальный прогноз стоимости участка при заданном значении фактора.
Решение: при выборе прогнозных значений независимой переменной следует помнить, что чем больше отличается предполагаемое значение фактора от его среднего уровня, тем больше ошибка прогноза. В базе данных значение независимой переменной (размер участка) варьируют от 6 до 59. Предположим, что интересующая нас выручка находится 36 соток, то есть хпрогн.=32. Среднее значение и дисперсию факторного признака найдем с помощью программного продукта Excel – «Пакет анализа»: выбираем «Описательная статистика»→ставим галочку напротив «Итоговая статистика»→указываем выходной интервал. В появившейся таблице мы увидим необходимые нам величины:
Табл. 4 Описательная статистика переменной размер участка
Столбец1 |
|
|
|
Среднее |
13,16 |
Стандартная ошибка |
2,231816 |
Медиана |
10 |
Мода |
10 |
Стандартное отклонение |
12,22416 |
Дисперсия выборки |
149,4301 |
Эксцесс |
8,743555 |
Асимметричность |
2,996995 |
Интервал |
53 |
Минимум |
6 |
Максимум |
59 |
Сумма |
394,8 |
Счет |
30 |
Подставим хпрогн. в уравнение регрессии:
у=491,40+89,28*36=3705,48 тыс. руб.
Проведем точечную и интервальную оценку прогноза, для этого определим среднюю ошибку прогноза:
тыс. руб.
- остаточную дисперсию возьмем из таблицы дисперсионного анализа в предыдущей задаче.
Точечная оценка: прогнозное значение стоимости участка при размере участка 36 соток равно 3705,48 тыс.руб. со средней ошибкой тыс. руб.
Проведем интервальную оценку прогноза в генеральной совокупности:
Поскольку численность выборки равна 30 наблюдений, то есть выборка является большой, то для определения критического значения , используется функция «Интеграл вероятностей при разных значениях t» (см. приложение 2). В нашем случае расчет критического уровня был произведен на уровне значимости 5 %: t0.05=1.96.
Найдем предельную ошибку прогноза ε0,05=1,96∙ =2426,872 тыс. руб.
Сделаем вывод: с уровнем доверия 95% можно утверждать, что прогнозное значение стоимости участка при размере участка 36 соток в генеральной совокупности будет заключено в пределах: от 1278,608 до 6132,352 тыс. руб., точность прогноза нельзя признать удовлетворительной.