Добавил:
Надеюсь, кому-то пригодятся мои мучения за 3-4 курс Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика практическая работа 3

.docx
Скачиваний:
12
Добавлен:
09.04.2021
Размер:
45.88 Кб
Скачать

Таблица «Вывод остатка»

· Предсказанное у – это рассчитанное по решенному уравнению регрессии значение зависимой переменной при данном значении фактора в каждом конкретном наблюдении;

· Остаток- это отклонение отдельной точки (наблюдения) от линии регрессии (предсказанного значения).

· Так в первом наблюдении размер участка составляет 10 соток. Подставив это значение в уравнение регрессии, мы получим предсказанную или прогнозную стоимость участка:

=491,40+89,28*10=1384,206 (тыс.руб.). Также находим Предсказанное Y для всех остальных наблюдений.

Для первого наблюдения остаток равен -984,206=400-1384,206. Наличие остатка в каждом наблюдении объясняется тем, что уравнение регрессии в нашем случае включает только один фактор – размер участка, в то время как влияние других факторов не учтено. Аналогично рассчитываем остальные остатки.

Вывод: в результате использования инструмента «Регрессия» получено уравнение взаимосвязи у=491,3988+89,28074х. Коэффициент корреляции, равный 0,69, говорит о умеренной (средней) связи между переменными. Коэффициент детерминации позволяет сделать вывод, что 48,1% общей вариации стоимости участка с влиянием размера участка, а оставшиеся 51,9% вариации отражают влияние всех прочих факторов.

Уравнение регрессии в целом значимо. Фактическое значение критерия Фишера составило F=25,903. Значимость критерия (Значимость F на листе итогов) равна 2,17E-05=2,17·10-5, что гораздо меньше обычно принимаемой 5% области. Следовательно, уравнение статистически достоверно для исходной генеральной совокупности.

Коэффициент полной регрессии в=89,28074 оказался значимым (2,17·10-5<5%), следовательно, возможна его смысловая интерпретация. Коэффициент регрессии положительный, что указывает на прямую связь между переменными. Величина коэффициента регрессии говорит о том, что при увеличении размера участка на единицу, стоимость участка увеличивается в среднем по всем наблюдениям на 89,28074 тысячи рублей. Свободный член уравнения регрессии 491,3988 показывает, какой бы была стоимость при нулевом размере участка, но, поскольку в нашей выборке таких наблюдений нет, то в данном примере эта величина не имеет смысловой интерпретации.

Поскольку параметры выборочного уравнения регрессии оказались статистически достоверны, то можно дать интервальную оценку параметров генерального уравнения. Нижние и верхние границы параметров на листе вывода итогов обозначены как «Нижние 95%» и «Верхние95%».

Параметр λ в генеральной совокупности находится в пределах от -149,019 до 1131,816; параметр β: 53,34726≤β≤125,2142 при доверительном уровне вероятности суждения 95%. Иными словами, с вероятностью 95% мы можем утверждать, что в наблюдаемой выборке увеличение размера участка на единицу будет приводить к увеличению стоимости участка от 53,34726 до 125,214 тыс. руб.

Поскольку уравнение регрессии, полученное по выборочным данным, оказалось достоверным по критерию Фишера, со значимыми параметрами, то можно сделать вывод о достаточно высоком качестве модели и возможности построения прогнозов на ее основе. Однако следует помнить, что сравнительно невысокий коэффициент детерминации не сможет обеспечить высокую точность прогнозирования. Стандартная ошибка уравнения говорит о том, что в среднем для всех наблюдений в своих прогнозах стоимость будет ошибаться на ±1154,785 тысяч рублей.

Задача 3.2. Прогнозирование на основе парного линейного уравнения регрессии.

Условие: решено парное линейное уравнение связи между размером участка и стоимость участка, доказана достоверность взаимосвязи (задача 3.1.)

Требуется: выполнить точечный и интервальный прогноз стоимости участка при заданном значении фактора.

Решение: при выборе прогнозных значений независимой переменной следует помнить, что чем больше отличается предполагаемое значение фактора от его среднего уровня, тем больше ошибка прогноза. В базе данных значение независимой переменной (размер участка) варьируют от 6 до 59. Предположим, что интересующая нас выручка находится 36 соток, то есть хпрогн.=32. Среднее значение и дисперсию факторного признака найдем с помощью программного продукта Excel – «Пакет анализа»: выбираем «Описательная статистика»→ставим галочку напротив «Итоговая статистика»→указываем выходной интервал. В появившейся таблице мы увидим необходимые нам величины:

Табл. 4 Описательная статистика переменной размер участка

Столбец1

Среднее

13,16

Стандартная ошибка

2,231816

Медиана

10

Мода

10

Стандартное отклонение

12,22416

Дисперсия выборки

149,4301

Эксцесс

8,743555

Асимметричность

2,996995

Интервал

53

Минимум

6

Максимум

59

Сумма

394,8

Счет

30

Подставим хпрогн. в уравнение регрессии:

у=491,40+89,28*36=3705,48 тыс. руб.

Проведем точечную и интервальную оценку прогноза, для этого определим среднюю ошибку прогноза:

тыс. руб.

- остаточную дисперсию возьмем из таблицы дисперсионного анализа в предыдущей задаче.

Точечная оценка: прогнозное значение стоимости участка при размере участка 36 соток равно 3705,48 тыс.руб. со средней ошибкой тыс. руб.

Проведем интервальную оценку прогноза в генеральной совокупности:

Поскольку численность выборки равна 30 наблюдений, то есть выборка является большой, то для определения критического значения , используется функция «Интеграл вероятностей при разных значениях t» (см. приложение 2). В нашем случае расчет критического уровня был произведен на уровне значимости 5 %: t0.05=1.96.

Найдем предельную ошибку прогноза ε0,05=1,96∙ =2426,872 тыс. руб.

Сделаем вывод: с уровнем доверия 95% можно утверждать, что прогнозное значение стоимости участка при размере участка 36 соток в генеральной совокупности будет заключено в пределах: от 1278,608 до 6132,352 тыс. руб., точность прогноза нельзя признать удовлетворительной.