Учебное пособие 1344
.pdfpended var (см. рис. 29). Нa экране появится окно: Specify values for independent variables. Задайте в этом окне какое-либо значение независимой переменной, например, SQUARE=1000 и нажмите ОК. На экране появится следующая таблица (рис. 32).
Рис. 32. Таблица предсказанных значений переменных с помощью модели цен на дома площадью 1000 м2
Таким образом, ориентировочная цена данного дома 11 894 доллара 75 центов. Эта цена является основанием для предстоящего торга с владельцем или агентом по продаже домов.
Пример 2. Определение постоянной Хаббла. Американский астроном Хаббла в 1929 году обнаружил, что галактики удаляются от Земли со скоростью, пропорциональной расстоянию. Коэффициент этой пропорциональности получил название «постоянная Хаббла». По известным данным для 11 галактик (рис.33) найдем оценку коэффициента/
.
Рис. 33
41
Выполнение в системе STATISTICA
Создадим файл HUBLLE.sta, куда поместим данные табл. (рис. 1). По-
строим диаграмму рассеяния: Graphs - 2D Graphs - Scatterplots. (Variables: X: SPEED, Y: DISTANCE), ОК. Тип графика: Graphs type: Regular; Linear fit - ОК.
Рассмотрим график зависимости, параметры подобранной прямой регрессии отражены в заголовке.
Из графика видно, что предположение о линейности подтверждается графически (рис. 34).
Рис. 34. График зависимости расстояния от скорости
Выполним регрессионный анализ. Для начала вызовем стартовую па-
нель модуля Multiple Regression (Statistics).
Нажмем кнопку Variables, выберем переменные для анализа: Select depended and independed variable lists. Выбираем зависимую переменную Depended var: DISTANCE и независимую - Independed var : SPEED –OK, возвра-
щаемся в стартовую панель.
Задание: проанализировать окно Multiple Regression Results. Нашей задачей было построить модель вида DISTANCE =A+b*SPEED и исследовать значимость регрессии, а также адекватность построенной модели исходным данным:
-значение коэффициента детерминации R2=,99723464, построенная регрессия объясняет 99,7% разброса значений переменной относительно среднего; - значение F- критерия=3245,554, при уровне значимости р= .000000; F- критерий используется для проверки гипотезы о значимости уравнения регрессии. Гипотеза Но утверждает, что между переменными нет линейной зави-
42
симости, т.е. b = 0, против альтернативы H1 b≠0. В данном случае имеем большое значение F-критерия и уровень значимости р<10-6, показывающие, что гипотезу Но следует отклонить.
- SPEED beta=.999.
Перейдем к итоговым результатам регрессии – Summary: Regression results (Multiple Regression-Quick) (рис. 35).
Рис. 35. Таблица итоговых результатов регрессии
В столбце В приведены значения оценок неизвестных коэффициентов регрессии: Intercept (свободный член) = -1.05331, B-SPEED (коэффициент при независимой переменной)=2.82313- это и есть постоянная Хаббла.
Std.Err. of В — стандартные ошибки оценок коэффициентов (оценки стандартных отклонений).
Столбец t - значение статистик Стьюдента для проверки гипотез о нулевом значении коэффициентов.
P-level - уровни значимости отклонения этих гипотез.
Из рис. 35видим, что модель имеет вид:DISTANCE = -1.05+2.82* SPEED.
Анализ остатков и оценка адекватность модели
Multiple Regression Results - Residual/assumptions/prediction (остатки
/предположения/предсказания) - Perform residual analysis (выполнить анализ ос-
татков). Теперь выберите закладку Scatterplots и нажмите кнопки Predicted vs. observed (наблюдаемые значения, связанные с предсказанными), а также кнопку
Observed values Residuals (диаграмма рассеяния остатков вокруг регрессии). Для построения графика остатков на вероятностной бумаге выберите в модуле Multiple Regression ResultsResidual/assumptions/prediction- Perform residual analysis закладку Probability plots и нажмите кнопку Normal plot of residuals (рис. 36).
43
Рис. 36. График распределения остатков
Для построения гистограммы распределения остатков выберите закладку
Residuals и нажмите кнопку Histogram of Residuals (рис. 37).
Рис. 37. Гистограмма остатков
Задание
Вариант 1. Исследовать зависимость между объемом производства, капитальными вложениями и выполнением норм выработки. Для построения модели собраны данные по исследуемым переменным на 12-ти предприятиях данной отрасли в табл. 8.
44
|
|
|
Таблица 8 |
|
|
|
|
Предприятие |
Капиталовложения, |
Средний процент |
Объем |
|
млн р. |
выполнения |
производства, |
|
|
нормы |
млн р. |
1 |
16,3 |
99,5 |
52,8 |
2 |
16,8 |
98,9 |
48,4 |
3 |
18,5 |
99,2 |
54,2 |
4 |
16,3 |
99,3 |
50,0 |
5 |
17,9 |
99,8 |
54,9 |
6 |
17,4 |
99,6 |
53,9 |
7 |
16,1 |
99,8 |
53,1 |
8 |
16,2 |
99,7 |
52,4 |
9 |
17,0 |
99,8 |
53,0 |
10 |
16,7 |
99,9 |
52,9 |
11 |
17,5 |
100,0 |
53,1 |
12 |
19,1 |
100,2 |
60,1 |
Требуется провести регрессионный анализ зависимости объема производства Y от объема капиталовложений X1 и среднего процента выполнения нормы X2 по следующей схеме.
1.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин Y,X1.
2.Построить уравнение линейной регрессии для объема производства Y от объема капиталовложений X1 .
3.Оценить надежность полученного уравнения регрессии по критерию Фишера.
4.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для Y,X1 по критерию Стьюдента.
5.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин Y,X2.
6.Построить уравнение линейной регрессии для объема производства Y от среднего процента выполнения нормы X2.
7.Оценить надежность полученного уравнения регрессии по критерию Фишера.
8.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для Y,X2 по критерию Стьюдента.
9.Нарисовать графики найденных регрессий с нанесением точек исходных статистических данных.
10.Провести анализ остатков.
Вариант 2. Исследовать стоимость группы небольших офисных зданий в традиционном деловом районе. Застройщик может использовать множествен-
45
ный регрессионный анализ для оценки цены офисного здания в заданном районе на основе следующих переменных:
y - оценочная цена здания под офис;
x1 - общая площадь в квадратных метрах;
x2 - количество офисов;
x3 - количество входов (0,5 входа означает вход только для доставки корреспонденции);
x4 - время эксплуатации здания в годах.
Предполагается, что существует линейная зависимость между каждой независимой переменной (x1, x2, x3 и x4) и зависимой переменной (y), то есть ценой здания под офис в данном районе. Исходные данные показаны на рис. 38.
Рис. 38
Требуется:
1.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин у, х1.
2.Построить уравнение линейной регрессии для цены здания у от общей площади х1 .
3.Оценить надежность полученного уравнения регрессии по критерию
Фишера.
4.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для у, х1 по критерию Стьюдента.
5.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин у, х2.
6.Построить уравнение линейной регрессии для объема производства у от среднего процента выполнения нормы х2 .
7.Оценить надежность полученного уравнения регрессии по критерию
Фишера.
46
8.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для у, х2 по критерию Стьюдента.
9.Нарисовать графики найденных регрессий с нанесением точек исходных статистических данных.
10.Провести анализ остатков.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1.Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. – СПб.: Питер 2003. – 668 с.
2.Андронов, А. М. Теория вероятностей и математическая статистика
/А.М. Андронов, Е.А. Копытов, Л.Я. Гринглаз. – СПб.: Питер, 2004. – 461 с.
3.Тюрин, Ю.М. Статистический анализ данных на компьютере / Ю.М. Тюринов, А.А. Макаров. – М.: ИНФРА-М., 1998. - 528 с.
4.Теория вероятностей и математическая статистика в задачах: учеб. пособие для вузов / В.А. Ватутин [и др.]. – М.: Дрофа, 2003. – 328 с.
47
ОГЛАВЛЕНИЕ |
|
Введение ………………………………………………………………………3 |
|
Лабораторная работа 1. Введение в пакет программ STATISTICA……..3 |
|
Лабораторная работа 2. Построение таблиц сопряженности в пакете |
|
STATISTICA……………………………………………………………......…8 |
|
Лабораторная работа 3. Графический анализ таблиц сопряженности…12 |
|
Лабораторная работа 4. Простейшие задачи математической |
|
статистики……………………………………………………………………15 |
|
Лабораторная работа 5.Вычисление описательных статистик |
|
и построение простейших статистических графиков…………………….18 |
|
Лабораторная работа 6. Вероятностный калькулятор……………..……22 |
|
Лабораторная работа 7. Проверка статистических гипотез. |
|
Критерий согласия хи-квадрат Пирсона…………………………………...30 |
|
Лабораторная работа 8. Простая линейная регрессия |
|
в системе STATISTICА............................................................................. |
37 |
Заключение…………………………………………...……………………...48 |
|
Библиографический список ……………………………….……………….48 |
КОМПЬЮТЕРНЫЙ ПРАКТИКУМ В ПАКЕТЕ STATISTICA
Методические указания к выполнению лабораторных работ для студентов специальности 200503 “Стандартизация и сертификация”, 080507 «Менеджмент организации»,
080502 «Экономика и управление на предприятии (строительство)», 080801 «Прикладная информатика в экономике»
Составитель:
канд. физ.-мат. наук, ст. преп. Татьяна Вячеславовна Мещерякова
Подписано в печать 22 .05.2009. Формат 60х84 1/16. Уч.-изд. л. 2,9. Усл. печ. л. 3,0. Бумага писчая. Тираж 200 экз. Заказ №
Отпечатано: отдел оперативной полиграфии Воронежского государственного архитектурно-строительного университета 394006 Воронеж, ул. 20-летия Октября, 84