Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие 1344

.pdf
Скачиваний:
6
Добавлен:
30.04.2022
Размер:
1.02 Mб
Скачать

pended var (см. рис. 29). Нa экране появится окно: Specify values for independent variables. Задайте в этом окне какое-либо значение независимой переменной, например, SQUARE=1000 и нажмите ОК. На экране появится следующая таблица (рис. 32).

Рис. 32. Таблица предсказанных значений переменных с помощью модели цен на дома площадью 1000 м2

Таким образом, ориентировочная цена данного дома 11 894 доллара 75 центов. Эта цена является основанием для предстоящего торга с владельцем или агентом по продаже домов.

Пример 2. Определение постоянной Хаббла. Американский астроном Хаббла в 1929 году обнаружил, что галактики удаляются от Земли со скоростью, пропорциональной расстоянию. Коэффициент этой пропорциональности получил название «постоянная Хаббла». По известным данным для 11 галактик (рис.33) найдем оценку коэффициента/

.

Рис. 33

41

Выполнение в системе STATISTICA

Создадим файл HUBLLE.sta, куда поместим данные табл. (рис. 1). По-

строим диаграмму рассеяния: Graphs - 2D Graphs - Scatterplots. (Variables: X: SPEED, Y: DISTANCE), ОК. Тип графика: Graphs type: Regular; Linear fit - ОК.

Рассмотрим график зависимости, параметры подобранной прямой регрессии отражены в заголовке.

Из графика видно, что предположение о линейности подтверждается графически (рис. 34).

Рис. 34. График зависимости расстояния от скорости

Выполним регрессионный анализ. Для начала вызовем стартовую па-

нель модуля Multiple Regression (Statistics).

Нажмем кнопку Variables, выберем переменные для анализа: Select depended and independed variable lists. Выбираем зависимую переменную Depended var: DISTANCE и независимую - Independed var : SPEED –OK, возвра-

щаемся в стартовую панель.

Задание: проанализировать окно Multiple Regression Results. Нашей задачей было построить модель вида DISTANCE =A+b*SPEED и исследовать значимость регрессии, а также адекватность построенной модели исходным данным:

-значение коэффициента детерминации R2=,99723464, построенная регрессия объясняет 99,7% разброса значений переменной относительно среднего; - значение F- критерия=3245,554, при уровне значимости р= .000000; F- критерий используется для проверки гипотезы о значимости уравнения регрессии. Гипотеза Но утверждает, что между переменными нет линейной зави-

42

симости, т.е. b = 0, против альтернативы H1 b≠0. В данном случае имеем большое значение F-критерия и уровень значимости р<10-6, показывающие, что гипотезу Но следует отклонить.

- SPEED beta=.999.

Перейдем к итоговым результатам регрессии – Summary: Regression results (Multiple Regression-Quick) (рис. 35).

Рис. 35. Таблица итоговых результатов регрессии

В столбце В приведены значения оценок неизвестных коэффициентов регрессии: Intercept (свободный член) = -1.05331, B-SPEED (коэффициент при независимой переменной)=2.82313- это и есть постоянная Хаббла.

Std.Err. of В — стандартные ошибки оценок коэффициентов (оценки стандартных отклонений).

Столбец t - значение статистик Стьюдента для проверки гипотез о нулевом значении коэффициентов.

P-level - уровни значимости отклонения этих гипотез.

Из рис. 35видим, что модель имеет вид:DISTANCE = -1.05+2.82* SPEED.

Анализ остатков и оценка адекватность модели

Multiple Regression Results - Residual/assumptions/prediction (остатки

/предположения/предсказания) - Perform residual analysis (выполнить анализ ос-

татков). Теперь выберите закладку Scatterplots и нажмите кнопки Predicted vs. observed (наблюдаемые значения, связанные с предсказанными), а также кнопку

Observed values Residuals (диаграмма рассеяния остатков вокруг регрессии). Для построения графика остатков на вероятностной бумаге выберите в модуле Multiple Regression ResultsResidual/assumptions/prediction- Perform residual analysis закладку Probability plots и нажмите кнопку Normal plot of residuals (рис. 36).

43

Рис. 36. График распределения остатков

Для построения гистограммы распределения остатков выберите закладку

Residuals и нажмите кнопку Histogram of Residuals (рис. 37).

Рис. 37. Гистограмма остатков

Задание

Вариант 1. Исследовать зависимость между объемом производства, капитальными вложениями и выполнением норм выработки. Для построения модели собраны данные по исследуемым переменным на 12-ти предприятиях данной отрасли в табл. 8.

44

 

 

 

Таблица 8

 

 

 

 

Предприятие

Капиталовложения,

Средний процент

Объем

 

млн р.

выполнения

производства,

 

 

нормы

млн р.

1

16,3

99,5

52,8

2

16,8

98,9

48,4

3

18,5

99,2

54,2

4

16,3

99,3

50,0

5

17,9

99,8

54,9

6

17,4

99,6

53,9

7

16,1

99,8

53,1

8

16,2

99,7

52,4

9

17,0

99,8

53,0

10

16,7

99,9

52,9

11

17,5

100,0

53,1

12

19,1

100,2

60,1

Требуется провести регрессионный анализ зависимости объема производства Y от объема капиталовложений X1 и среднего процента выполнения нормы X2 по следующей схеме.

1.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин Y,X1.

2.Построить уравнение линейной регрессии для объема производства Y от объема капиталовложений X1 .

3.Оценить надежность полученного уравнения регрессии по критерию Фишера.

4.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для Y,X1 по критерию Стьюдента.

5.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин Y,X2.

6.Построить уравнение линейной регрессии для объема производства Y от среднего процента выполнения нормы X2.

7.Оценить надежность полученного уравнения регрессии по критерию Фишера.

8.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для Y,X2 по критерию Стьюдента.

9.Нарисовать графики найденных регрессий с нанесением точек исходных статистических данных.

10.Провести анализ остатков.

Вариант 2. Исследовать стоимость группы небольших офисных зданий в традиционном деловом районе. Застройщик может использовать множествен-

45

ный регрессионный анализ для оценки цены офисного здания в заданном районе на основе следующих переменных:

y - оценочная цена здания под офис;

x1 - общая площадь в квадратных метрах;

x2 - количество офисов;

x3 - количество входов (0,5 входа означает вход только для доставки корреспонденции);

x4 - время эксплуатации здания в годах.

Предполагается, что существует линейная зависимость между каждой независимой переменной (x1, x2, x3 и x4) и зависимой переменной (y), то есть ценой здания под офис в данном районе. Исходные данные показаны на рис. 38.

Рис. 38

Требуется:

1.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин у, х1.

2.Построить уравнение линейной регрессии для цены здания у от общей площади х1 .

3.Оценить надежность полученного уравнения регрессии по критерию

Фишера.

4.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для у, х1 по критерию Стьюдента.

5.Построить рабочую таблицу для расчета средних значений, дисперсий, среднеквадратичных отклонений случайных величин у, х2.

6.Построить уравнение линейной регрессии для объема производства у от среднего процента выполнения нормы х2 .

7.Оценить надежность полученного уравнения регрессии по критерию

Фишера.

46

8.Оценить надежность на уровне значимости 5% полученного коэффициента корреляции для у, х2 по критерию Стьюдента.

9.Нарисовать графики найденных регрессий с нанесением точек исходных статистических данных.

10.Провести анализ остатков.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1.Боровиков, В. STATISTICA. Искусство анализа данных на компьютере: Для профессионалов / В. Боровиков. – СПб.: Питер 2003. – 668 с.

2.Андронов, А. М. Теория вероятностей и математическая статистика

/А.М. Андронов, Е.А. Копытов, Л.Я. Гринглаз. – СПб.: Питер, 2004. – 461 с.

3.Тюрин, Ю.М. Статистический анализ данных на компьютере / Ю.М. Тюринов, А.А. Макаров. – М.: ИНФРА-М., 1998. - 528 с.

4.Теория вероятностей и математическая статистика в задачах: учеб. пособие для вузов / В.А. Ватутин [и др.]. – М.: Дрофа, 2003. – 328 с.

47

ОГЛАВЛЕНИЕ

 

Введение ………………………………………………………………………3

Лабораторная работа 1. Введение в пакет программ STATISTICA……..3

Лабораторная работа 2. Построение таблиц сопряженности в пакете

STATISTICA……………………………………………………………......…8

Лабораторная работа 3. Графический анализ таблиц сопряженности…12

Лабораторная работа 4. Простейшие задачи математической

 

статистики……………………………………………………………………15

Лабораторная работа 5.Вычисление описательных статистик

 

и построение простейших статистических графиков…………………….18

Лабораторная работа 6. Вероятностный калькулятор……………..……22

Лабораторная работа 7. Проверка статистических гипотез.

 

Критерий согласия хи-квадрат Пирсона…………………………………...30

Лабораторная работа 8. Простая линейная регрессия

 

в системе STATISTICА.............................................................................

37

Заключение…………………………………………...……………………...48

Библиографический список ……………………………….……………….48

КОМПЬЮТЕРНЫЙ ПРАКТИКУМ В ПАКЕТЕ STATISTICA

Методические указания к выполнению лабораторных работ для студентов специальности 200503 “Стандартизация и сертификация”, 080507 «Менеджмент организации»,

080502 «Экономика и управление на предприятии (строительство)», 080801 «Прикладная информатика в экономике»

Составитель:

канд. физ.-мат. наук, ст. преп. Татьяна Вячеславовна Мещерякова

Подписано в печать 22 .05.2009. Формат 60х84 1/16. Уч.-изд. л. 2,9. Усл. печ. л. 3,0. Бумага писчая. Тираж 200 экз. Заказ №

Отпечатано: отдел оперативной полиграфии Воронежского государственного архитектурно-строительного университета 394006 Воронеж, ул. 20-летия Октября, 84