Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Пособие_Часть_2_корр1.doc
Скачиваний:
52
Добавлен:
06.12.2018
Размер:
7.01 Mб
Скачать

Independent variable list – независимые переменные )

После нажатия кнопки «ОК» появится окно, представленное на рис. 4. В нем использованы следующие обозначения: Multiple R – множественный R (множественный коэффициент корреляции); R? – R-квадрат (множественный коэффициент детерминации); adjusted R? – скорректированный R-квадрат; F – F-критерий (дисперсионное отношение Фишера); p – значимость F; df – число степеней свободы числителя (в данном случае – 3) и знаменателя (в данном случае – 26); Standard error of estimate – стандартная ошибка; Intercept – свободный члена (); Std. Error – стандартная ошибка коэффициента ; далее показана t-статистика и p-значение, позволяющие определить степень статистической значимости . Под чертой приводятся значения бета-коэффициентов. Красный шрифт свидетельствует об их значимости.

Рис. 4. Вкладка Multiple Regression Results

(Результаты множественного регрессионного анализа)

  1. Переход на вкладку Summary: Regression results (Результаты быстрого регрессионного анализа, см. рис. 8). На ней представлены: бета-коэффициенты (Beta), стандартные ошибки бета-коэффициентов (Std. Err. of Beta), оценки коэффициентов регрессионного уравнения b (B), стандартные ошибки оценок коэффициентов b (Std. Err. of B), t-статистики Стьюдента (t (15)), p-значения (p-level). Красный шрифтом свидетельствует о значимости коэффициентов регрессии.

Рис. 5. Вкладка Regression Summary for Dependent Variable: Y

(Результаты регрессионного анализа для переменной Y)

5. Переход на вкладку Advanced / Descriptive statistics / Correlations (Расширенный анализ / Описательные статистики / Корреляция, см. рис. 6– 8). В результате появится матрица корреляций между переменными модели.

Рис. 6. Вкладка Advanced (Расширенный анализ)

Рис. 7. Вкладка Review Descriptive Statistics

(Просмотр описательных статистик)

Рис. 8. Матрица корреляций

6. Переход на вкладку Summary: Predicted & Residual Values (Предсказанные значения и остатки, см. рис. 9). Здесь использованы следующие обозначения: Observed Value – наблюдаемые (фактические) значения, Predicted Value – предсказанные (расчетные) значения, Residual – остатки; Minimum – минимальное значение, Maximum – максимальное значение, Mean – среднее, Median – медиана. Графическое отображение фактических и расчетных значений можно получить, выполнив следующий пункт.

Рис. 9. Вкладка Predicted & Residual Values (Предсказанные значения и остатки)

7. Переход на вкладку Scatterplots (Графики, см. рис. 10), выбор Predected vs. Observed (Предсказанные и фактические значения, см. рис. 11).

Пример 4. Известно, что стоимость выпуска газеты в значительной степени определяется величиной типографских расходов. Для того чтобы иметь возможность воздействовать на эту стоимость, издатели наиболее популярных газет решили изучить факторы, определяющие сумму годовых затрат на печать газет, и оценить степень их влияния. С этой целью для 20 городов России были собраны данные о годовых расходах на печать (, млн. руб.), объемах розничной продажи газет в городе (млн. руб.) и количества семей в городе (в тысячах). Заметим, что для факторов были взяты их логарифмы ( и , соответственно) с целью уменьшения разброса данных, а, следовательно, и упрощения их обработки. Все эти данные представлены в табл. 15. Постройте модель множественной регрессии, отражающую зависимость среднегодовых расходов на издание газеты от соответствующих факторов.

Рис. 10. Вкладка Scatterplots (Графики)

Рис. 11. Предсказанные и фактические значения зависимой переменной Y

Т а б л и ц а 15

№ п.п.

№ п.п.

1.

2,8

4,4

3,00

11.

2,7

4,24

2,89

2.

2,3

3,68

2,51

12.

2,9

4,72

3,22

3.

2,5

3,92

2,67

13.

3,3

5,28

3,6

4.

2,7

4,32

2,94

14.

2,7

4,24

2,89

5.

2,6

4,24

2,89

15.

1,8

3,04

2,07

6.

2,4

3,76

2,56

16.

1,9

3,12

2,13

7.

3,5

5,52

3,76

17.

2,2

3,6

2,46

8.

2,1

3,36

2,29

18.

2,3

3,68

2,51

9.

1,9

3,04

2,07

19.

3,6

5,76

3,92

10.

3,8

5,92

4,03

20.

2,2

3,6

2,45

Решение с помощью табличного процессора Excel

  1. Ввод исходных данных.

  2. Построение регрессионного уравнения с использованием «Пакета анализа» (см. Вывод итогов 5) и анализ полученных результатов.

ВЫВОД ИТОГОВ 5

Регрессионная статистика

Множественный R

0,997299

R-квадрат

0,994606

Нормированный R-квадрат

0,993972

Стандартная

ошибка

0,044773

Наблюдения

20

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

2

6,283922

3,141961

1567,374

5,26E-20

Остаток

17

0,034078

0,002005

Итого

19

6,318

 

 

 

 

Коэффи-циенты

Стандартная ошибка

t-статис-тика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-0,10201

0,052759

-1,93359

0,069992

-0,21333

0,009298

Переменная X 1

2,653207

2,446084

1,084675

0,293209

-2,50759

7,814002

Переменная X 2

-2,93956

3,595708

-0,81752

0,424942

-10,5258

4,646732

Анализ Вывода итогов 5 свидетельствует о том, что полученные стандартные ошибки значительно больше самих расчетных коэффициентов. Коэффициенты при факторах и незначимы, так как для них P-значения больше 0,05. В то же время сравнение расчетного значения -критерия с табличным (2, 17) = 3,59 позволяет сделать вывод об адекватности рассматриваемой модели.

Коэффициенты корреляции говорят о существенной взаимосвязи моделируемого показателя с факторами (см. табл. 26, полученную в результате использования функции КОРРЕЛ). Одной из причин противоречивости результатов модели является тесная взаимосвязь между факторами. Все эти факты говорят о том, что изучаемая модель требует более детального анализа.

Т а б л и ц а 16

Корреляционная матрица

1

0,9972

0,9971

0,9972

1

0,9999

0,9971

0,9999

1

  1. Проверка условия невырожденности матрицы .

    1. Формирование матрицы с помощью функций ТРАНСП и МУМНОЖ

.

    1. Вычисление определителя матрицы с помощью функции МОПРЕД

0,0633.

Близость определителя к нулю, а также проведенный выше анализ позволяют сделать вывод о наличии частичной мультиколлинеарности.

4. Устранение эффекта мультиколлинеарности с помощью ридж-оценивания.

4.1. Включение в модель дополнительной переменной , принимающей единственное значение, равное 1.

    1. Расчет коэффициентов регрессии с использованием матричных функций Excel.

4.2.1. Формирование матрицы, обратной к матрице системы нормальных уравнений с помощью функций ТРАНСП, МУМНОЖ и МОБР при .

;

;

;

.

      1. Получение вектора оценок коэффициентов регрессии путем умножения обратной матрицы на матрицы и при различных значениях . Оформление результатов виде табл. 17.

Т а б л и ц а 17

Оценки коэффициентов регрессии при разных значениях

 

-0,0937

-0,0745

-0,0588

-0,0458

0,4454

0,4411

0,4381

0,4358

0,2975

0,2972

0,2961

0,2950

5. Расчет стандартных ошибок коэффициентов регрессии.

5.1. Вычисление остаточной дисперсии при различных значениях и оформление результатов расчетов в виде табл. 18.

Т а б л и ц а 18

Квадраты отклонений расчетных от фактических значений

1

2

3

4

0,001703

0,001766

0,001826

0,001884

0,000060

0,000028

0,000011

0,000003

0,002836

0,002686

0,002576

0,002493

0,000028

0,000024

0,000020

0,000016

0,002997

0,002993

0,002980

0,002961

0,003277

0,003036

0,002854

0,002715

0,000265

0,000489

0,000728

0,000970

0,000248

0,000139

0,000074

0,000037

0,000564

0,000336

0,000195

0,000109

0,003337

0,004280

0,005152

0,005956

0,002048

0,002051

0,002062

0,002078

0,004453

0,004163

0,003920

0,003714

0,000854

0,000599

0,000420

0,000292

0,002048

0,002051

0,002062

0,002078

0,005815

0,006670

0,007400

0,008024

0,000885

0,001211

0,001509

0,001776

0,001742

0,001989

0,002196

0,002368

0,000060

0,000028

0,000011

0,000003

Окончание табл. 18

1

2

3

4

0,001462

0,000980

0,000653

0,000426

0,001502

0,001733

0,001927

0,002090

Сумма квадратов отклонений расчетных от фактических значений

0,036183

0,037251

0,038577

0,039994

Остаточная дисперсия

0,002128

0,002191

0,002269

0,002353

    1. Получение стандартных ошибок в виде корня квадратного из произведения диагональных элементов обратной матрицы на остаточную дисперсию при различных значениях . Оформление результатов расчетов в виде табл. 19.

Т а б л и ц а 19

Стандартные ошибки коэффициентов регрессии при разных значениях

 

 

0,0483

0,0464

0,0450

0,0438

0,0824

0,0593

0,0495

0,0437

0,1207

0,0867

0,0721

0,0636

Таким образом, наименьшая стандартная ошибка получена при .Следовательно, построенная модель может быть записана в виде

.

6. Проверка значимости полученных коэффициентов регрессии

; ; .

Сравнение расчетных значений t-статистик с табличным свидетельствует о значимости включенных в модель факторов и . Таким образом, построенную модель можно использовать для целей анализа и прогнозирования.

Задание 2. Начальник отдела маркетинга кинотеатра «Отражение» поручил своим сотрудникам провести исследование, в результате которого необходимо: 1) выявить фактор, в наибольшей степени влияющий на среднее число зрителей за первые три дня проката фильма; 2) построить прогнозную модель в виде линейной функции; 3) с помощью построенной модели получить прогнозные оценки среднего числа зрителей на первые три дня проката следующих двух фильмов. Специалисты отдела маркетинга экспертным путем в качестве фактора, в наибольшей степени влияющего на посещение киносеансов, установили расходы на рекламу фильма, (см. табл. 20). Выполните 2-е и 3-е задание начальника отдела маркетинга.

Т а б л и ц а 20

Показатели, характеризующие деятельность кинотеатра «Отражение»

Среднее число зрителей за первые три дня проката фильма

Расходы

на рекламу

фильма, руб.

Среднее число зрителей за первые три дня проката фильма

Расходы

на рекламу

фильма, руб.

282

2750

305

4565

263

2430

328

5987

295

3700

335

6100

276

2860

251

2375

285

3180

292

3480

342

4270

290

3295

276

2875

387

7500

328

5295

326

5430

321

5140

347

6310

326

4870

234

2100

Задание 3. Предприниматель желает сдать в аренду на один год принадлежащий ему отель*** «Блаженство жизни» (80 комнат), расположенный в престижной курортной зоне, обладающий собственным пляжем, общая площадь территории отеля составляет 3,42 кв.м.

Для того чтобы определить величину платы, которую он сможет установить за аренду своего отеля, предприниматель решил проанализировать ситуацию на соответствующей рыночной нише. Изучение объявлений, размещенных в газетах владельцами трехзвездных отелей, позволило ему сформировать небольшую базу данных, представленную в виде табл. 21.

Т а б л и ц а 21

Данные о трехзвездных отелях

Величина годовой платы за аренду отеля, тыс. руб.

Число комнат в отеле

Престижность района, в котором расположен отель

Наличие у отеля собственного пляжа

Общая площадь территории, принадлежащей отелю, кв. км.

1

2

3

4

5

123

25

1

1

1,00

115

25

0

0

0,80

126

30

1

1

1,20

130

30

0

1

1,50

125

30

1

0

1,40

134

45

0

0

2,00

142

45

1

0

2,50

140

45

0

1

2,20

143

45

0

0

2,70

150

60

0

1

2,80

153

60

0

1

3,00

158

60

1

0

3,60

Окончание табл. 21

1

2

3

4

5

160

75

1

1

3,50

163

75

0

0

3,80

164

75

1

1

3,60

168

75

0

0

3,75

172

100

0

1

4,10

180

100

1

1

4,70

177

120

1

1

4,25

182

120

0

1

4,65

На основе данных этой базы предприниматель решил построить модель множественной регрессии, отражающую зависимость величины годовой арендной платы от числа комнат, престижности района расположения отеля (1 – престижный район, 0 – нет), наличия у отеля собственного пляжа (1 – есть собственный пляж, 0 – нет), а также общей площади территории, принадлежащей отелю, и с помощью построенной модели определить примерный размер платы, которую он может получать за предоставление в аренду своего отеля. На данный момент выбор предпринимателя колеблется между 162 тыс. руб. и 165 тыс. руб. Определите наиболее приемлемый размер арендной платы.

Задание 4. Фирма «Ваше очарование» довольно успешно осуществляет торговлю косметическими товарами на российском рынке. Ее успех определяется, в частности, человеческим фактором. С целью изучения его влияния на среднеквартальный объем продаж (млн. руб., ) через такие показатели, как фонд оплаты труда (млн. руб., ) и численность работников фирмы (чел., ), была сформирована табл. 22. В этой таблице приведены данные по этим показателям за последние 18 кварталов. Постройте двухфакторную регрессионную модель, отражающую зависимость объема продаж от указанных факторов.

Т а б л и ц а 22

Показатели деятельности фирмы «Ваше очарование»

1

39832

3975

1986

10

43671

4344

2171

2

33527

3337

1668

11

39518

3895

1946

3

36181

3586

1792

12

47639

4941

2469

4

42873

4065

2031

13

39518

3895

1946

5

28279

2859

1429

14

29376

2919

1458

6

52256

5001

2499

15

28215

2809

1404

7

36425

3611

1805

16

33193

3298

1648

8

27734

2760

1379

17

33927

3377

1688

9

54547

5419

2708

18

57736

5250

2624