Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторный практикум_за основу(прикладная статистика).doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
2.55 Mб
Скачать
  1. Третий способ

  2. Для получения решения необходимо воспользоваться функцией Регрессия. Для этого в окне «Анализа данных» необходимо выбрать строку Регрессия. Появляется диалоговое окно, которое заполняется следующим образом:

Входной интервал Y – диапазон (столбец), содержащий данные со значениями зависимой переменной;

Входной интервал Хi – диапазон (столбцы), содержащий данные со значениями независимых переменных.

Метки – флажок, который указывает, содержат ли первые элементы отмеченных диапазонов названия переменных (столбцов) или нет;

Константа-ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Уровень надежности – уровень значимости, (например, 0,05).

Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона, в котором будет сохранен отчет по построению модели;

Новый рабочий лист – поставить значок и задать имя нового листа (Отчет - регрессия), в котором будет сохранен отчет.

Если необходимо получить значения и график остатков, а также график подбора, установите соответствующие флажки в диалоговом окне.

Уравнение регрессии имеет вид:

Оценка параметров модели

ВЫВОД ИТОГОВ

Регрессионная статистика

Множествен. R

0,847950033

R-квадрат

0,719019259

Нормированный R-квадрат

0,683896667

Стандартная ошибка

67,19447214

Наблюдения

10

Дисперсионный анализ

 

df

SS

MS

F

Значимость F

Регрессия

1

92431,72

92431,72

20,4717

0,001938

Остаток

8

36120,78

4515,097

Итого

9

128552,5

 

 

 

 

Коэффиц.

Стандарт. ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

828,1268882

136,1286

6,083416

0,000295

514,2138

1142,04

Переменная X 1

10,7867573

2,384042

4,524567

0,001938

5,289146

16,28437

ВЫВОД ОСТАТКА

Наблюдение

Предсказ. Y

Остатки

1

1270,383938

-20,3839

2

1410,611782

-30,6118

3

1507,692598

-82,6926

4

1410,611782

14,38822

5

1345,891239

104,1088

6

1324,317724

-24,3177

7

1496,905841

-96,9058

8

1486,119084

23,88092

9

1518,479355

56,52064

10

1593,986657

56,01334

Основные параметры регрессионной модели:

1. Множественный R = 0,847950033 (коэффициент корреляции Пирсона).

2. R-квадрат = 0,719019259 (коэффициент детерминации) – показывает долю вариации зависимой переменной, которая объясняется вариацией независимой переменной (значения от 0 до 1). Коэффициент является одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества уравнения регрессии в целом (или, как говорят, мерой качества подгонки регрессионной модели к наблюденным значениям). Величина показывает, какая часть (доля) вариации объясняемой переменной обусловлена вариацией объясняющей переменной.

Нормированный R-квадрат – скорректированный (адаптированный, поправленный(adjusted)) коэффициент детерминации:

Недостатком коэффициента детерминации является то, что он увеличивается при добавлении новых объясняющих переменных, хотя это и не обязательно означает улучшение качества регрессионной модели. В этом смысле предпочтительнее использовать нормированный R-квадрат. В отличие от R-квадрат, скорректированный коэффициент может уменьшаться при введении в модель новых объясняющих переменных, не оказывающих существенное влияние на зависимую переменную.

3. Стандартная ошибка = 67,19

Значение не должно превышать 30%.

df – degrees of freedom – число степеней свободы связано с числом единиц совокупности и с числом определяемых по ней констант.

4. F – критерий Фишера , значимость F < 0,05.

F и Значимость F позволяют проверить значимость уравнения регрессии, т.е. установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

SS – Сумма квадратов отклонений значений признака Y.

MS – Дисперсия на одну степень свободы.

F – Наблюдаемое (эмпирическое) значение статистики F, по которой проверяется гипотеза равенства нулю одновременно всех коэффициентов модели. Значимость F – теоретическая вероятность того, что при гипотезе равенства нулю одновременно всех коэффициентов модели F-статистика больше эмпирического значения F.

5. t – статистика (коэффициент Стьюдента) – значение должно быть > 2; р – значение < 0,05; доверительный интервал не должен включать 0. Эти три показателя между собой взаимосвязаны и интерепретируются одинаково: переменная Х оказывает значимое влияние на переменную Y.

6. Остатки (влияние случайных факторов) – коэффициент автокорреляции для остатков должен стремиться к нулю. Рассчитывается как коэффициент корреляции для двух наборов данных их одного столбца: первый – значения с 1 по 9 (предпоследний), второй – значения с 2 по 10 (последний).

Проверка модели на возможность ее практического применения производится по критериям точности, надежности и адекватности. Все параметры должны выполняться одновременно. Несоответствие одному из критериев означает отсутствие модели как таковой.

Точность оценивается по значениям коэффициента корреляции r, коэффициента детерминации r2 и стандартной ошибки m.

Критерий

Критическое значение

Расчетное значение

Вывод о точности модели

r

> 0,7

0,847

+

r2

> 0,5

0,719

+

m%

< 30%

+

Надежность модели оценивается по значениям F – для модели в целом и значениям t, p и доверительного интервала – для независимой переменной Х.

Критерий

Критическое значение

Расчетное значение

Вывод о надежности модели

для модели

F

F > Fтабличн

20,47

+

Значимость F

< 0,05

0,0018

+

Для независимой переменной Х

t

t > 2

4,524

+

p

p < 0,05

0,0019

+

доверительный интервал

0 отсутствует

5,289 – 16,283

+

Адекватность модели оценивается по коэффициенту автокорреляции.

Критерий

Критическое значение

Расчетное значение

Вывод о точности модели

автокорреляция

< 0,3

0,164

+

ВЫВОД ОСТАТКА

Наблюдение

Предсказанное Y

Остатки

Автокорреляция

1

1270,383938

-20,3839

0,164647

2

1410,611782

-30,6118

3

1507,692598

-82,6926

4

1410,611782

14,38822

5

1345,891239

104,1088

6

1324,317724

-24,3177

7

1496,905841

-96,9058

8

1486,119084

23,88092

9

1518,479355

56,52064

10

1593,986657

56,01334

Вывод:

Уравнение , описывающее зависимость двух переменных отвечает требованиям точности, надежности и адекватности и может быть использовано для прогнозирования результатов.

Таким образом, при расходах на рекламу в размере 50 и 80 денежных единиц, прогнозируется объем продаж на уровне 1367 и 1690 соответственно.

Задача. Составить многофакторную корреляционную модель среднечасовой выработки по данным таблицы, где

Y - среднечасовая выработка участка цеха, д.е.,

Х1 -- фондовооруженность труда, тыс. д.е.,

Х2 – процент рабочих, имеющих высшую квалификацию,

Х3 – средний срок службы оборудования, лет,

Х4 – процент прогрессивного оборудования.

Y

X1

X2

X3

X4

1

95

468

25

10

30

2

85

312

20

16

27

3

80

286

17

12

22

4

83

300

16

27

20

5

58

250

13

8

19

6

63

156

17

24

26

7

83

338

21

16

17

8

88

260

16

5

19

9

78

128

17

9

21

10

70

312

39

22

18

11

87

364

16

28

20

12

58

312

14

16

14

13

86

182

25

19

20

14

66

234

16

4

26

15

62

364

16

23

17

16

88

208

21

16

19

17

76

312

16

18

19

18

80

156

19

27

15

19

56

170

20

24

21

20

88

312

21

10

19

21

90

200

27

12

23

22

71

286

17

9

22

23

72

170

21

8

23

24

79

200

19

14

28

25

53

150

10

9

17

26

40

140

14

18

10

27

66

200

16

22

24

28

85

313

16

20

21

Практическая работа 2.

Непараметрические методы

0

Задача 1. Из 50 опрошенных студентов 29 предпочитали бы жить в общежитиях в одноместной комнате. При α=0,05 проверьте гипотезу о том, что более 50% студентов предпочитают жить в общежитиях в одиночку. Задача 2. . Было проведено исследование, чтобы выяснить, повлияют ли новые диетические медикаменты на женщин, желающих сбросить вес. Вес 8 пациенток был измерен до лечения и через 6 недель ежедневного применения лечения. Данные приведены ниже. Можно ли сделать вывод, что лечение повлияло (увеличило или уменьшило) на вес этих женщин?

Задача 3. Двум группам рабочих дали вопросники, чтобы установить степень их удовлетворенности работой. Задавалась шкала диапазоном от 0 до 100. Группы делились по стажу: те, кто работал более 5 лет, и те, кто работал менее 5 лет. Данные приведены ниже. Проверьте заявление о том, что между удовлетворенностью работой двух групп нет разницы.

59