Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие программные стат комплексы.doc
Скачиваний:
36
Добавлен:
14.03.2016
Размер:
1.32 Mб
Скачать

Пример расчета

В табл. 23 представлены результаты экспериментальных исследований процесса получения гальванических покрытий. Необходимо выяснить каким образом влияют на внутренние напряжения получаемых покрытий (выраженные в условных единицах) условия электроосаждения.

Таблица 23

В

C

D

E

2

Внутреннее напряжение

Концентрация сахарина в растворе, г/л

Плотность тока, А/дм2

Температура

раствора, С

3

3,75

0,45

40

60

4

2,75

0,5

35

50

5

0,5

0,4

80

40

6

2,25

0,55

30

30

7

2,75

1,05

35

40

8

0,75

0,95

75

35

9

1

1,05

75

40

10

0,5

0,9

70

30

С этой целью определим параметры уравнения линейной регрессии и проведем его анализ, используя режим работы Регрессия.

Значения параметров, установленных в одноименном диалоговом окне, показаны на рис. 13, а рассчитанные в данном режиме показатели – в табл. 24-28.

Рис. 13

В табл. 24 сгенерированы результаты по регрессионной статистике.

Таблица 24

В

C

12

ВЫВОД ИТОГОВ

13

14

Регрессионная статистика

15

Множественный R

0,986

16

R-квадрат

0,971

17

Нормированный R-квадрат

0,950

18

Стандартная ошибка

0,280

19

Наблюдения

8

Эти результаты соответствуют следующим статистическим показателям:

  • Множественный R – коэффициенту корреляции R;

  • R-квадрат – коэффициенту детерминации R2;

  • Стандартная ошибка – остаточному стандартному отклонению ;

  • Наблюдения – числу наблюдений n.

В табл. 25 сгенерированы результаты дисперсионного анализа, которые используются для проверки значимости коэффициента детерминации R2.

Таблица 25

B

C

D

E

F

G

21

Дисперсионный анализ

22

df

SS

MS

F

Значимость F

23

Регрессия

3

10,617

3,539

45,287

0,0015

24

Остаток

4

0,313

0,078

25

Итого

7

10,930

26

Столбцы табл. 25 имеют следующую интерпретацию:

  • столбец df – число степеней свободы

для строки Регрессия число степеней свободы определяется количеством факторных признаков m в уравнении регрессии kф=m;

для строки Остаток число степеней свободы определяется числом наблюдений n и количеством переменных в уравнении регрессии m+1: kо=n-(m+1);

для строки Итого число степеней свободы определяется суммой ky= kф + kо;

  • столбец SS – сумма квадратов отклонений

для строки Регрессия – это сумма квадратов отклонений теоретических данных от среднего ;

для строки Остаток – это сумма квадратов отклонений эмпирических данных от теоретических ;

для строки Итого – это сумма квадратов отклонений эмпирических данных от среднего или;

  • столбец MS – дисперсии, рассчитанные по формуле ,

для строки Регрессия – это факторная дисперсия ;

для строки Остаток – это остаточная дисперсия ;

  • столбец F – расчетное значение F-критерия Фишера Fр, вычисляемое по формуле ;

  • столбец Значимость F – значение уровня значимости, соответствующее вычисленному значению Fр. Определяется с помощью функции .

В табл. 26 сгенерированы значения коэффициентов регрессии ai и их статистические оценки.

Таблица 26

B

C

D

E

F

G

H

I

J

27

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

28

Y-пересечение

1,795

0,687

2,614

0,0591

-0,111

3,701

-0,111

3,701

29

Концентрация сахарина в растворе, г/л

-0,030

0,412

-0,072

0,9458

-1,173

1,113

-1,173

1,113

30

Плотность тока, А/дм2

-0,042

0,005

-7,822

0,0014

-0,057

-0,027

-0,057

-0,027

31

Температура раствора, С

0,057

0,011

5,062

0,0072

0,026

0,088

0,026

0,088

Столбцы табл. 26 имеют следующую интерпретацию:

  • столбец Коэффициенты – значения коэффициентов аi;

  • столбец Стандартная ошибка – стандартные ошибки коэффициентов аi;

  • столбец t-статистика – расчетные значения t-критерия, вычисляемые по формуле ;

  • столбец P-Значение – значения уровней значимости, соответствующие вычисленным значениям tр;

  • столбцы Нижние 95 % и Верхние 95 % - соответственно нижние и верхние границы доверительных интервалов для коэффициентов регрессии аi. Для нахождения границ доверительных интервалов с помощью функции =СТЬЮДРАСПОБР(; n-m-1) рассчитывается критическое значение t-критерия tкр, а затем по формулам:

Нижние 95 % = Коэффициент – Стандартная ошибка  tкр;

Верхние 95 % = Коэффициент + Стандартная ошибка  tкр

вычисляются соответственно нижние и верхние границы доверительных интервалов.

В табл. 27 сгенерированы теоретические значения результативного признакаY и значения остатков. Последние вычисляются как разность между эмпирическими y и теоретическими значениями результативного признакаY.

Таблица 27

B

C

D

E

35

ВЫВОД ОСТАТКА

36

37

Наблюдение

Предсказанное

Внутреннее напряжение

Остатки

Стандартные остатки

38

1

3,524

0,226

1,068

39

2

3,162

-0,412

-1,952

40

3

0,687

-0,187

-0,883

41

4

2,230

0,020

0,094

42

5

2,576

0,174

0,825

43

6

0,631

0,119

0,564

44

7

0,900

0,100

0,476

45

8

0,541

-0,041

-0,192

Перейдем к анализу сгенерированных таблиц.

Рассчитанные в табл. 26 (ячейки С28:С31) коэффициенты регрессии аi позволяют построить уравнение, выражающее зависимость внутреннего напряжения покрытия от концентрации сахарина в растворе X1, плотности тока X2 и температуры раствора X3:

.

Значение множественного коэффициента детерминации R2 = 0,971 (ячейка С16 в табл. 24) показывает, что 97,1 % общей вариации результативного признака объясняется вариацией факторных признаков X1, X2 и X3, что подтверждает правильность их включения в построенную модель.

Рассчитанный уровень значимости (показатель Значимость F табл. 25) р = 0,0015 меньше = 0,05, что подтверждает значимость R2.

Другой подход к проверке значимости R2 основан на проверке попадания Fр (показатель F в табл. 25) в критическую область (Fпркр, ; +). Для рассматриваемого примера Fпркр, рассчитывается по формуле =FРАСПОБР(0,05; С23; С24) (ячейка Н23 табл. 28),

Таблица 28

Н

22

Fпркр

23

6,591392321

где в ячейке С23 рассчитывается значение kф=m; в ячейке С24 – значение kо=n-(m+1).

Т.к. Fр = 45,287 попадает в критический интервал (6,591; +), то гипотеза Н0 : R2 = 0 отвергается, т.е. коэффициент детерминации R2 является значимым.

Показатель средней ошибки аппроксимации может быть рассчитан следующим образом (табл. 29):

=СУММ(АВS(D38:D45)/(B3:B10))/СЧЕТ(B3:B10)*100.

Таблица 29

G

38

, %

39

12,46

Следующим этапом является проверка значимости коэффициентов регрессии: а0, а1, а2 и а3. Сравнивая попарно элементы массивов C28:C31 и D28:D31 (табл. 26) видим, что абсолютное значение коэффициента а1 меньше, чем его стандартная ошибка. О значимости коэффициентов можно судить по значениям показателя P-Значение в табл. 26. Для коэффициента а1 это значение, равное 0,9458, существенно больше принятого уровня значимости =0,05, следовательно данный коэффициент незначимый и его следует исключить из уравнения.

Другой распространенный способ проверки значимости коэффициентов регрессии основан на проверке попадания tр (показатель t-статистика в табл. 26) в критическую область

(-; tкрлев, /2)  (tкрпр, /2; +). В генерируемых таблицах режима не приводится значение tкр, но его можно вычислить с помощью функции СТЬДРАСПОБР. Для рассматриваемого примера значение tкр рассчитано в ячейке Е34 (табл. 30) по формуле

=СТЬДРАСПОБР(0,05; 8-3-1),

где 0,05 – заданный уровень значимости; 8 – число наблюдений; 3 – число факторов в уравнении регрессии; 1 – число свободных членов в уравнении регрессии.

Таблица 30

Е

33

tкр

34

2,776450856

В критический интервал (-; -2,776)  (2,776; +) попадают значения tкра2 = -7,822 и tкра3 = 5,062, следовательно, коэффициенты регрессии а2 и а3 являются значимыми.

Подводя итог предварительному анализу уравнения регрессии, можно сделать вывод, что коэффициент регрессии а1 не является статистически значимым и целесообразно сделать пересчет без учета фактора x1 – Концентрация сахарина в растворе.

После пересчета уравнения на рабочем листе генерируются таблицы, аналогичные табл. 24-27.

Таблица 31

В

C

49

ВЫВОД ИТОГОВ

50

51

Регрессионная статистика

52

Множественный R

0,986

53

R-квадрат

0,971

54

Нормированный R-квадрат

0,960

55

Стандартная ошибка

0,250

56

Наблюдения

8

Таблица 32

B

C

D

E

F

G

58

Дисперсионный анализ

59

df

SS

MS

F

Значимость F

60

Регрессия

2

10,617

5,308

84,799

0,000139

61

Остаток

5

0,313

0,063

62

Итого

7

10,930

Таблица 33

B

C

D

E

F

G

H

I

J

64

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

65

Y-пересечение

1,772

0,545

3,249

0,023

0,370

3,174

0,370

3,174

Окончание табл. 33

B

C

D

E

F

G

H

I

J

66

Плотность тока, А/дм2

-0,042

0,005

-9,143

0,0003

-0,054

-0,030

-0,054

-0,030

67

Температура раствора, С

0,057

0,010

5,812

0,002

0,032

0,083

0,032

0,083

Таким образом, получено новое уравнение регрессии:

.

Проверка значимости коэффициента детерминации R2 (р = 0,000139  0,05) и коэффициентов регрессии а2 и а3 (tкр =2,5706) подтверждают адекватность полученного уравнения.