![](/user_photo/2706_HbeT2.jpg)
- •Министерство образования российской федерации
- •С использованием табличного процессора Excel и надстройки «Пакет анализа»
- •Краткие теоретические сведения
- •Порядок выполнения работы
- •Пример выполнения
- •Содержание отчета
- •Пример построения гистограммы
- •Порядок выполнения работы
- •Контрольные вопросы
- •Пример расчета
- •Пример расчета
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Краткие теоретические сведения
- •Сравнение нескольких средних методом дисперсионного анализа
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Краткие теоретические сведения
- •Ковариация
- •Корреляция
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Краткие теоретические сведения
- •Пример расчета
- •Порядок выполнения работы
- •Содержание отчета
- •Контрольные вопросы
- •Библиографический список
- •394000, Воронеж, пр. Революции, 19
Пример расчета
В табл. 23 представлены результаты экспериментальных исследований процесса получения гальванических покрытий. Необходимо выяснить каким образом влияют на внутренние напряжения получаемых покрытий (выраженные в условных единицах) условия электроосаждения.
Таблица 23
|
В |
C |
D |
E |
2 |
Внутреннее напряжение |
Концентрация сахарина в растворе, г/л |
Плотность тока, А/дм2 |
Температура раствора, С |
3 |
3,75 |
0,45 |
40 |
60 |
4 |
2,75 |
0,5 |
35 |
50 |
5 |
0,5 |
0,4 |
80 |
40 |
6 |
2,25 |
0,55 |
30 |
30 |
7 |
2,75 |
1,05 |
35 |
40 |
8 |
0,75 |
0,95 |
75 |
35 |
9 |
1 |
1,05 |
75 |
40 |
10 |
0,5 |
0,9 |
70 |
30 |
С этой целью определим параметры уравнения линейной регрессии и проведем его анализ, используя режим работы Регрессия.
Значения параметров, установленных в одноименном диалоговом окне, показаны на рис. 13, а рассчитанные в данном режиме показатели – в табл. 24-28.
Рис. 13
В табл. 24 сгенерированы результаты по регрессионной статистике.
Таблица 24
|
В |
C |
12 |
ВЫВОД ИТОГОВ |
|
13 |
|
|
14 |
Регрессионная статистика | |
15 |
Множественный R |
0,986 |
16 |
R-квадрат |
0,971 |
17 |
Нормированный R-квадрат |
0,950 |
18 |
Стандартная ошибка |
0,280 |
19 |
Наблюдения |
8 |
Эти результаты соответствуют следующим статистическим показателям:
Множественный R – коэффициенту корреляции R;
R-квадрат – коэффициенту детерминации R2;
Стандартная ошибка – остаточному стандартному отклонению
;
Наблюдения – числу наблюдений n.
В табл. 25 сгенерированы результаты дисперсионного анализа, которые используются для проверки значимости коэффициента детерминации R2.
Таблица 25
|
B |
C |
D |
E |
F |
G |
21 |
Дисперсионный анализ | |||||
22 |
|
df |
SS |
MS |
F |
Значимость F |
23 |
Регрессия |
3 |
10,617 |
3,539 |
45,287 |
0,0015 |
24 |
Остаток |
4 |
0,313 |
0,078 |
|
|
25 |
Итого |
7 |
10,930 |
|
|
|
26 |
|
|
|
|
|
|
Столбцы табл. 25 имеют следующую интерпретацию:
столбец df – число степеней свободы
для строки Регрессия число степеней свободы определяется количеством факторных признаков m в уравнении регрессии kф=m;
для строки Остаток число степеней свободы определяется числом наблюдений n и количеством переменных в уравнении регрессии m+1: kо=n-(m+1);
для строки Итого число степеней свободы определяется суммой ky= kф + kо;
столбец SS – сумма квадратов отклонений
для
строки Регрессия
– это сумма квадратов отклонений
теоретических данных от среднего
;
для
строки Остаток
– это сумма квадратов отклонений
эмпирических данных от теоретических
;
для
строки Итого
– это сумма квадратов отклонений
эмпирических данных от среднего
или
;
столбец MS – дисперсии, рассчитанные по формуле
,
для
строки Регрессия
– это факторная дисперсия
;
для
строки Остаток
– это остаточная дисперсия
;
столбец F – расчетное значение F-критерия Фишера Fр, вычисляемое по формуле
;
столбец Значимость F – значение уровня значимости, соответствующее вычисленному значению Fр. Определяется с помощью функции
.
В табл. 26 сгенерированы значения коэффициентов регрессии ai и их статистические оценки.
Таблица 26
|
B |
C |
D |
E |
F |
G |
H |
I |
J |
27 |
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
28 |
Y-пересечение |
1,795 |
0,687 |
2,614 |
0,0591 |
-0,111 |
3,701 |
-0,111 |
3,701 |
29 |
Концентрация сахарина в растворе, г/л |
-0,030 |
0,412 |
-0,072 |
0,9458 |
-1,173 |
1,113 |
-1,173 |
1,113 |
30 |
Плотность тока, А/дм2 |
-0,042 |
0,005 |
-7,822 |
0,0014 |
-0,057 |
-0,027 |
-0,057 |
-0,027 |
31 |
Температура раствора, С |
0,057 |
0,011 |
5,062 |
0,0072 |
0,026 |
0,088 |
0,026 |
0,088 |
Столбцы табл. 26 имеют следующую интерпретацию:
столбец Коэффициенты – значения коэффициентов аi;
столбец Стандартная ошибка – стандартные ошибки коэффициентов аi;
столбец t-статистика – расчетные значения t-критерия, вычисляемые по формуле
;
столбец P-Значение – значения уровней значимости, соответствующие вычисленным значениям tр;
столбцы Нижние 95 % и Верхние 95 % - соответственно нижние и верхние границы доверительных интервалов для коэффициентов регрессии аi. Для нахождения границ доверительных интервалов с помощью функции =СТЬЮДРАСПОБР(; n-m-1) рассчитывается критическое значение t-критерия tкр, а затем по формулам:
Нижние 95 % = Коэффициент – Стандартная ошибка tкр;
Верхние 95 % = Коэффициент + Стандартная ошибка tкр
вычисляются соответственно нижние и верхние границы доверительных интервалов.
В
табл. 27 сгенерированы теоретические
значения
результативного признакаY
и значения остатков. Последние вычисляются
как разность между эмпирическими y
и теоретическими
значениями результативного признакаY.
Таблица 27
|
B |
C |
D |
E |
35 |
ВЫВОД ОСТАТКА | |||
36 |
|
|
|
|
37 |
Наблюдение |
Предсказанное Внутреннее напряжение |
Остатки |
Стандартные остатки |
38 |
1 |
3,524 |
0,226 |
1,068 |
39 |
2 |
3,162 |
-0,412 |
-1,952 |
40 |
3 |
0,687 |
-0,187 |
-0,883 |
41 |
4 |
2,230 |
0,020 |
0,094 |
42 |
5 |
2,576 |
0,174 |
0,825 |
43 |
6 |
0,631 |
0,119 |
0,564 |
44 |
7 |
0,900 |
0,100 |
0,476 |
45 |
8 |
0,541 |
-0,041 |
-0,192 |
Перейдем к анализу сгенерированных таблиц.
Рассчитанные в табл. 26 (ячейки С28:С31) коэффициенты регрессии аi позволяют построить уравнение, выражающее зависимость внутреннего напряжения покрытия от концентрации сахарина в растворе X1, плотности тока X2 и температуры раствора X3:
.
Значение множественного коэффициента детерминации R2 = 0,971 (ячейка С16 в табл. 24) показывает, что 97,1 % общей вариации результативного признака объясняется вариацией факторных признаков X1, X2 и X3, что подтверждает правильность их включения в построенную модель.
Рассчитанный уровень значимости (показатель Значимость F табл. 25) р = 0,0015 меньше = 0,05, что подтверждает значимость R2.
Другой подход к проверке значимости R2 основан на проверке попадания Fр (показатель F в табл. 25) в критическую область (Fпркр, ; +). Для рассматриваемого примера Fпркр, рассчитывается по формуле =FРАСПОБР(0,05; С23; С24) (ячейка Н23 табл. 28),
Таблица 28
|
Н |
22 |
Fпркр |
23 |
6,591392321 |
где в ячейке С23 рассчитывается значение kф=m; в ячейке С24 – значение kо=n-(m+1).
Т.к. Fр = 45,287 попадает в критический интервал (6,591; +), то гипотеза Н0 : R2 = 0 отвергается, т.е. коэффициент детерминации R2 является значимым.
Показатель
средней ошибки аппроксимации
может быть рассчитан следующим образом
(табл. 29):
=СУММ(АВS(D38:D45)/(B3:B10))/СЧЕТ(B3:B10)*100.
Таблица 29
|
G |
38 |
|
39 |
12,46 |
Следующим этапом является проверка значимости коэффициентов регрессии: а0, а1, а2 и а3. Сравнивая попарно элементы массивов C28:C31 и D28:D31 (табл. 26) видим, что абсолютное значение коэффициента а1 меньше, чем его стандартная ошибка. О значимости коэффициентов можно судить по значениям показателя P-Значение в табл. 26. Для коэффициента а1 это значение, равное 0,9458, существенно больше принятого уровня значимости =0,05, следовательно данный коэффициент незначимый и его следует исключить из уравнения.
Другой распространенный способ проверки значимости коэффициентов регрессии основан на проверке попадания tр (показатель t-статистика в табл. 26) в критическую область
(-; tкрлев, /2) (tкрпр, /2; +). В генерируемых таблицах режима не приводится значение tкр, но его можно вычислить с помощью функции СТЬДРАСПОБР. Для рассматриваемого примера значение tкр рассчитано в ячейке Е34 (табл. 30) по формуле
=СТЬДРАСПОБР(0,05; 8-3-1),
где 0,05 – заданный уровень значимости; 8 – число наблюдений; 3 – число факторов в уравнении регрессии; 1 – число свободных членов в уравнении регрессии.
Таблица 30
|
Е |
33 |
tкр |
34 |
2,776450856 |
В критический интервал (-; -2,776) (2,776; +) попадают значения tкра2 = -7,822 и tкра3 = 5,062, следовательно, коэффициенты регрессии а2 и а3 являются значимыми.
Подводя итог предварительному анализу уравнения регрессии, можно сделать вывод, что коэффициент регрессии а1 не является статистически значимым и целесообразно сделать пересчет без учета фактора x1 – Концентрация сахарина в растворе.
После пересчета уравнения на рабочем листе генерируются таблицы, аналогичные табл. 24-27.
Таблица 31
|
В |
C |
49 |
ВЫВОД ИТОГОВ |
|
50 |
|
|
51 |
Регрессионная статистика | |
52 |
Множественный R |
0,986 |
53 |
R-квадрат |
0,971 |
54 |
Нормированный R-квадрат |
0,960 |
55 |
Стандартная ошибка |
0,250 |
56 |
Наблюдения |
8 |
Таблица 32
|
B |
C |
D |
E |
F |
G |
58 |
Дисперсионный анализ | |||||
59 |
|
df |
SS |
MS |
F |
Значимость F |
60 |
Регрессия |
2 |
10,617 |
5,308 |
84,799 |
0,000139 |
61 |
Остаток |
5 |
0,313 |
0,063 |
|
|
62 |
Итого |
7 |
10,930 |
|
|
|
Таблица 33
|
B |
C |
D |
E |
F |
G |
H |
I |
J |
64 |
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
65 |
Y-пересечение |
1,772 |
0,545 |
3,249 |
0,023 |
0,370 |
3,174 |
0,370 |
3,174 |
Окончание табл. 33
|
B |
C |
D |
E |
F |
G |
H |
I |
J |
66 |
Плотность тока, А/дм2 |
-0,042 |
0,005 |
-9,143 |
0,0003 |
-0,054 |
-0,030 |
-0,054 |
-0,030 |
67 |
Температура раствора, С |
0,057 |
0,010 |
5,812 |
0,002 |
0,032 |
0,083 |
0,032 |
0,083 |
Таким образом, получено новое уравнение регрессии:
.
Проверка значимости коэффициента детерминации R2 (р = 0,000139 0,05) и коэффициентов регрессии а2 и а3 (tкр =2,5706) подтверждают адекватность полученного уравнения.