книги из ГПНТБ / Маршак, М. И. Теория технологической статистики
.pdfпотезу о случайности выборки следует отвергнуть.
При п = 265
VC265) |
> |
163 |
, |
'V (265) |
< |
7 |
( 3 .2 ) |
В частности, для фактора У3 (прочность бетона нормаль ного хранения)
V |
(265) |
= |
198 |
■ Г |
(265) |
= |
Д . |
Следовательно, гипотозу о случайности выборки следует принять. Критерий "восходящих" и "нисходящих" серий дает возможность сделать вывод о случайности выборки и для остальных факторов производственного процесса.
При построении зависимости качеств^ бетона от факторов производственного процесса были выделены две группы. К первой отнесены факторы, характеризующие расход материалов ко-второй - параметры, характеризующие режим обработки, в частности, температуру смеси Хд, температуру хранения об разцов 1-3 дна. Xj q , температуру хранения образцов Д-7 flHew.Xjp влажность хранения 1-3 дни: Хр,» влажность хране нин Д-7 днекХ^з*
Была составлена модель вида:
'J j - f ( X4 : X /Q , Хи /Л , Xt i) j
характеризующая связь между прочностью и факторами второй группы.
В табл. 3.2 приведены основные статистические характе ристики изучаемых показателей. Дли определения тесноты связи между изучаемыми показателями были вычислены парные
коэффициенты корреляции. Их матрица представлена в табл.
3 .1.
Было получено следующее уравнение множественной регрес
сии:
58
„[. - 7 Ь 8,31 3 J3&Ag~h3 , 5 b X i o ~ i j b 8 X n 0 ,9 6 X n ~ 3 , 0 5 Х / з
Проверку значимости уравнения регрессии производим на основе вычисления критерия F .
о числом |
степеней свободы |
, |
'^г- П ~ р > |
||
где |
П - |
количество |
наблюдений; |
|
|
|
- |
количество |
параметров уравнения регрессии |
||
|
|
/7 |
|
п |
|
П - р
При этом проверяется гипотеза о |
том, что выравнивание |
||
по построенному уравнению регрессии |
лучше, чем выравнива |
||
ние по уравнению У^ = |
У3 . |
|
|
Полученное значение |
р - |
критерия сравнивается с таб |
|
личным (при выбранном уровне |
значимости 0,05 или 0 ,0 1 ) . |
Если оно окажется больше соответствующего табличного зна
чения, то гипотеза о том, |
что выравнивание по построенному |
|||||
уравнению регрессии лучше, |
чем |
выравнивание по уравнению |
||||
ц |
~ у |
не отвергается. |
|
|
|
|
0 |
Статистический анализ |
полученного |
уравнеиия показыва |
|||
ет, |
что оно значимо; фактическое |
значение |
/^-критерия |
|||
равно 1,50'при табличном значении 1,26 |
( |
для 5% уровня |
||||
значимости). |
|
|
|
|
Коэффициент |
множественной |
корреляции |
равен 0 ,5 6 . |
|
|||||
Далее проверяется значимость коэффициентов регрессии. |
|||||||||
Соответствующие |
значения t |
-критерия для коэффициентов |
|||||||
регрессии следующие: |
|
|
|
|
|
|
|||
|
tas =3,93 |
£ а ,а= |
1,75 |
|
|
||||
• |
i a io=2 ,28 |
i a fc |
М 2 |
|
|
||||
|
i a „ = 1,65 |
|
|
|
|
|
|
||
|
6 a. |
’ |
|
Y ^ o c r'^ it |
|
|
|||
здесь |
|
диагональный элемент матрицы, обратной |
к |
||||||
|
|
матрице системы нормальных уравнений. Вели |
|||||||
ч и н а ^ |
имеет |
распределение |
Стьюдента с |
п - р |
степе |
||||
нями свободы. |
|
|
|
|
|
|
|
|
|
Значения |
t |
-критерия можно |
признать значимыми, |
если |
|||||
доверительный уровень |
~Ь |
взять, |
например, 1 ,3 , что |
соот |
|||||
ветствует вероятности 0 , 8 . |
|
|
|
|
|
||||
Проверим |
теперь при помощи критерия |
"восходящих" |
и |
"нисходящих" серий независимость отклонений (ошибок). В ре зультате получено:
(265) = 120, 'Т (265) = 12 .
Таким образом, оба неравенства соотношения ( 3 .2 ) нару шаются и гипотезу о независимости отклонений принять нельзя.
Критерий Дарбина-^отсона |
также |
показывает наличие ав |
|||
токорреляции отклонений. |
|
|
|
|
|
• Итак, наличие |
автокорреляции отклонений |
отражает |
влия |
||
ние факторов, не |
учтенных в |
модели, |
то есть |
факторов |
первой |
группы, характеризующих расход материалов, свойства запол нителей и цемента»
60
Рассмотрим вторую модель, в которую введены факто ры как первой, так и второй группы.
Основные статистические характеристики изучаемых по казателей также приведены в табл. 3 . 2 , а парные коэффи циенты корреляции - в табл. 3 . 1 . Отметим, что коэффици енты корреляции, не имеющие реального смысла, опущены в табл. 3 .1 (на соответствующем месте расположена пустая клетка).
Было получено следующее уравнение множественной рег рессии .
= Ь'11,50 ■*- 6 , OZXj ' 2 8 ,5 !Х ч + 0 , 19 Хо + 10, 0 1 Х } ~
- 3 , 5 3 Ху ■/-0 ,9 3 Х,с - /, 4 2 Хн - О, ЧС Х,г -1 ,2 .9 Х а ( а . д )
Статистический анализ уравнения показал, что оно значи мо: тактическое значение/-- критерия равно 3.10 при таб личном значении 1,26 (для 5,5 уровня значимости).
Коэффициент множественной корреляции равен 0 ,7 9 . Соответствующие значения t - критерия для коэффициен
тов регрессии следующее:
^ = 1 , 7 0 |
£ *= 2 , 2 0 |
|
t a 4= |
Ь , 6 ь |
t a ,,= i, 6 I |
tiy - |
3,37 |
1,69 |
£,* = |
21 |
^а,.(=2,70 |
ta = |
3,01 |
|
Из рассмотрения i -критерия для коэффициентов регрессии можно сделать вывод о достоверности полученно го уравнения.Критерий "восходящих" и "нисходящих" серий позволяет принять гипотезу о независимости ошибок уравне
ния. |
|
|
|
^ (265) |
=180, |
7 Г (265) |
= 5 , |
т .е . соотношения |
(3 .2 ) |
выполняются.Критерий Дарбина-Уот- |
сона позволяет сделать вывод об отсутствии автокорреляции отклонений.
61
о\
го
у з
х з
Ч
ц
■h
\
Л 9
х ю
%
Х1 2
Х13
Таблица 3.1
Матрица первых коэффициентов корреляции бетонной cueси марки М-300
! 7 » |
: |
X |
: X |
: |
X |
: X |
. X |
: |
X |
: |
X |
: |
X |
: |
X |
. |
3 . ’ 4 • : |
I |
: 7 |
: 9 |
: |
10 |
: |
I I |
: |
1 2 |
: |
13 |
|||
' I |
|
0 , 1 8 |
- 0 , 5 9 |
|
0 , 4 1 |
0 ,5 0 |
- 0 , 4 5 |
|
0 , 1 2 |
|
- 0 , 1 6 |
|
- 0 , 4 0 |
|
- 0 , 4 8 |
|
|
I |
|
|
0 , 1 1 |
- |
- |
|
- |
|
- |
|
- |
|
- |
|
|
|
I |
|
- 0 , 3 7 |
- 0 , 0 7 |
0 , 1 4 |
|
- 0 , 0 8 |
|
- 0 , 0 1 |
|
0 ,3 0 |
|
0 , 3 1 |
|
|
|
|
|
I |
0 , 2 5 |
- 0 , 3 9 |
|
- 0 , 1 5 |
|
- 0 , 1 8 |
|
- 0 , 5 0 |
|
- 0 , 4 9 |
|
|
|
|
|
|
I |
- |
|
- 0 , 2 3 |
|
- 0 , 1 0 |
|
- 0 , 1 0 |
|
- 0 , 2 7 |
|
|
|
|
|
|
|
I |
|
0 ,3 8 |
|
0 ,2 3 |
|
0 , 4 0 |
|
0 , 5 7 |
|
|
|
|
|
|
|
|
|
I |
|
0 ,4 0 |
|
. - 0 , 0 1 |
|
0 , 4 4 |
|
|
|
|
|
|
|
|
|
|
|
I |
|
0 , 1 4 |
|
0 , 1 5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
|
0 ,5 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
I |
|
|
|
|
|
|
Таблица 3.2 |
Статистические характеристики |
бетона |
|||||
|
|
|
марки М-300 |
|
|
|
Факторы |
.'Единицы:Средние |
‘ Среднее |
• |
Коэффициент |
||
•измере-:значения:квадра- |
: |
вариации |
||||
|
: |
ния |
: |
.тичес- . |
|
|
|
: |
|
: |
*кое от- |
: |
|
|
|
: клонение* |
|
|||
|
|
кг/см |
р |
38,78 |
|
9,99 |
уз |
|
388,07 |
|
|||
|
|
|
|
|
|
|
х з |
|
г |
1,73 |
0,36 |
|
20,64 |
*4 |
|
% |
9,50 |
0 , 6 8 |
|
7,15 |
*5 |
|
% |
28,06 |
0,91 |
|
3,25 |
х 7 |
|
? |
19,40 |
0,3 9 . |
|
2 , 2 0 |
|
|
|
|
|
|
|
х 9 |
|
°С |
22,95 |
2,97 |
|
12,92 |
|
|
|
|
|
|
|
О X |
|
°С |
24,74 |
1,67 |
|
6,77 |
М |
|
|
|
|
|
|
h i |
|
°С |
23,72 |
2,19 |
|
9,22 |
hz |
|
° с |
87,17 |
4,60 |
|
5,27 |
XI3 |
|
° с |
87,45 |
4,16 |
|
4,76 |
|
|
|
|
|
Проверка по критерию ?Сг дает возможность принять гипо тезу о том, что ошибки уравнения распределены по нормально му закону.
Итак, ошибки уравнения распределены нормально с мате матическим ожиданием 0 и средним квадратическим отклоне нием 6 ,4 6 .
Следовательно, полученное уравнение множественной рег рессии ( 3 .3 ) может быть использовано для прогнозирования значений прочности нормального хранения У для смеси марки У-800 в диапазоне проведенных наблюдений.
63
При отыскании оптимальных с экономической точки зре ния составов бетона следует в качестве аргументов регрес сионных моделей вводить лишь управляемые факторы, так как только этими факторами оператор имеет возможность свободно варьировать.
§ 3 . Некоторые проблемы построения и интерпретации регрессионных уравнений и пути их решения
При построении и интерпретации уравнений регрессии часто возникают проблемы, требующие рассмотрения целой совокупности взаимосвязанных вопросов, каждый из которых не может быть решен последовательно, обособленно от друго го. Все они связаны с выбором регрессионной модели, адек ватной изучаемому процессу, а также оценкой и интерпретаци ей полученных параметров (коэффициентов регрессии и корре ляции).
Выбор адекватной регрессионной модели осуществляется на основе критериев значимости для получаемых параметров (коэффициентов регрессии, множественного коэффициента кор
реляции и др.).Обычно, если исследуется уравнение регрессии вида
U = 0cf + f)Xi |
*- ЬгХг ^ |
■ |
+ Ьр |
|
(3.4) |
то подсчитываются стандартные квадратические отклонения |
|||||
коэффициентов регрессии |
6 ^ и |
используют |
i |
-критерий для |
|
оценки надежности каждого коэффициента регрессии. |
|||||
Для проверки существенности отличия от нуля коэффициен |
|||||
та множественной |
корреляции используется |
F |
-критерий |
||
F |
- A - |
4 z £ |
, |
|
где |
1 |
1 - R 2 |
0 4 |
|
|
|
|
|
|
П-число наблюдений,
р-число переменных.
64
В иодели остаются те переменные, значения которых больше некоторого критического значения F -распределения при наличии существенности отличия от нуля коэффициента мно жественной корреляции.Примеры такого анализа даны в пре дыдущем параграфе.Однако в ряде случаев возникают ситуа ции, при которых бывает трудно выбрать модель на основе описанных критериев, т . к . анализ указанных величин дает на первый взгляд противоречивые результаты.
Отметим, что построение модели, адекватной рассмат риваемому процессу, не представляет собой разового акта, это процесс, в результате которого происходит отыскание
иодели, более адекватной, точно отражающей основные зако
номерности изучаемого процесса. |
|
|
|
|
||||||
Выбор адекватной регрессионной модели тесно взаимо |
||||||||||
связан с вопросами ложной корреляции и мультиколлинеар |
||||||||||
ности.В работе делается попытка рассмотреть эти вопросы |
||||||||||
во взаимосвязи, |
с |
точки |
зрения |
адекватности |
регрессионной |
|||||
модели изучаемого |
процесса. |
|
|
|
|
|||||
При проверке |
значимости |
коэффициентовг регрессии и мно |
||||||||
жественного коэффициента корреляции возможны следующие |
||||||||||
случаи |
|
|
|
|
|
|
|
|
|
|
D |
г |
и |
все |
|
значимые; |
|
|
|
||
2) |
|
и некоторые, |
но не |
все |
ь |
значимые; |
||||
3) |
я |
значимей, но |
ни один из |
in. |
незначимое; |
|||||
|
|
|
’ з |
|
|
|
|
|
|
|
* ) |
X |
незначимое, |
все |
значимые; |
|
|||||
5) |
Ц* |
незначимое, |
некоторые |
|
значимые, но не все; |
|||||
6 ) Ии |
Щ |
, |
ни |
h |
незначимые. |
|
|
|
||
Известно, |
что критерий |
проверки |
значимости множествен |
ного коэффициента корреляции точно эквивалентен критерию того, что все коэффициенты регрессии одновременно являют
ся нулем*'.Другими словами, из условия значимости множест-
1. |
С ги т ее С ГПSignificance. ТсьTs a n d Test о} fffodels in |
|
multiple. Re.02.eis,сп, —'Ttie CLmeoicur) Statistician", |
|
19 П , v o L ? Z 6 , „ ' 4 . |
2 . |
Андерсон 1 '. Ввведение в многомерный статистический |
|
анализ,М.,Физматгиз, 1963. |
65
венного коэффициента корреляции следует, что один или
более рассматриваемых коэффициентов регрессии отличны от
нуля. А из условия, |
ч т о И : U следует вывод, |
что все |
коэф |
|||||||
фициенты регрессии |
|
нули. |
|
|
|
|
|
|||
|
Тогда в случаях |
4 ,5 и 6 |
рассматриваемая модель не го |
|||||||
дится для предсказания значений фактора |
у |
. С |
точки |
|||||||
зрения выбора модели, проверяя значимость отличия от ну |
||||||||||
ля |
мы сравниваем |
выбранную модель, с моделью, в |
которой |
|||||||
все |
коэффициенты регрессии |
равны нулю и получаем, |
что в |
|||||||
случаях 4 ,5 ,6 |
они |
не |
имеют |
значимого различия. Другими сло |
||||||
вами выбранная |
модель |
бесполезна. |
|
|
|
|
||||
|
В сдучае I модель монет |
быть использована для анали |
||||||||
за |
изучаемой взаимосвязи и |
прогнозирования фактора |
у . |
|||||||
В случаях 2 и 3 следует попытаться видоизменить модель |
||||||||||
путем последовательного исключения переменных, при кото |
||||||||||
рых коэффициенты регрессии |
незначимые, и введения |
значи |
||||||||
мых переменных. |
|
|
|
|
|
|
|
|
||
|
Однако может случиться, |
что изменение |
полученной моде |
ли не дает результатов. Объяснение этого явлении можно дать
следующее. |
Известно, |
что |
для |
некоррелированных |
переменных |
||||||
между |
F |
-критерием |
и |
t |
-критериями для |
коэффициентов |
|||||
регрессии |
а .,,с х г , |
|
, a . s |
имеется |
связь F - |
t ‘/ |
/S |
> |
|||
где |
t i |
-значение |
t |
-критерия |
Стыпдента для L |
-го |
|||||
коэффициента регрессии. |
Если |
все значения |
ti |
равные, |
то |
||||||
мы.имеем |
i~ = t . |
Для |
случая |
коррелированных переменных |
|||||||
зависимость между |
F |
и |
t t |
более |
сложная. |
|
|
|
|
Однако как в случае коррелированных, так и некоррели рованных между собой перемонных будет верно следующее. Каж дое независимое переменное может вызывать довольно не
значительный эффект, т . е . |
оказывать |
довольно слабое воздей |
||||
ствие |
на |
переменную |
у |
, однако несколько эффектов,взятых |
||
от ряда переменных Х^, Х2 , . . . . |
Xs , |
сложенные вместе,могут |
||||
дать |
значимое значение |
F |
, |
т . о . |
множественный коэффици |
|
ент корреляции будет значим, а, следовательно, получаем |
||||||
значимое |
уравнение регрессии. |
В этом случае может оказать- |
66
ся, что невозможно исключить одно переменное или сово купность переменных и получить значимый множественный ' коэффициент корреляции (значимое уравнение регрессии).Поэ тому наряду с проверкой значимости каждого коэффициента
регрессии, |
по формуле |
целесообразно |
проверять |
значимость |
совокупности |
переменних X j, Х2 , . . . |
Х4> к о т о |
рые на основе L -критерия должны быть исключены из мо |
дели. Такую проверку можно осуществлять на основе значи
мости множественного коэффициента корреляции этих |
S |
|
переменных. |
|
|
Если |
множественный коэффициент корреляции незначим, то |
|
все эти |
переменные следует исключить из модели. В |
про |
тивном случае нужны дополнительные исследования: возмож но ли исключить часть из рассматриваемых переменных или оставить все эти переменные? Для этого проверяют значи
мость |
коэффициента корреляции для некоторых подгрупп со |
|||||
вокупности |
переменних. |
|
|
|||
ь |
наших |
исследованиях выявлялась |
зависимость |
проч |
||
ности |
бетона от ряда факторов, на него влияющих. Для бе |
|||||
тона |
марки М-200 |
была построена регрессионная модель, по |
||||
результатам |
1 2 |
0 |
наблюдений. |
|
|
|
У3 |
= 600,5 |
+ |
5,25 Х3 - 25,30Х4+0,85Х6+10,01Х7 |
- 3,25 Х 9+ |
||
|
+0,65Xj q |
- 2,40Xj-j- 0,25 X j j |
, |
|
где У3 - прочность бетона нормального хранения, кг/см^,
Х3 - содержание примесей, %
Х^ - содержание воды, %
Хб - содержание песка, %
Х7 -содержание цемента, $
Х9 - температура смеси, °С
Xj q - температура хранения образцов 1-3 день, °С,
67