книги из ГПНТБ / Маршак, М. И. Теория технологической статистики
.pdfВо второй, |
|
т . в . |
при К= 2 |
|
получено |
|
наблюдений: |
||
|
,7 |
Xot |
, |
Xu 1 |
Ха , • • • |
|
ff |
||
|
У ' ' |
> Xpt , |
|||||||
|
|
|
|
|
|
|
H |
||
|
|
|
Пса 1 |
Xiz г |
Хг2, |
* |
|||
|
f > |
|
X p z; |
||||||
|
|
|
|
|
|
|
|
|
|
|
ft |
|
|
|
|
|
|
ft |
|
|
У ^ ’ ХоПх, |
Л/л,, |
Хглх, ■ |
, |
Xpn* |
||||
н т .д . |
|
|
|
|
|
|
|
|
|
в к-ый |
отревок |
|
получено |
П к |
наблюдений: |
||||
|
|
|
1«) |
'*> |
|
<*) |
|
t*0 , |
|
|
J ' |
' |
Kq1 , |
ли t |
|
Л2/> |
, xpl 1 |
||
|
|
|
|
|
|
|
(«) |
||
|
|
|
/<> |
<*) |
|
{<) |
i |
||
|
|
|
Xc2j |
К/2 i |
|
Х.22 t |
Xpz j |
||
|
(К) |
t«) |
t*) |
|
м |
|
(*■) |
||
|
|
|
|
|
|||||
|
|
|
Х олю |
|
Xj/tn 7 |
|
,Xpn< |
||
Вводил |
матричные |
|
обозначения: |
|
|
78
X u |
X i i |
■ |
X p , |
|
/ X » |
* |
x l , ■ |
at |
\ |
Xu |
■Xpt |
||||||
X u |
X u |
■ |
Xp i |
|
к |
H |
■Xu ■ |
. Х р г |
|
Xo2 |
X u |
||||||
|
|
|
|
X |
a= |
|
|
|
|
|
|
t |
; |
it |
|
|
|
|
|
|
|
|
|
■ ХрПц |
||
Х щ , |
X m , • |
X p n , |
/ |
1 X o n j |
Xi/1% |
Х м л |
/ <■> |
X ? |
/<) |
. . |
<*) |
f X c i |
x J . |
. X p i |
||
If) |
x ! f ' X j i ■ . |
|
if) |
|
Ло2 |
. . X p i |
X r
If) |
If) |
■ |
у If) |
X i i - |
Xzr>K ■ |
. . X p n , |
Линейные регрессии для каждого промежутка времени мо гут быть записанные в виде
у |
“ &юХо + fan Xi *■ fail Ха |
■-i~Sip Хр I |
tj |
!>гоXD+ lu -t-lzz Хз * ■ |
■+$ipAp', |
( 3 . 5 )
у (*= L a Xo^ S*I x f i- Ькг х'г* ■ .+ Skp X ?
79
Обозначим
гда |
Хт - |
транспортированная матрица. |
|
|
Коэффициенты регрессии соотношений ( 3 .5 ) определя |
||
ются |
из |
К систем нормальных уравнений |
|
|
|
, * , |
( 3 .6 ) |
из которых
( 3 .7 )
Нас интересует следующий вопрос: можно ли считать полученные уравнения регрессии за К отрезков времени не изменившимися, а различия в уравнениях считать несу щественными, или эти различия следует принять сущест венными.
В первом случае можно составить общее уравнение регрессии по всем полученным данным. Во втором случае этого сделать нельзя.
80
Ответ на поставленный вопрос иохно получить при по мощи статиотичеокой проверни гипотез. Рассмотрим гипоте зу однородности ( в дальнейшей будем называть её нуле вой гипотезой), которая заключается в утверждении, что различия в коэффициентах регрессии на К интервалах не существенные, т . е .
1 SD-o О It
~ & к о ' f ) o i
: » х |
- ■ ■ ■ ' h i |
* l \ ' > |
|
|
|
|
( 3 .8 ) |
|
|
ф |
, • |
Up ~ И г р ' ■ |
- h u p - 1>р ■ |
||
Другими словами, |
оледует |
считать, что коэффициенты рег |
рессии одни и те же для различных интервалов времени, а имеющиеся различия случайны.
Составим уравнения регрессии для всего исследованного
промежутка времени. |
|
|
||
Оно имеет |
вид: |
|
|
|
Л |
|
|
|
|
Г |
L Ха |
■*■$>* |
Dp Хр |
( 3 .9 ) |
|
||||
|
|
|
|
Оценки коэффициентов регрессии уравнения ( 3 .9 ) полу чаем при помощи метода наименьших квадратов из соотношения
$1 =Х Уj |
(З.Ю) |
■81
где
х ч х ; , |
х......: х « ); |
( З . И ) |
|
|
|
V ibo) |
Str • • ' > hр ) I |
( 3 .1 2 ) |
s x > z x ;x r t S f |
( 3 .1 3 ) |
|
х > £ х ; у , . ' |
(З.М) |
|
Откуда |
I=S"XTy |
|
|
( 3 .1 5 ) |
Проверка нулевой гипотезы однородности проводи-тоя при помощи методов теории информации.
Вводитоя информационная мера расхождения между нулевой гипотезой HQ и альтернативной гипотезой Hj. В нашем слу-
.чве информационная мера равна
5Д -JSl)^s t ( З . И )
n - р к
82
Принимая во |
внимание |
(3 .6 ) и (ЗЛ О ), соотношение |
(3 .1 6 ) можно |
записать |
в виде |
|
|
|
|
|
|
|
(3 .1 7 ) |
|
|
|
|
имеет |
F |
-распределение |
|
с р ( к ~ /,) |
|
и п - р к |
степенями |
свободы, |
когда справед |
||
лива нулевая |
гипотеза |
HQ. |
|
|
|
|
|
На основании (3 .1 6 ) |
определяют |
расчетное |
значение |
||||
V (HQ, Hj) и сравни-вают его с табличным ( при помощи |
|||||||
таблицы |
Г |
-распределения). Если |
полученные значения |
||||
превосходят |
табличные, |
то |
нулевая |
гипотеза |
о равенстве |
||
коэффициентов |
регрессии по |
полученным группам отвергается. |
Впротивном случае нулевая гипотеза принимается.
Внаших исследованиях строились регрессионные зависи мости прочности бетона марки М-300 от факторсв производ ственного процесса. Было проведено 300 наблюдений на про тяжении двух периодов: первый период - июнь, июль, август, сеитябрь; второй период - октябрь, ноябрь, декабрь.
Введем обозначения:
Xj -модуль крупности песка;
Xj |
-процентное |
содержание примесей в бетонной смеси |
Х^ |
-процентное |
содержание воды в бетонной смеси; |
Х^ |
-процентное |
содержание крупногозаполнителя; |
Х6 |
-процентное |
содержание песка; |
Хг, |
-процентное |
содержание цемента; |
Х-^- цементно-водное отношение;
У-прочность бетона нормального хранения.
Проверим устойчивость коэффициентов регрессии следующих ре грессионных уравнений:
= |
Хз>, |
Х б, |
Хы ) > |
|
’ |
Xfj |
Хб > |
X } ) • |
|
Все уравнения линейного вида (табл. |
3 . 5 ) . Линейные |
|||
уравнения рассматриваются в оилу того, |
что колебания |
параметров происходят в сравнительно небольших диапазо нах, где криволинейную зависимость можно удовлетвори тельно аппроксимировать линейной зависимостью.
Для проверки устойчивости коэффициентов регрессии этих уравнений по двум периодам определялись соотно
шение (3 .1 6 ) |
или ( 3 ,1 7 ) , |
вычисления |
приведены в табли |
|
це 3 . 5 ' и |
,3.6 . Из таблицы .3.6 |
следует, что полу- |
||
ченные значения |
|
|
значительно |
|
превосходят |
табличное |
F o , 9s |
• |
Следовательно, нуле:- |
вая гипотеза о равенстве коэффициентов регрессии по |
||||
полученным группам отвергается, |
то |
есть для каждого |
из рассмотренных периодов выявлены различные корреля-. ционные зависимости прочности бетона нормального хране ния от факторов производственного процесса.
Кроме регрессионного анализа, информационные критерии могут применяться при проверке статистических гипотез о принадлежности данных выборки полиномиальному, нормаль ному распределению, распределению Пауссона и т .д . и во многих других статистических исследованиях. Рассмотрен ные методы во многих отношениях подобны дисперсионному анализу.
84
Таблица 3.5
Система множественных регрессионны:-: уравнении прочности бетона
нормального хранения от ракторов производственного процесса по группам и по выборке в целом
|
rloaeoa |
|
|
|
циды |
регрессионных уравнений |
|
|
|
|
|
||||||
|
групп |
|
Параметры регрессионного |
уравнения: Параметры регрессионного уравнения |
|||||||||||||
|
|
|
|||||||||||||||
|
|
|
• |
япН |
|
• |
• |
• |
• ' |
• |
|
|
|
Г ' |
|||
|
|
а а |
: |
а |
а |
: 6 |
: |
а |
а |
а |
а |
а |
: |
а |
: 7 |
||
|
|
0 |
: 1 |
3 |
|
1 ^ : |
0 |
: |
4 |
: |
5 |
б |
|||||
со |
I |
208,44 |
7,65 |
|
-1 3 ,2 5 |
|
- 1 ,4 9 |
|
102 ,34 |
38,,41 |
|
- 1 7,53 |
|
9,87 |
|
- 0 ,3 0 |
4,79 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ЦП |
п |
-160,83 |
7,22 |
|
3,98 |
|
12,22 |
|
92.,68 |
718.,58 |
|
-31,50 |
|
- 5 ,1 8 |
|
5,58 |
3,76 |
|
|
|
|
|
|
|
|||||||||||
|
По вы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
борке |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в це |
479,41 |
- 2 ,5 7 |
|
7,62 |
|
3,38 |
|
45,59 |
713,85 |
|
-31 ,0 8 |
|
- 4 ,5 0 |
|
3,71 |
2,55 |
|
лом |
|
|
|
|
|
|
Таблица 3.6
Анализ нулевой гипотезы о равенстве коэффициентов регрессии для множественных регрессионных уравнений
|
|
Вид регрессионного |
, |
F |
: Табличное |
значение |
Fo,gs с |
р (к '')г^ |
|||||||
|
|
. и |
п |
- |
р К |
=300-5. |
2 * 290 |
||||||||
|
|
уравнения |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
* |
|
: |
степенями |
свободы |
|
|
|
|
У = |
/ |
(X |
Д |
, |
X |
, X |
) |
9 ,8 |
|
4,38 |
|
|
|
|
|
|
1 |
1 |
3 |
|
6 |
14 |
|
|
|
|
|
|||
“ |
У = |
i |
(X |
, |
X |
, |
X |
V |
16,5 |
|
4,38 |
|
|
|
|
|
|
' |
4 |
|
|
5 |
6 |
|
|
|
|
|
|
|
Р= 5
К^ 2
§ 5,Фиктивныа" переменные в множественной регрессии при наличии неоднородного
массива данных
Неоднородность массива полученных данных воаможна не только как результат изменения полученной зависимости в течение наблюдаемого промежутка времени, но и как резуль тат пространственных различий, имеющих место в течение одного и того же промежутка времени.
Так были получены различные регрессионные зависимо сти качества бетона от изучаемых факторов при наблюдени ях на различных бетономешалках одного и того же завода. Изучаемые факторы - состав бетона (цемент, крупный запол нитель, песок)-не имели существенных отличий. То есть, изменение качества полученного бетона можно отнести за счет различной конструкции бетономешалок, что определен ным образом сказывается и на качестве получаемого бетона.
Вообще говоря, можно строить различные регрессионные модели для каждой бетономешалки. Однако построение раз личных моделей для каждой бетономешалки нецелесообразно ввиду следующих причин.Во-первых, дублирование раочетов приводит к непроизводительному расходованию ячеек памяти и времени вычислительной техники, необходимой для опера тивного управления.
Во-вторых, построение одной регрессионной модели для
всех бетономешалок увеличит массив данных, что при нали чии адекватной регрессионной модели увеличит точнооть по лученных параметров.
Построение одной адекватной регрессионной модели для всех бетономешалок возможно, если использовать концепцию так называемых "фиктивных" переменных'1. Смысл её заключа ется в следующем: поскольку невозможно построить непре рывную шкалу для фактора "номер бетономешалки",то мы мо жем приписать этому фактору некоторые уровни по порядку,
учитывая, что |
в построенной регрессионной модели будут |
I . Дрейпер И..Смит Г . Прикладной регрессионный анализ.U., |
|
"Статистика", |
1973. |
67