Учебное пособие 800672
.pdfРис. 2.10. Размещение критической области при различных альтернативных гипотезах
Замечания.
1.Обычно на этапах 4—7 используют статистику, квантили которой табулированы: статистику с нормальным распределением N(0, 1), статистику Стьюдента, или Фишера. Однако интерпретацию решения и вычисление вероятностей ошибок, допускаемых при проверке гипотез, удобно проводить для статистики, являющейся непосредственно оценкой параметра , т. е. статистики .
2.В табл. 2.1 и 2.2 приводятся критерии значимости для проверки гипотез о дисперсиях и средних нормально распределенных генеральных совокупностей.
Таблица 2.1. Критерии значимости для проверки гипотез
о дисперсиях нормально распределенных генеральных совокупностей
Про- |
|
|
|
|
|
|
|
|
|
|
|
Область при- |
Альтернативная |
||||||||||||||||
веряе |
|
|
|
|
|
|
|
|
|
|
|
|
|
гипотеза |
|||||||||||||||
Предпо- |
Статисти- |
Распределе- |
|
нятия |
|
|
|||||||||||||||||||||||
ряе- |
ложение |
гипотезы |
|
|
и область |
||||||||||||||||||||||||
мая |
|
ка Z- |
|
ние |
|
|
принятия |
||||||||||||||||||||||
относи- |
|
|
|
|
для |
|
|
|
|
|
|||||||||||||||||||
ги- |
|
критерия |
|
:( |
/ ) |
|
|
|
|
|
гипотезы |
|
для |
||||||||||||||||
тельно m |
|
|
двустороннего |
|
|||||||||||||||||||||||||
поте- |
|
|
|
|
|
|
правостороннего |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
критерия |
|||||||||||||||||||
за |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
критерия |
|||||||
|
|
извест- |
|
|
|
|
|
|
|
( ) |
|
|
|
|
|
|
|
|
|
|
: |
|
|
|
> |
|
|||
|
|
m но |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
) < |
|
|
|
|
|
|
|
( ) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
) |
|
|
< |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
< |
|
( |
|
|
|
|
|
|
|
|
|
|
||||||
|
m неиз- |
|
( −1) |
|
|
( |
−1) |
|
|
|
|
|
|
|
: |
|
|
|
> |
|
|||||||||
= |
|
вестно, |
|
|
|
( |
−1) |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
|
|
|
|
−1) |
|
|
|
||||||||
|
|
= |
|
|
|
|
|
|
|
|
|
|
−1) |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
< |
|
( |
−1) |
< |
|
|
( |
|
−1) |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
< |
|
|
|
|
|
|
|
51
Продолжение табл. 2.1.
|
|
|
|
и |
|
|
|
; |
|
|
( , ) |
|
|
|
|
|
|
|
|
|
: |
|
|
> |
|
||||||||
|
|
|
известны |
|
|
> |
|
|
|
|
|
|
|
< |
|
|
|
( , |
) |
|
|
|
< |
|
|
( , ) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
и |
|
|
|
|
|
|
|
( |
−1, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
= |
|
|
|
|
; |
|
|
|
|
< |
|
|
|
|
|
|
: |
|
> |
|
|||||||||||||
|
|
|
ны, |
|
|
−1) |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
= , |
|
|
> |
|
|
|
|
( −1, |
|
|
|
|
|
|
( −1, |
|||||||||||||||
|
|
|
неизвест- |
|
|
|
|
|
|
|
|
|
|
|
|
− 1) |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
−1) |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
КритерийБартлеттадлясравнениядисперсийнесколькихсовокупностей |
|
||||||||||||||||||||||||||||||||
|
|
|
|
Предположение |
|
|
|
|
|
|
Статистика |
|
|
|
Распределение |
|
Областьпринятия |
||||||||||||||||
|
|
|
|
относительно |
|
|
|
|
|
|
|
|
|
|
|
|
Z |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
Z-критерия |
|
|
|
|
|
|
|
|
|
|
гипотезы |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( / |
) |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
= |
|
неизвестны, |
|
|
|
|
∑ |
( |
|
, |
|
− |
|
|
|
|
( −1) |
|
в > |
( −1) |
||||||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
i=1,2,…,l |
|
|
|
|
|
−1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
= |
|
|
|
|
|
|
|
|
|
=1 −1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
= |
|
|
|
|
|
|
|
|
|
= 1+ |
( |
) |
∑ |
|
− |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
1=1( |
−1), |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
∑( |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 2.2. Критерии значимости для проверки гипотез о средних нормально распределенных генеральных совокупностей
Прове- |
|
|
|
|
|
|
|
|
|
|
|
ряемая |
Предположение |
Статистика |
Распределение |
||||||||
гипотеза |
относительно m |
Z-критерия |
:( |
/ ) |
|||||||
|
|
известна |
|
|
|
|
|
|
|
(0,1) |
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
− |
|
|
||||
= |
|
неизвестна, |
|
|
/√ |
|
|
|
( |
−1) |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|||||||
|
|
|
|
|
− |
|
|
||||
|
|
|
|
|
/√ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
52
Продолжение табл. 2.2.
|
|
|
известны |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(0,1) |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
и |
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( |
+ |
|
− 2) |
||||||||||||||
|
ны, причём гипо- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
= |
|
|
и |
|
|
|
неизвест- |
|
|
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
: |
|
|
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
теза |
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
прини- |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
= ( |
( |
|
|
− 1) |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
+ |
|
−2+ |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
=мается, |
( |
|
−1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
= |
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
ны,и |
|
|
|
= |
|
|
|
|
+ |
− |
−2 |
, |
|
( |
),где |
|
||||||||||||||||
|
теза |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
неизвест- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
причём гипо- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
= |
|
|
|
: |
|
|
|
|
|
|
+ |
|
|
|
|
|
|
( |
+ |
|
|
|
) |
|
|
|||||
|
|
|
|
отклоня- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
= , |
|
|
|
|
|
|
|
|
|
|
|
|
( |
|
) |
|
+ |
( |
|
|
) |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
ется, |
|
|
|
|
|
|
|
|
|
|
|
|
+1 |
|
|
+1 |
|
||||||||||||||
|
|
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Продолжение табл. 2.2.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Альтернативная гипотеза |
||||||||||||||||
|
|
|
|
|
|
|
Область принятия |
|
|
|
|
|
|
|
|
и область |
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
принятия |
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
гипотезы |
|
|
|
для |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
гипотезы |
|
для правостороннего критерия |
|||||||||||||||||||||||||||||
|
|
|
двустороннего критерия |
|
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
| |
− |
|
|
|
| |
|
< |
|
|
|
|
|
|
|
|
|
|
: |
|
|
> |
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/√ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− |
< |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/√ |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
| − |
| |
< |
|
|
|
|
( −1) |
|
|
|
|
|
|
|
|
: |
|
> |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
/√ |
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
< ( −1) |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
| |
|
− |
|
|
| |
< |
|
|
|
|
/ |
√ |
|
: |
|
|
> |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
− |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
| |
|
− |
|
|
|
| |
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
|
< |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
< |
|
|
|
|
|
|
( + −2) |
|
|
|
|
|
|
|
|
: |
|
< |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
1 |
+ |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
53
Продолжение табл. 2.2.
|
|
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
< |
|
|
( |
+ −2) |
||||
|
| |
|
|
− |
|
|
| |
|
|
|
1 |
+ |
|
1 |
|
|
|
|||||||||
|
|
|
|
|
< ( ) |
|
|
|
|
|
|
|
− |
: |
|
|
> |
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
+ |
|
|
< |
|
|
( ) |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. В статистических пакетах обычно не используется значения задаваемого уровня значимости . Как правило в выходных данных содержатся выборочные значения zB статистики критерия Z и вероятность того, что случайная величина Z (при условии, что верна гипотеза ) превышает выборочное значение zB, т. е. значение
=> | в|
Эта вероятность называется р-значением (иногда она обозначается как p-level).
2.3.4. Проверка гипотез о виде распределения
|
, ,…, |
по критерию |
|
Пусть |
— выборка наблюдений |
случайной |
|
величины X. |
|
|
|
|
Проверяется гипотеза , утверждающая, что X |
||
имеет функцию распределения F(x). |
|
||
Проверка гипотезы Н0 при помощи критерия |
осуще- |
ствляется по следующей схеме. По выборке наблюдений находят оценки неизвестных параметров предполагаемого закона распределения случайной величины X. Далее, область возможных значений случайной величины X разбивается на r мно-
жеств |
|
|
например, r -интервалов в случае, когда X — |
||||
непрерывная, , |
случайная величина, или r групп, состоящих из |
||||||
отдельных значений, для дискретной случайной величины X. |
|||||||
Пусть пк — число элементов выборки, принадлежащих |
|||||||
множеству |
|
к,к=1, 2, ...,r |
Очевидно, что |
∑ |
= |
. Исполь- |
|
|
54 |
|
зуя предполагаемый закон распределения случайной величины X, находят вероятности рк того, что значение X принадлежит
Очевидно, что= [ |
|
], .= 1,2,…, . |
||
множеству к, т. е. |
|
|
Полученные результаты |
|
можно представить в |
виде табл. 2.3: |
|||
∑ |
|
= 1 |
|
Таблица 2.3. Исходная таблица для проверка гипотез о виде распределения
по критерию
|
|
Число наблюдений |
|
Всего |
|
|
|
|
… |
|
|
Наблюдаемое |
|
|
… |
|
n |
Ожидаемое |
|
|
… |
|
n |
Выборочное значение статистики критерия вычисляется по формуле
( − )
в =
Гипотеза Н0 согласуется с результатами наблюдений на уровне значимости , если
с |
|
|
( |
− −1) |
— |
в < |
|
( − |
−1) |
, |
|
|
|
|
квантиль порядка 1 - распределения |
||||||||
где |
( |
− |
−1) |
|
|
||||||
|
степенями свободы, а |
— число неизвестных |
|||||||||
|
|
|
|
|
параметров распределения, оцениваемых по выборке; если же
в |
( − |
− 1), то гипотеза Н0 отклоняется. |
|||||
|
Пример 1.1. Проверить гипотезу о нормальном распре- |
||||||
делении по выборке 55 наблюдений: |
|
|
|||||
|
18,3 |
15,4 |
17,2 |
19,2 |
23,3 |
18,1 |
21,9 |
|
15,3 |
16,8 |
13,2 |
20,4 |
16,5 |
19,7 |
20,5 |
|
14,3 |
20,1 |
16,8 |
14,7 |
20,8 |
19,5 |
15,3 |
|
|
|
|
|
55 |
|
|
19,3 |
17,8 |
16,2 |
15,7 |
22,8 |
21,9 |
12,5 |
10,1 |
21,1 |
18,3 |
14,7 |
14,5 |
18,1 |
18,4 |
13,9 |
19,1 |
18,5 |
20,2 |
23,8 |
16,7 |
20,4 |
19,5 |
17,2 |
19,6 |
17,8 |
21,3 |
17,5 |
19,4 |
17,8 |
13,5 |
17,8 |
11,8 |
18,6 |
19,1 |
|
Принять = 0,1.
Решение. Объем выборки п = 55. Для проверки гипотезы о нормальном распределении нужно найти оценки математического ожидания и дисперсии. Имеем
|
= |
|
= |
1 |
|
17,87 |
|||
|
|
|
|||||||
|
|
1 |
|
( |
|
|
) |
|
|
|
= = |
|
− 1 |
− |
|
8,62 |
Воспользуемся результатами группировки выборки, расширив первый и последний интервалы. Результаты группировки приведены во втором и третьем столбцах табл. 2.4.
Таблица 2.4 Промежуточные результаты для проверки гипотезы о нор-
мальном распределении по данным примера 1.1
Номеринтервала, k |
Границыинтервала, |
Наблюдаечастотамая , |
Вероятность попаданияв интервал, , |
Ожидаемая частота, |
− |
|
|
|
|
− |
1 |
- -12 |
2 |
0,0228 |
1,254 |
5,274 |
0,725 |
0,010 |
2 |
12-14 |
4 |
0,0731 |
4,020 |
|
|
|
3 |
14-16 |
8 |
0,1686 |
9,273 |
9,273 |
-1,273 |
0,175 |
4 |
16-18 |
12 |
0,2576 |
14,168 |
14,168 |
-2,168 |
0,332 |
5 |
18-20 |
16 |
0,2484 |
13,662 |
13,662 |
-2,338 |
0,400 |
6 |
20-22 |
10 |
0,1519 |
8,354 |
12,633 |
|
0,011 |
|
|
|
|
|
|
Продолжение табл. 2.4. |
||
7 |
22-+ |
3 |
0,0778 |
4,279 |
|
|
0,336 |
|
|
|
|
|
56 |
|
|
|
|
Сумма |
55 |
1,0001 |
55 |
55 |
- |
0,928 |
В четвертом столбце табл. 2.4 приведены вероятности рк, вычисляемые по формуле
где ак и bк —= [ |
|
] = Ф |
|
−Ф |
|
,k=1,2,…,7, |
|
|
|||||
|
|
|
|
соответственно нижняя и верхняя границы интервала к, а значения функции Ф(х) берутся таблицы (см. Приложение 1). В пятом столбце приводятся ожидаемые частоты прк, а в шестом — значение прк после объединения первых двух и последних двух интервалов.
Так как после объединения осталось r=5 интервалов, а по выборке определены оценки двух параметров – математического ожидания и дисперсии, т.е. l=2, то число степеней свободы равно 5-2-1=2. По таблице квантилей распределения хи-
квадрат находим |
Выборочное значение стати- |
стики критерия равно, (2) = 4,61. |
следовательно, гипотеза о |
в = 0,928,
нормальном распределении принимается.
2.4. Методы статистического анализа и аппроксимация результатов статистического моделирования (на примере регрессионного анализа)
Во многих случаях исследуются объекты, характеризующиеся несколькими признаками. Например, системы связи характеризуются следующими показателями:
—информационными (помехоустойчивость, скорость, пропускная способность и задержка передачи информации);
—технико-экономическими (стоимость, габаритные размеры, масса);
—технико-эксплуатационными показатели (среднее время безотказной работы, температурный диапазон работы и т.д.).
Совокупность данных такого типа представляет выборку из многомерной генеральной совокупности. Для таких данных интерес представляет не только определение характери-
57
стик распределения каждого признака, но и то, насколько тесно эти признаки связаны между собой, можно ли по значению одного признака сделать какие-либо выводы о предполагаемом значении другого признака и т. д.
Регрессионный анализ — это один из наиболее известных статистических методов, применяемых для решения задач такого рода. Основная цель регрессионного анализа состоит в определении связи между некоторой характеристикой Y на-
блюдаемого явления или объекта и величинами |
|
|
, |
|||
которые обусловливают, объясняют изменения Y. |
Переменная |
|||||
, ,…, |
|
|||||
F называется зависимой переменной (откликом), объясняющие |
||||||
переменные |
|
называются предикторами, регрессо- |
||||
рами или |
факторами. |
|
|
|
|
|
|
, ,…, |
|
|
|
|
|
Например, в качестве показателей эффективности сис- |
||||||
темы связи используются: |
|
|
|
|||
- коэффициент использования канала по мощности ( |
); |
|
||||
- коэффициент использования канала по полосе |
частот |
|||||
( ); |
|
|
|
|
|
|
- коэффициент использования канала по пропускной способности ( ).
Нас может интересовать, как зависят эти показатели от показателей функциональной и технической эффективности (например, диапазона частот помехового сигнала, МГц ( ), полосы пропускания приемного устройства ( ), погрешность измерения уровня сигнала ( ) и т.д.); конструктивных показателей, показателей состава и структуры, показателей надёжности и т.д.
Для ответа на этот вопрос необходимо собрать данные по системам связи со сходными параметрами.
В данном случае нужно выяснить, как эти факторы связаны с одним из коэффициентов использования канала, какой фактор является наиболее важным при прогнозе эффективности передачи сообщения, имеется ли в исходных данных системы связи, обладающие какими-либо специфическими свойствами (выбросы).
58
Если в рассматриваемом примере в качестве объясняющих факторов использовать только три определенных выше фактора , , , то регрессионная модель может быть записана в виде
|
|
|
|
|
, |
где f ( , , ) — |
детерминированная составляющая отклика |
||||
= |
( |
, , |
) + |
|
|
Y, зависящая от , |
, , — случайная составляющая. |
Случайная составляющая обусловлена влиянием на эффективности передачи сообщения множества неучтенных факторов, а также ошибок наблюдений или измерений зависимой переменной.
Существуют различные регрессионные модели, опреде-
ляемые выбором функции |
регрессия |
|
: |
|
|
|
|||||||||
1) |
|
|
|
|
|
|
) |
|
|
|
|||||
простая линейная( |
, |
,…, |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
+ |
; |
|
|
|
2) |
множественная |
регрессия |
|
|
|
|
|
||||||||
|
= |
|
+ |
|
|
+ |
|
; |
|||||||
3) |
= |
|
+ |
|
+ |
|
+ + |
|
|
|
|||||
|
полиномиальная регрессия |
|
|
+ ; |
|||||||||||
|
= + |
+ |
+ + |
|
|||||||||||
4) |
регрессионная модель общего вида: |
, ,…, )+ ; |
|||||||||||||
= + ( , ,…, |
|
|
)+ + |
( |
|||||||||||
торов.( |
, ,…, |
), i= 1, 2, ..., k-1, — заданные функции фак- |
|||||||||||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты , ,…, |
|
называются параметра- |
ми регрессии.
В приведенных регрессионных моделях ры , ,…, , входят линейно. Такие модели называют ли-
нейными (по параметрам) моделями, а математические ме-
тоды анализа этих моделей — линейным регрессионным анализом.
59
Модель |
|
|
|
|
нелинейна по парамет- |
рам. В некоторых=случаях |
нелинейные модели с помощью |
||||
+ |
|
|
специальных линеаризирующих преобразований могут быть преобразованы в линейные. Рассмотрим несколько примеров.
|
|
|
1. |
Функция |
|
|
|
|
|
|
при x>0 c помощью логарифми- |
|||||||||||||||||||||||||
рования |
и |
|
замены |
|
переменных |
|
преобразуется |
так: |
|
|||||||||||||||||||||||||||
ln |
|
|
|
ln |
|
. |
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ln = |
|
|
|
|
|
Произведя |
|
замену |
|
|
|
переменных |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
, |
получим линейную по параметрам |
|||||||||||||||||||||||||||
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
|||
функцию |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
ln ; |
|
= ln |
|
; |
= ln |
|
|
|
преобразуется так: |
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
Функция |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
2. |
|
|
= |
|
+ |
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
= |
|
|
|
|
|
или |
|
|
= |
|
|
|
+ |
|
. |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
После замены переменных |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
полу- |
|||||||||||||||||
|
|
|
|
|
= |
|
, |
= |
|
, |
= |
|
||||||||||||||||||||||||
чим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
3. Логистическая функция |
= |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
= |
|
+ |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
при помощи |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
преобразования |
|
|
|
|
|
|
|
|
|
|
принимает вид: |
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
|
+ |
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
После выбора вида регрессионной модели, используя результаты наблюдений зависимой переменной и факторов, нужно вычислить оценки (приближенные значения) параметров регрессии, а затем проверить значимость и адекватность модели результатам наблюдений.
2.4.1. Простая линейная регрессия
Так называется простейшая регрессионная модель описывающая зависимость переменной Y от одного фактора х.
Пусть ( , ) i= 1, 2, 3, ..., п — выборка наблюдений из двумерной генеральной совокупности. Предварительное представление о зависимости между случайными величинами Х и Y можно получить, отображая элементы выборки как точки на
60