книги из ГПНТБ / Алабин М.А. Корреляционно-регрессионный анализ статистических данных в двигателестроении
.pdfчисле наблюдений со средней z и среднеквадратической ошиб кой:
zг--------------
уп — т— 2.
где т — число учитываемых в модели параметров .(независимых переменных).
Если отношение — превышает соответствуйте пределы /при
Sz
заданной вероятности P (t), то гипотеза о равенстве т) нулю в ге неральной совокупности отвергается и т) признается значимым. Выражение (55) позволяет рассчитать ошибку г| и с задан ной вероятностью, т. е. оценить пределы значении этих величин
в генеральной совокупности. |
Нижнее |
и верхнее |
значения |
этих |
||
пределов определяются по формулам |
|
|
|
|||
|
22 - tsz _ |
Л |
2z + tsz |
|
(56) |
|
|
22 — t s. -f 1 |
|
2z |
4- tS7 +■ 1 |
|
|
е |
|
|
|
|||
|
5 о2ет = |
( 1 - |
Т12) ^ |
1- |
|
(57) |
Для получения |
пределов |
5 ^ |
необходимо |
в формулу |
(57) |
соответственно подставлять значения нижнего и верхнего преде лов т), полученных по формуле (56).
Средняя ошибка определения результирующего параметра по
уравнению регрессии равна |
|
|
° = ° х . У 1 |
|
(58) |
При этом истинное значение результирующего параметра |
будет |
|
= |
+ о. |
(59) |
На практике часто возникает необходимость в получении до верительных интервалов для значений Ь0 и bi2 уравнения рег рессии, а также в оценке отклонения истинной прямой регрессии от эмпирической при некотором заданном значении независимой переменной Х2—Х20.
Истинное значение Ь0 лежит в пределах доверительных гра
ниц |
ист b0-|-1pSba, |
(60) |
bQ tpSi,a |
где tp — нормированное отклонение, определяемое по таблице интеграла вероятностей для выбранной степени доверия и числа степеней свободы п— 2 ;
Sbo — исправленное среднеквадратическое отклонение
40
Истинное значение bl2 лежит в доверительных границах
^12 tр^Ь1г ^12кст <С ^]2 ~Г tpSt)i2, |
( 6 1 ) |
где tp — нормированное отклонение, определяемое |
по таблице |
интеграла вероятностей для выбранной степени доверия и чис ла степеней свободы п— 2 ;
/ ( " - 2) 2 *?
В выражении для |
знаменатель |
следует заменить на |
S (a'i— х ) 2, если начало отсчета по оси X не совпадет со средней арифметической, так что Z^O .
Для выбранного значения Х2= Х 20 математическое ожидание М (Xi/X2q) оценивается с помощью доверительного интервала
ba-f- ЬпХ 2+ |
tP>« - 2 |
F п ( Z 20 — Z 2)2 | ^ |
|
уГК=2 |
V |
||
|
|||
или |
|
(62) |
X + {Р'"~2 |
I f | |
" 2 ( Z 2q ^ - х 2у- |
|
/ / Г ^ 2 |
V |
л 2 |
* 2- ( 2 * 2)2 ' |
При Х2й—Z 2= 0 (или при Z 20= Z 2) |
мы получаем ту же оцен |
||
ку, что и для b0. С увеличением Х20 |
ила (Х20—Z 2> 0 ), т. е. по |
||
мере удаления от среднего значения Z 2, принятого за начало от |
счета, точность оценки будет заметно снижаться. Наименее на дежная оценка по прямой, проведенной по методу наименьших квадратов, будет получаться для ординат, отвечающих точкам, наиболее удаленным от среднего значения Х2. Поэтому найден ную прямую возможно использовать для экстраполирования за пределами того промежутка, внутри которого помещаются дан ные наблюдения, лишь соблюдая большую осторожность.
I
Глава II
РАСЧЕТ ХАРАКТЕРИСТИК И НЕКОТОРЫЕ ПРИМЕРЫ ДВУМЕРНЫХ КОРРЕЛЯЦИОННЫХ СВЯЗЕЙ
2.1. Способы получения двумерных корреляционных связей
Для авиационного двигателя трудно в явной форме найти такой результирующий параметр, изменение которого было бы следствием воздействия одного определяющего параметра. Как правило, на изменение результирующего параметра влияет ряд определяющих параметров. Так, например, располагаемый запас устойчивой работы компрессора двигателя зависит от величины зазоров, фактических установочных углов лопаток и др.
Однако в ряде случаев один параметр является доминирую щим по своему воздействию на результирующий параметр. В та ких случаях можно вести корреляционногрегрессионный анализ взаимосвязи результирующего параметра от одного определяю щего параметра. Так, определение уточняющих коэффициентов к формулам приведения по статистическим данным целесообразно вести по совокупному влиянию на результирующий параметр (например, тягу) и температуры и влажности наружного воз духа. Получить С большой достоверностью степень воздействия влажности на результирующий параметр по статистическим дан ным не представляется возможным. Поскольку влажность нахо дится в известной связи с температурой наружного воздуха, то, благодаря такому способу, может быть определено значение уточняющего коэффициента к формулам приведения и по темпе ратуре п по влажности воздуха.
Кроме того, можно дополнительной обработкой статистиче ского материала получить в конечном итоге такую информацию, анализ которой представляется возможным и целесообразным вести простейшим путем — применением двумерных корреляци онно-регрессионных моделей. Покажем порядок получения ин формации для такого вида анализа на примере статистического1 материала по результатам испытаний серийных двигателей при выпуске с заводов.
42
Даже в условиях установившегося серийного производства добиться абсолютной тождественности одноименных деталей всех систем, от двигателя к двигателю практически невозможно. Воз никают различия деталей разных двигателей по размерам, кон фигурации поверхности и др. При сборке неизбежны дополни тельные различия по осевым и радиальным зазорам, площадям проходных сечений и другим характерным факторам. Все это приводит к тому, что для серийно выпускаемых двигателей до пускается определенный разброс основных данных, различных газодинамических параметров и геометрических размеров.
Существование различий элементов двигателя приводит к необходимости иметь определенные регулировочные элементы для того, чтобы с их помощью обеспечить контролируемые па раметры в пределах допусков (норм). Например, в качестве та ких регулировочных элементов для основных данных, парамет ров по газо-воздушному тракту являются: величина площади' сопловых аппаратов турбины и реактивного сопла, установочных углов лопаток направляющих аппаратов компрессора и др.
В процессе отладки двигателей соответствующим подбором значений регулировочных элементов обеспечиваются необходи мые основные данные и определенные значения параметров по тракту. По полученной при таких условиях информации не вы является статистическая взаимосвязь между параметрами, что видно, например, по зависимости тяги от температуры газов пе ред турбиной, построенной по данным приемочных испытаний двигателей (рис. 1,а ).
Метод малых отклонений [15] позволяет по результатам ис пытаний получить такие условные значения параметров, которые будут соответствовать одним и тем же значениям регулировоч ных элементов. Выбирая в качестве таких значений регулировоч ных элементов номинальные значения их по техническим усло виям (чертежу), условное значение какого-либо параметра мо жет быть найдено по следующей формуле:
|
л |
. |
л |
_L л А • |
|
•‘ ‘уел |
|
^UCX |
I |
СА„ |
СА |
|
|
Fcст ~ Fcнсх |
Д^4— K a ,fck- |
- F . . . |
|
|
|
СА. |
|
"t" К A, F, |
||
|
|
|
|
где Ka ,f ca , Ka ,fc— коэффициенты влияния, показывающие сте пень изменения какого-либо параметра при изменении площади соплового аппарата турбины или площади реактивного сопла на 1%; Fcact ; Fc„ — номинальное значение регулировочного эле
мента; F са„сх, |
^снсхзначение регулировочного элемента у |
данного двигателя.
После приведения к одинаковым значениям регулировочных
•элементов информации, указанной на рис. 1, статистическая взаи-
43
мосвязь рассматриваемых параметров становится явно выраже на (см. рис. 1 , 6 ).
R, кгс |
|
|
|
|
а\ |
|
|
|
|
|
|
|
||
|
|
|
|
|
X х |
х |
X |
Х |
X |
Xх * * хх |
|
|||
3920 |
|
|
|
|
X х Xх |
* X |
■ |
|||||||
|
X X |
X х |
Хх X X Ххх |
|
|
|
х |
X |
|
|||||
|
|
|
хр |
|
||||||||||
|
|
X X |
X |
X X |
X |
|
|
|
|
|||||
3900 |
|
|
|
|
X х |
Xх X |
|
|
||||||
X |
X |
|
X х |
X |
X |
XX X X X |
X |
X X • |
|
|||||
|
|
|
||||||||||||
3880 |
X X |
< * X X |
X х X |
|
X |
|
|
|||||||
X |
X |
|
|
X |
|
|
X |
|
|
|
X |
X |
|
|
|
|
|
X |
|
|
|
|
|
||||||
3860 |
X |
х |
|
X |
|
|
X |
|
|
|
|
|
||
X |
|
|
|
|
|
X |
|
|
|
X |
г х |
|
||
3840 |
|
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
X |
X |
х X |
X |
* |
X |
X |
< |
|
||
|
|
|
|
|
||||||||||
3820 |
X |
|
|
|
X |
X |
X |
|
|
|
|
|
X X |
|
|
Х |
X |
|
|
|
|
|
|
|
|
||||
3800 |
|
|
|
|
|
|
|
|
|
|
|
|||
|
880 884- |
888 |
892 |
898 |
900 |
904 |
908 |
912 t3C |
||||||
876 |
890 892 894 896 898 900 902 904 906 908 910 t3,C
Рис. 1. Статистическая зависимость тяги от температуры газов перед турбиной:
я—по исходной информации; б—по исправленной информации
2.2. Форма представления статистического материала
При анализе двумерных корреляционных зависимостей стати стические данные могут быть представлены либо в виде соче тания парных взаимосвязанных значений результирующего и составляющего параметров, либо в форме корреляционной таб
44
лицы. Парные значения результирующего параметра (расхода топлива через основную камеру сгорания) и составляющего па раметра (тяга), по которым в дальнейшем ведется в основном анализ двумерных связей, показан в табл. 4. По этим же дан ным составлена и корреляционная таблица в следующем по рядке.
|
|
|
|
|
|
|
|
|
|
Таблица 4 |
|
i |
G-ч |
Ri |
i |
On |
Ri |
i |
On |
Ri |
i |
Gw |
Ri |
1 |
3828 |
3982 |
23 |
3920 |
4022 |
45 |
3892 |
4063 |
67 |
3930 |
4098 |
2 |
3840 |
3979 |
24 |
3936 |
4015 |
46 |
3896 |
4062 |
68 |
3962 |
4072 |
3 |
3855 |
3991 |
25 |
3942 |
4022 |
47 |
3908 |
4053 |
69 |
3979 |
4082 |
4 |
3870 |
3984 |
26 |
3843 |
4031 |
48 |
3918 |
4053 |
70 |
3914 |
4108 |
5 |
3903 |
3992 |
27 |
3854 |
4031 |
49 |
3921 |
4060 |
71 |
3939 |
4104 |
6 |
3807 |
3980 |
28 |
3869 |
4032 |
50 |
3919 |
4061 |
72 |
3941 |
4106 |
7 |
3815 |
3988 |
29 |
3872 |
4041 |
51 |
3923 |
4062 |
73 |
3939 |
4108 |
8 |
3826 |
4018 |
30 |
3874 |
4041 |
52 |
3929 |
4073 |
74 |
3930 |
4108 |
9 |
3837 |
4008 |
31 |
3881 |
4040 |
53 |
3949 |
4054 |
75 |
3936 |
4111 |
10 |
3850 |
4017 |
32 |
3888 |
4032 |
54 |
3946 |
4070 |
76 |
3969 |
4102 |
11 |
3860 |
4017 |
33 |
3909 |
4047 |
55 |
3954 |
4061 |
77 |
3954 |
4103 |
12 |
3863 |
4021 |
34 |
3912 |
4030 |
56 |
3969 |
4052 |
78 |
3967 |
4112 |
13 |
3865 |
4025 |
35 |
3911 |
4033 |
57 |
3970 |
4071 |
79 |
3961 |
4108 |
14 |
3854 |
4019 |
36 |
3913 |
4034 |
58 |
3896 |
4076 |
80 |
3930 |
4127 |
15 |
3875 |
4019 |
37 |
3927 |
4037 |
59 |
3898 |
4080 |
81 |
3947 |
4129 |
16 |
3880 |
4008 |
38 |
3939 |
4042 |
60 |
3888 |
4092 |
82 |
3938 |
4130 |
17 |
3883 |
4011 |
39 |
3942 |
4030 |
61 |
3897 |
4098 |
83 |
3942 |
4131 |
18 |
3885 |
4021 |
40 |
3880 |
4050 |
62 |
3937 |
4078 |
84 |
3962 |
4137 |
19 |
3887 |
4023 |
41 |
3871 |
4053 |
63 |
3945 |
4083 |
85 |
3986 |
4127 |
20 |
3884 |
4025 |
42 |
3883 |
4058 |
64 |
3950 |
4038 |
86 |
3989 |
4130 |
21 |
3904 |
4021 |
43 |
3888 |
4053 |
65 |
3947 |
4096 |
87 |
3982 |
4131 |
22 |
3910 |
4011 |
44 |
3890 |
4065 |
66 |
3946 |
4098 |
88 |
3979 |
4135 |
1. Весь имеющийся диапазон изменения каждого параметра делится на произвольное число равных интервалов (в нашем случае диапазон результирующего параметра разделен на 8 ин тервалов, а составляющего параметра — на 7 интервалов).
2. Составляется таблица, в которой пб горизонтали наносятся значения интервалов составляющего параметра с возрастанием значений слева направо, а по вертикли — значения интервалов результирующего параметра с возрастанием снизу вверх.
45
3. Каждая пара значений параметров заносится в ту клетку таблицы, в интервалы которой попадает парное значение пара метров. Например, парное значение 3828; 3982 (первое значение— для расхода топлива, второе — для тяги) должно быть занесено
вклетку таблицы с интервалами 3825—3850 по расходу топлива
и3975— 4000 — по тяге.
4.Суммируя для каждой клетки корреляционной таблицы все случаи занесения парных значений параметров в интервалы, соответствующие данной клетке, т. е. находя частоты проявле ния парных значений признаков для данной клетки, получаем
корреляционную табл. 5.
|
|
|
|
|
|
|
Таблица 5 |
|
' 4000 |
3975 |
|
|
|
|
1 |
|
4 |
3970 |
3950 |
|
|
|
3 |
1 |
4 |
1 |
39о° |
3925 |
|
2 |
3 |
3 |
6 |
5 |
4 |
3925 |
3900 |
1 |
3 |
4 |
5 |
|
1 |
|
3900 |
3875 |
|
5 |
4 |
5 |
4 |
|
|
3870 |
3850 |
2 |
5 |
3 |
1 |
|
|
|
38о° |
3825 |
2 |
3 |
1 |
|
|
|
|
382;5 |
3800 |
2 |
|
|
|
|
|
|
|
|
3975 |
4000 |
4025 |
4050 |
4075 |
4100 |
4125 |
|
|
4000 |
4025 |
4050 |
4075 |
4100 |
4125 |
4150 |
Or
R
Второй вид представления корреляционной таблицы состоит в том, что указанные в таблице значения интервалов заменя ются дискретными величинами, соответствующими среднему зна чению параметра для каждого интервала'.
Корреляционная таблица строится, как правило, в тех слу чаях, когда количество парных значений параметров в выборке достаточно велико.
46
2.3. Порядок оценки формы корреляционной связи
Форма корреляционной связи (прямая или обратная, линей ная или криволинейная) между двумя признаками может быть определена одним из следующих способов:
—построением корреляционного поля;
—построением эмпирической линии регрессии;
—составлением корреляционной таблицы.
Рис. 2. Корреляционное поле и эмпирические линии рег рессии статистической зависимости расхода топлива от тяги:
---------------------- эмпирическая линия |
регрессии;---------- |
эмпири |
|
ческая линия регрессии;--------- |
■* -------- |
парабола |
Xt= —35820+ |
+ 18,838*2—0,00233*2*
Корреляционное поле представляет собой совокупность всех точек в прямоугольной системе координат, каждая из которых соответствует сопряженным значениям коррелируемых призна ков. Для получения такого поля необходимо располагаемые пар ные значения признаков нанести на график в принятом масшта бе. По характеру расположения точек на графике и судят о фор ме связи. Так, корреляционное поле на рис. 2 характеризует прямую связь коррелируемых признаков, близкую к прямоли нейной.
47
Для построения эмпирической линии регрессии диапазон из менения определяющего параметра разбивается на произвольное число равных интервалов. Для каждого интервала находится среднее значение результирующего параметра
где Ххj и tij — значения результирующего параметра и их чис ло, которые соответствуют /-му интервалу определяющего пара метра.
Врезультате такого расчета для интервалов тяги, указанных
втабл. 5, получаются следующие средние значения расхода топ
лива (табл. 6 ).
|
|
|
|
|
|
Таблица 6 |
|
Xj |
3975 |
4000 |
4025 |
4050 |
4075 • |
4100 |
4125 |
4000 |
4025 |
4050 |
4075 |
4100 |
4125 |
4150 |
|
° п |
3846 |
3881 |
3894 |
3923 |
3931 |
3945 |
3961 |
Среднее значение расходатоплива |
для |
диапазона |
тяги R = |
=3975-^4000 кгс равно |
|
|
|
q __3828 + 3840 + 3855 + 3870 + 3903 + |
3807 + |
3815 __ 3 846 |
кг/ч |
Полученные таким путем сопряженные средние значения кор релируемых признаков наносятся в необходимом масштабе на график в прямоугольной системе координат. Точки последова тельно соединяются отрезками прямой. Полученная ломаная ли ния является эмпирической линией регрессии коррелируемых признаков. По виду ломаной линии и качественному рассмотре нию возможной функциональной зависимости рассматриваемых признаков делается предположение о форме корреляционной связи.
Эмпирические линии регрессии, построенные по данным табл. 4, приведены на рис. 2.
2.4. Порядок определения коэффициента корреляции
Порядок определения коэффициента корреляции зависит от той формы, в которой представлен статистический материал.
|
|
|
|
Таблица 7 |
|
№ по |
|
А*2 |
|
* ? |
*2 |
пор. |
|
|
|||
1 |
2 |
3 |
4 |
5 |
6 |
48
При наличии количественных значений коррелируемых пара метров для вычисления значения коэффициента корреляции по формуле (9) составляется табл. 7.
Составление таблицы и определение величин,- входящих в формулу (9), производятся в следующем порядке.
1.В столбце 2 записываются значения результирующего па раметра, а в столбце 3 — парные значения составляющего па раметра.
2.По суммарному итогу столбца 2 находится среднее значе ние результирующего параметра
п
Аналогично находится среднее значение составляющего пара метра.
3. В столбце 4 записываются результаты умножения парных значений результирующего и составляющего параметров. Сум мируя полученные значения произведений и деля эту сумму на число пар наблюдений, получаем среднее значение величины
ЖА,:
У. Х хХ 2
ад
4.В столбце 5 записываются квадраты каждого значения ре зультирующего параметра, а в столбце 6 — квадраты каждого значения определяющего параметра. Суммируя значения квад ратов по каждому столбцу в отдельности и деля полученные итоги н_а число пар наблюдений, получаем средние значения ве
личин X\ и XI :
|
V х 2 |
2 * 1 |
|
|
Х 2= ^ - Х - Х 2 |
|
|
|
|
п |
|
5. |
По результатам определения A'i и |
находим |
Аналогично находим
=~ ( Х 2)2.
Полученные значения Х х, Х 2 Хх, Х2, о Х1, оХ2 позволяют опреде лить значение коэффициента корреляции.
При наличии количественных значений коррелируемых пара метров для определения коэффициента корреляции по формуле ( 10) составляется табл. 8.
49