Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1674

.pdf
Скачиваний:
0
Добавлен:
07.01.2021
Размер:
1.54 Mб
Скачать

которая занесена в третью строку столбца Z i+1 и т.д. Функции Лапласа определяются по прил. 2.

Например, при Z4 = 0,29 имеем Ф(0,29)= 0,1141, при Z5=0,34 полу-

чим Ф(0,34)=0,1331 [см. табл.18, строка три, столбцы Ф(Zi) и Ф(Zi+1)].

По формуле (135) находим соответствующие вероятности, например p4 = Ф(Z5) – Ф(Z4)=0,1331 ( 0,1141)=0,2472 (см. табл.18, третья строка,

столбец pi ).

По формуле (130) для четвертого интервала находим n14 n4 p4 , ко-

торую заносим в табл. 18 (строка третья, столбец n1i ).

Для четвертого интервала определяем величину n4

n14 2

n14

(23 24,72)2 0,12 , которую заносим в табл. 18 (строка три, столбец

24,72

ni n1i 2 n1i ).

По формуле (132) находим

набл2

S

(n n1)

2

 

 

i

 

i

 

0,019 0,032 0,12 0,209 0,309 0,749,

 

1

 

 

 

i 1

 

ni

 

 

 

где S – число немалочисленных подынтервалов, S = 5.

Определяем степень свободы выборки по формуле (133): K = S – r – 1 = 5 – 2 – 1 = 2.

По таблице критических точек распределения 2 (см. прил. 4) находим

кр2 2(0,05;2) 6,0.

Поскольку набл2 кр2 , т.е. 0,749 6,0, то нет оснований отвергать гипотезу о нормальном законе распределения генеральной совокупности. Расхождение между эмпирическими и теоретическими частотами в этом случае незначимо (т.е. случайно).

2.8.Обработка экспериментальных данных

2.8.1.Подбор аналитической зависимости по методу наименьших

квадратов

Допустим, две величины Х и Y связаны некоторой неизвестной зависимостью Y=f(x). В результате n наблюдений получены практические значения f(x) в точках х1, х2, х3, х4, …, хп, т.е. получены следующие практические сведения об изучаемой зависимости: y1=f(x1); y2=f(x2); y3=f(x3),…,

yn=f(xn).

Поскольку характер функциональной зависимости между Х и Y в самом

99

общем случае неизвестен, то, используя вышеуказанные наблюдения, необходимо подобрать аналитическую формулу, отражающую с достаточной степенью точности эту зависимость. Установить истинный характер искомой зависимости невозможно, поэтому задача состоит в том, чтобы путем использования математической обработки результатов наблюдений найти так называемые эмпирические формулы, удовлетворительно согласующиеся с опытными данными. Эти формулы являются лишь гипотезами, предположениями, однако значение их трудно переоценить. Полученную по результатам наблюдений формулу можно использовать для дальнейших исследований методами математического анализа, вычислить промежуточные значения функции y=f(x) и т.п.

Определение аналитической зависимости между Х и Y, т.е. построение эмпирической формулы, слагается из двух этапов: 1) подбор общего вида искомой зависимости величины; 2) определение параметров этой зависимости.

В математической теории планирования эксперимента искомая зависимость называется математической моделью и представляет собой полином

– отрезок ряда Тейлора, который выводится на основе обработки экспериментальных данных в виде функции

y 0 ixi ijxjxi jjx2j

ijk xixjxk , (143)

i

ij

j

ijk

где – коэффициент уравнения регрессии, полученный на основе обработки данных генеральной совокупности.

В инженерной практике имеют дело только с выборками и тогда математическая модель объекта получает следующий вид:

y в0 вixi вijxixj вjjx2j

вijk xixjxk ..., (144)

i

i j

j

i j k

где в – выборочный коэффициент, т.е. коэффициент, полученный на основе обработки данных наблюдений; в0 – свободный член уравнения регрессии; вi – линейный эффект от действия i-го фактора; вij – бинарный эффект от взаимодействия i-го и j-го факторов; вijk – эффект тройного взаимодействия i-го, j-го и k-го факторов; вjj – квадратичный эффект от действия j-го фактора.

В самом общем случае вид уравнения регрессии (144) неизвестен, поэтому он определяется путем подбора этой зависимости либо, если изучается связь от одного фактора, целесообразно построить эмпирическую линию регрессии.

Эмпирическая линия регрессии строится на поле корреляции, представляющем собой чертеж с нанесенными экспериментальными точками в заданном масштабе. Построение эмпирической линии регрессии сводится

100

к следующему.

Весь диапазон независимой переменной Х разбивается на m одинаковых подынтервалов x (рис. 34).

Координата xi, являющаяся серединой подынтервала xi, и представляет собой абсциссу всех точек, попавших в i-й интервал.

Затем подсчитывается число экспериментальных точек, попавших в заданный диапазон x, и на их основе определяется координата yi по формуле

 

ni

 

 

 

yij

 

 

yi

j 1

,

(145)

 

ni

 

 

где уij ордината j-й точки, попавшей на i-й интервал; ni – число экспери-

ментальных точек, попавших в i-й интервал.

 

y

 

 

 

yi

 

 

 

 

 

xi

x

 

 

x

 

Рис. 34. Построение эмпирической линии регрессии

 

Основным условием здесь является

m

 

ni N ,

(146)

i 1

 

где N – общее количество опытов в рассматриваемом эксперименте, или объем выборки; m – число подынтервалов, на которые разбивается диапазон изменения независимой переменной.

Число подынтервалов разбиения определяется по формуле m N , но практически эта величина не бывает меньше 5 и больше 12, т.е. ее принимают 5 m 12.

Вышеизложенным способом получают m точек (по количеству подынтервалов разбиения), затем их последовательно соединяют ломаной лини-

101

ей, которая называется эмпирической линией регрессии.

По виду эмпирической линии регрессии можно судить о характере связи между X и Y, что, в конечном счете, определяет вид искомого уравнения регрессии y=f(x). В рассматриваемом примере математическую зависимость между X и Y можно аппроксимировать прямой линией, как показано на рис. 34.

Критерии существования линейной зависимости между Х и Y можно

получить еще и следующим образом.

 

Положим: xi

xi 1 xi ;

 

yi yi 1 yi .

 

Тогда

k

i

 

yi

(i 1,2,...,m).

(147)

 

 

 

 

x

 

 

 

 

 

i

 

Если коэффициент ki постоянный, то точки Mi(xi , yi) лежат на одной прямой, а если k1 k2 ... kп , то точки Мi приблизительно лежат на одной прямой. В зависимости от того, с какой точностью выполняется условие ki const , решается вопрос о возможности использования в качестве математической модели изучаемого явления или объекта линейной зависимости.

Когда определен вид уравнения регрессии, переходят к определению конкретных коэффициентов этого уравнения. Определение коэффициентов уравнения регрессии производится из условия наименьшего отклонения экспериментальных точек от линии регрессии, соответствующей уравнению (144). Для этого используют метод наименьших квадратов.

Сущность этого метода состоит в следующем. Допустим, имеется выборка объема N, которая сведена в табл. 19.

 

 

Исходные данные

Таблица 19

 

 

 

 

 

 

 

 

 

xi

x1

 

x2

…………….

xN

yi

y1

 

y2

…………….

yN

Задача определения параметров уравнения регрессии сводится практически к определению минимума функции многих переменных, если функ-

ция (148) дифференцируема и требуется выбрать

в0 , в1 , в2 ,…так, чтобы

N

2

 

 

 

yi f (xi,в0,в1,в2...)

min

,

(148)

i 1

т.е. разность между искомой функцией и экспериментальными точками была минимальной. Здесь

y f (xi,в0,в1...) искомое уравнение регрессии.

(149)

Известно, что необходимым условием минимума функции (148) являет-

ся

102

 

 

0 ;

 

 

0 ;

 

0…

 

в0

 

в1

 

 

 

 

 

 

 

в2

Отсюда, учитывая выражения (149) и (150), имеем

 

 

 

N

 

 

 

 

 

 

f (хi)

 

 

 

 

 

2 yi

f (xi,в0,в1,в2

...)

 

 

0;

 

 

 

 

 

i 1

 

 

 

 

 

 

в0

 

 

 

N

 

 

 

 

f (хi)

 

 

 

 

 

 

2 yi

f (xi,в0,в1,в2...)

0;

 

 

 

 

i 1

 

 

 

 

 

 

в1

 

 

 

N

 

 

 

 

 

 

f (хi)

 

 

 

 

2 yi

f (xi,в0,в1,в2

...)

0.

 

 

 

i 1

 

 

 

 

 

 

в2

 

 

После преобразования получим

(150)

(151)

N

yi

i1

N

yi

i 1

N

yi

i1

f (x

)

 

N

f (x )

 

 

i

 

 

f (xi,в0,в1,в2...)

 

i

 

 

0;

 

 

в0

 

 

 

в0

 

 

 

 

 

i 1

 

 

 

 

 

 

f (x )

N

 

f (x

)

 

 

 

i

 

 

f (xi,в0,в1,в2...)

 

i

 

 

0;

(152)

 

в

 

 

в

 

 

1

 

 

i 1

1

 

 

 

 

f (x )

N

f (x )

 

 

i

 

 

f (xi,в0,в1,в2...)

 

i

 

 

0.

 

 

в2

 

 

 

в2

 

 

 

 

 

 

i 1

 

 

 

 

 

Как видно из соотношений (152), в этой системе будет столько уравнений, сколько неизвестных коэффициентов в0 1 2 ,… в уравнении регрес-

сии (144).

Однако систему (152) нельзя решить в общем виде, для ее решения нужно задаться видом уравнения регрессии (144).

Наиболее часто в качестве математических зависимостей (моделей) при обработке статистических данных методом наименьших квадратов принимаются следующие регрессии:

1)линейная у=в01х;

2)степенная у=сха;

3)показательная у=сеах;

4)

гиперболическая у=

a

в ;

 

 

 

х

5)

параболическая у=в0 1 х +в11х2.

Линейная зависимость является наиболее простой математической моделью, которую используют при обработке статистических данных методом наименьших квадратов. Однако практически исследователю при изучении зависимостей между x и y приходится чаще всего встречаться с не-

103

линейной зависимостью. В таком случае целесообразно подобрать новые переменные u=f(x,y) и v=f(x,y), такие, чтобы между u и v была линейная зависимость. Такой прием называется выравниванием вышеуказанных нелинейных зависимостей.

Пусть y является степенной функцией от x:

y=с ха,

(153)

где а и с – искомые параметры.

 

Прологарифмируем равенство (153):

 

lny=а lnx+lnc.

Введем новые переменные: u=lnx;

v=lny.

Тогда получим

 

V=а и+в.

(154)

где в=lnc.

 

Новые переменные u и v связаны линейной зависимостью и, следовательно, к ним можно применить проверочный критерий существования этой зависимости:

ui ui 1 ui;

vi vi 1 vi(i 1,2,...,m)

Тогда, если

ki vi const,

ui

то критерий существования линейной зависимости между u и v выполняется, а это значит, что эмпирическая формула (153) подобрана правильно. Во всех остальных случаях, когда ki const , функция (153) не отображает истинную зависимость между x и y.

Пусть y является показательной функцией x:

y=с еах .

155)

Логарифмируем это уравнение: lny=ах+lnc. Вводим новые переменные: u=х; v=lny, тогда исходное уравнение примет вид

v=а u+в,

(156)

где в=lnc. Новые переменные связаны линейной зависимостью.

 

Пусть Y является гиперболической функцией от Х:

 

y

а

в.

(157)

 

 

х

 

Обозначим v=y; u=х-1. Получим линейную зависимость v=аu+в. Пусть y является квадратичной функцией x:

y=в0+в1 x+в11х2. (158)

104

Из статистических данных (из заданных табл.19 значений x и y) берут некоторое (рекомендуется брать значение, расположенное в центральной части таблицы) значение x* и соответствующие ему значения y*. Получим

y*=в0+в1х*+в11(х*)2

(159)

Вычтем это уравнение из заданного (158): y – y*=в11(х2 х*2)+в1(х – х*) и разделим на (х – х*): y y*х х* в11(х х*) в1. Обозначим u=х+х*; v y y* х х* .Тогда исходное уравнение (158) примет вид

v=в11 u в1.

(160)

Здесь следует особо заметить, что точка (х*, у*) исключается из дальнейших расчетов.

Таким образом, любую из практически используемых нелинейных зависимостей можно свести к линейной регрессии. Однако в каждом конкретном случае, прежде чем принять за основу расчетов подобранную зависимость между x и y, необходимо проверить ее по вышеизложенному проверочному критерию существования линейной зависимости, основан-

ному на отношении приращений по u и v, т.е. определении ki vi и по-

ui

следующем сравнении всех ki между собой.

Рассмотрим решение системы уравнений (152) применительно к наиболее часто используемой линейной регрессии.

Если искомое уравнение регрессии представляет собой линейную связь от одного параметра, что соответствует эмпирической линии регрессии (см. рис. 34) в виде отрезка прямой, то математическая модель этой зависимости имеет вид

yв0 в1x,

(161)

где у€ - расчетное значение величины отклика. Тогда согласно выражению (150) получим

у

1;

у

х.

в0

в1

При этом система (152) будет иметь вид

 

N

N

N в0 в1 xi

yi.

 

i 1

i 1

N

N

N

в0 xi в1 xi2 xi yi.

i 1

i 1

i 1

(162)

(163)

Отсюда на основе использования определителей находим параметры

105

уравнения (161):

 

 

 

 

 

 

yi

xi

 

 

 

 

 

 

 

 

 

в0

 

 

xi yi

xi2

 

yi xi2 xi yi

xi

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

xi

 

 

 

 

N

 

x2 (

x )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

xi2

 

 

 

 

 

 

 

i

i

 

 

 

 

 

 

 

 

 

N

yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

xi

xi yi

 

 

 

 

xi yi N xi yi

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

N

xi

 

 

 

 

 

 

 

N xi2 ( xi )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

xi2

 

 

 

 

 

 

 

 

 

 

 

(164)

(165)

Но в принципе свободный член в0 уравнения (161) можно получить и более простым путем по формуле

в0

у

в1

х

,

(166)

где у и х – усредненные экспериментальные данные (см. табл. 19). Кроме изложенного, существует другой способ определения коэффи-

циентов нелинейных зависимостей при обработке статистических данных. Если уравнение регрессии представляет собой полином некоторой степени, то при использовании метода наименьших квадратов коэффициенты этого полинома определяются решением системы нормальных уравнений. Например, требуется определить по методу наименьших квадратов коэффициенты квадратичной функции – параболы второго порядка, заданной

уравнением

yв

0

в

x в x2.

(167)

 

1

11

 

Тогда согласно выражению (150) для уравнения (167) имеем

 

у

1;

у

х;

у

х2 .

(168)

 

 

 

в11

 

в0

в1

 

 

В таком случае система нормальных уравнений имеет вид

 

N в0 в1 хi в11 xi2 yi;

 

в0 хi в1 xi2 в11 хi3 yi xi;

(169)

в0 хi2 в1 xi3 в11 хi4 yixi2.

 

Коэффициенты уравнения регрессии (167) определяются с помощью определителей вышеизложенным способом.

Пример. Допустим, производилось растворение порошкообразных ма-

106

териалов в жидких средах (растворителях).

В табл. 20 приведены экспериментальные данные вышеуказанного процесса.

В нижней строке первого столбца указывается номер варианта. В столбцах со второго по десятый указаны значения независимой переменной xi, представляющие собой температуры соответствующей жидкости в кельвинах, а в столбцах с 11-го по 19-й приведены величины независимой переменной yi – максимального удельного растворения соответствующего порошкообразного вещества в заданной жидкости, выраженного в граммах на 100 грамм жидкости.

Таблица 20

Исходные данные по эксперименту

 

Температура растворителя,

К

 

 

Растворимость материала, г/100г

 

 

х1

х2

х3

х4

х5

х6

х7

х8

х9

у1

у2

у3

у4

у5

у6

у7

у8

у9

1

2

3

4

5

6

7

8

 

9

10

11

 

12

13

14

15

16

17

18

 

19

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

273

283

293

303

313

323

333

 

342

353

33,5

 

37

41,2

46,1

50

52,8

56,8

64,3

 

69,9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используя соответствующие данные табл. 20, исследователю надлежит получить математическую зависимость растворения порошкообразного материала в заданной жидкости, выраженную уравнением регрессии.

Для выполнения указанного требования необходимо:

1)построить эмпирическую линию регрессии для заданного варианта статистических данных;

2)выбрать вид соответствующего уравнения регрессии;

3)рассчитать параметры выбранного уравнения регрессии, т.е. определить числовые значения соответствующих коэффициентов на основе использования метода наименьших квадратов;

4)произвести проверку правильности расчетов, выполненных в п.3, и если эти расчеты не содержат ошибок, то записать полученное уравнение регрессии.

Решение. Следует определить по объему выборки N=9 зависимость растворимости порошка y от температуры растворителя x.

Начинающий исследователь, как правило, сталкивается с рядом трудностей при практическом использовании метода наименьших квадратов, в частности, с чего начинать расчеты, как проверить их правильность и т.д.

Выполнение работы начинаем с того, что по исходным данным построим эмпирическую линию регрессии. Из-за малого объема выборки это построение сводится к нанесению экспериментальных точек на график в выбранном масштабе (рис.35).

Согласно построенной эмпирической линии регрессии зависимость

107

между x и y линейная, т.е. выражается следующим уравнением регрессии yв0 в1x.

Коэффициенты в0 и в1 рассматриваемого уравнения определяем по формулам (164) и (165). Для проведения необходимых вычислений экспериментальные данные и результаты вычислений представим в виде табл.21.

Последние два столбца табл. 21 используются для проверки правиль-

9

9

9

9

ности вычислений по формуле (xi yi)2 x2 2 xi yi yi2 ,

i 1

i 1

i 1

i 1

1199579,08 = 887721 + 2 144004,8 + 23848,48, окончательно имеем 1199579,08 = 1199579,08, т.е. вычисления прошли верно.

80

 

 

 

 

 

 

 

 

70

 

 

 

 

 

 

 

 

60

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

30

 

 

 

 

 

 

 

 

20

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

273

283

293

303

313

323

333

343

353

Рис. 35. Эмпирическая линия регрессии для рассматриваемого примера

 

 

 

Результаты вычислений

 

Таблица 21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

уi

хi уi

хi2

уi2

хii

(хii)2

1

273

33,5

9145,5

74529,0

1122,25

306,5

93942,25

 

2

283

37,0

10471,0

80089,0

1369,00

320,0

102400,00

 

3

293

41,2

12071,6

85849,0

1697,44

334,2

111689,64

 

4

303

46,1

13968,3

91809,0

2125,21

349,1

121870,81

 

5

313

50,0

15650,0

97969,0

2500,00

363,0

131769,00

 

6

323

52,8

17054,4

104329,0

2787,84

375,8

141225,64

 

7

333

56,8

18914,4

110889,0

3226,24

389,8

151944,04

 

8

343

64,3

22054,9

117649,0

4134,49

407,3

165893,29

 

9

353

69,9

24674,7

124609,0

4886,01

422,9

178844,41

 

 

2817

451,6

144004,8

887721

23848,48

3268,6

1199579,08

 

108

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]