
Т3 Логика решения задач
.pdfпоявления события |
обстоятельства, |
то ( ) |
b или не-b |
когда ( ) |
|
1 |
afcd |
b |
2 |
hsp |
не-b |
3 |
gtu |
не-b |
. . . . |
. . . . |
. . . . |
Вероятно, если (а), то(b).
Заключение по сопутствующим изменениям. Данный вид заключений осуществляется на основе эмпирической таблицы наблюдений, в которой обстоятельство a, выступающее причиной явления b, изменяется, в то время как другие обстоятельства остаются неизменными (см. табл. 3.5.3).
Таблица 3.5.3.
Случаи (k) |
Предшествующие |
Наблюдаемое явление, |
|
обстоятельства, |
то ( ) |
|
когда ( ) |
|
1 |
afcd |
b |
2 |
fcd |
не-b |
Вероятно, если (а), то(b).
В общем случае вероятностное заключение основывается на совокупности наблюдений, в которой представлены все рассмотренные случаи. Так как заключение вероятностное, то полученное правило «если (а), то(b)» может выполняться не для всех наблюдений. Здесь возможны следующие ошибки правила вывода:
-обстоятельство а присутствует, однако явление b в наблюдении отсутствует;
-обстоятельство а отсутствует, однако явление b в наблюдении
присутствует.
70. Предположим, что совокупность наблюдений представляет собой генеральную выборку данных, т.е. представляет собой набор всех возможных данных по исследуемому явлению. Тогда можно подсчитать относительную частоту правильных выводов на основе полученного правила:
пр = 1 - ош , |
ош = |
Nош |
. |
|
|||
|
|
N |
Здесь N – общее число наблюдений в генеральной совокупности; Nош – число наблюдений, на которых полученное правило дает ошибочные выводы; ош – относительная частота ошибочных выводов.
80. Необходимо отметить, что относительная частота ошибочных выводов образуется из ошибок двух видов. Ошибка ложного вывода состоит в том, что согласно полученному правилу мы делаем утвердительный теоретический вывод, однако эксперимент его не
254

подтверждает. Другой вид ошибки состоит в том, что согласно полученному правилу мы делаем отрицательный теоретический вывод, однако эксперимент свидетельствует обратное. Зная частоту указанных ошибок можно подсчитать относительную частоту ложного вывода и относительную частоту пропуска вывода для найденного правила.
90. Если совокупность наблюдений не представляет собой генеральной совокупности, то всю выборку данных необходимо разделить на две выборки: обучающую и поверочную. На обучающей выборке находится искомое правило, на поверочной выборке определяется относительная частота его выполнения. Этот подход следует из общего принципа проверки знаний: знания приобретаются на обучающих примерах, а проверяются на других - поверочных примерах.
В результате проверки найденного правила «если (а), то (b)» принимается решение о его достоверности.
100. В итоге, после проведения серии экспериментальных исследований в дальнейших теоретических исследованиях может быть принята в качестве исходной посылки теории причинно-следственная связь
x f y ,
содержание которой раскрывается в серии суждений:
если (аi(1)) то (bj(1)); если(аi(2)) то (bj(2));
. . . .
если (аi(k)) то (bj(k));
. . . .
С математической точки зрения совокупность данных суждений представляет собой функцию общего вида y f (x) .
3.5.2. Построение факторных зависимостей
110. Рассмотрим задачу построения зависимости выходных эффектов объекта исследования от значений действующих факторов на его входах
(рис. 3.5.1).
x1
x2 |
F |
y |
|
xn
Рис. 3.5.1. Факторное представление объекта исследования.
255
Здесь x1 , x2 , ..., xn - входные факторы, y - выходной эффект. Так как зависимость F a priori неизвестна, то рассматриваемую задачу называют также задачей о «черном ящике». К указанному представлению сводится широкий класс задач исследования как статических, так и динамических зависимостей.
Так, например, рекуррентная зависимость
n |
m |
yk ar yk r bluk l , |
|
r 1 |
l 0 |
описывающая динамику линейных стационарных процессов, а также модель линейных динамических систем в пространстве состояний
n |
m |
xi, k 1 air xr , k bilul , k , |
|
r 1 |
l 1 |
n |
m |
y j, k cir xr , k dilul , k ; |
|
r 1 |
l 1 |
путем замены переменных приводятся к указанному базовому представлению.
120. Предположим вначале, что нам известна общая структура зависимости F в виде линейной композиции функций общего вида:
|
|
|
|
n |
|
|
|
|
|
y ai i (x) , |
(2.1) |
|
|
|
|
i 0 |
|
где x - вектор ( x |
, x |
, ..., |
x |
)т входных факторов; |
( ) - некоторые известные |
1 |
2 |
|
n |
i |
|
функции; ai - неизвестные коэффициенты.
Изложение материала будем вести на высоком уровне абстракции, предполагая, что значения входных факторов представляют собой элементы произвольной природы. Значения функций i ( ) и y будем также полагать
элементами произвольной природы, однако будем дополнительно считать, что они являются элементами абстрактного линейного пространства. В этом случае для них определены абстрактные алгебраические операции умножения на число и сложения. Соответствующее линейное пространство будем полагать эвклидовым. Кроме того функции i ( ) могут иметь
различные частные виды, например: зависеть лишь от одной переменнойi (xi ) , отождествляться с переменной xi , представлять произведение
i
переменных xr и др.
r 1
130. Предположим, что в результате экспериментальных наблюдений за поведением объекта исследования получено множество экспериментальных данных
{(xs , ys ) : s 1, 2, . . . , N}, |
(2.2) |
256 |
|

где s - индекс экспериментального наблюдения, N - общее число наблюдений.
140. Для того чтобы адекватно отражать действительность, зависимость (2.1) должна теоретически предсказывать значения ys по заданным
значениям xs . Так как в общем случае это не происходит, то ошибку предсказания можно определить соотношением
n |
|
|
es ys ai i (xs ) , |
s 1, 2, . . . , N . |
(2.3) |
i 0
Среднюю норму ошибок определим с использованием соотношения
|
1 |
N |
|
|
|
|||||||
E2 |
|
|
|
|
es |
|
|
|
2 . |
(2.4) |
||
|
|
|
|
|||||||||
|
||||||||||||
|
N s 1 |
|
|
|
|
|
|
|
|
|
150. Ставится задача: определить неизвестные значения коэффициентов ai зависимости (2.1), исходя их условия минимума средней
нормы ошибок (2.4)
min E2 . |
(2.5) |
{ai } |
|
Определим норму ошибки на основе скалярного произведения в некотором эвклидовом пространстве
e |
|
2 e , |
e |
, |
(2.6) |
|
|||||
s |
|
s |
s |
|
|
где ,
- обозначение операции скалярного произведения векторов в
эвклидовом пространстве.
С учетом (2.3), (2.4), (2.6) средняя норма ошибок определится соотношением
|
1 |
N |
n |
n |
|
|
E2 |
ys |
a j j (xs ), ys |
ak k (xs ) . |
(2.7) |
||
|
||||||
|
N s 1 |
j 0 |
k 0 |
|
Выражение (2.7) есть числовая квадратичная функция относительно
коэффициентов ai |
и называется квадрат среднеквадратической ошибки. |
||||||||||||
Сама |
|
среднеквадратическая |
ошибка, |
|
естественно, |
определяется |
|||||||
соотношением E |
|
|
|
|
|
|
|
|
|||||
|
E2 . |
|
|
|
|
|
|||||||
|
|
160. Необходимым условием минимума квадратичной функции (2.7) |
|||||||||||
является равенство нулю всех ее частных производных |
|
||||||||||||
E |
2 |
|
1 |
N |
|
|
n |
|
1 |
N |
n |
|
|
|
|
i (xs ), ys ak k |
(xs ) |
ys a j j (xs ), i (xs )) 0 , |
|||||||||
a |
N |
N |
|||||||||||
|
s 1 |
|
|
k 0 |
|
s 1 |
j 0 |
|
|||||
|
i |
|
|
|
|
|
|
|
i 0, 1, . . . , n .
Полученные соотношения представляют собой систему линейных алгебраических уравнений относительно неизвестных ai . На основе
эквивалентных преобразований данную систему уравнений можно привести к нормальному виду
257

Здесь
cij
di
1
N
|
|
|
n |
|
|
|
|
|
cij a j di , |
|
|
|
|
|
j 0 |
|
|
N |
|
|
|
1 |
|
i |
(xs ), j (xs ) |
||||
s 1 |
|
|
|
N |
|
1 |
|
N |
|
|
1 |
|
|
i (xs ), ys |
|
||
|
|
|
N |
||
N s 1 |
|
|
i, j 0, 1, . . . , n . |
|
(2.8) |
|
N |
|
|
|
j (xs ), i (xs ) |
; i, j 0, 1, . . . , n ; |
(2.9) |
|
s 1 |
|
|
|
N |
|
|
|
ys , |
i (xs ) ; |
i 0, 1, . . . , n . |
(2.10) |
s 1
170. Таким образом, на основе экспериментальных данных (2.2) можно построить аналитическую зависимость (2.1), неизвестные коэффициенты которой определяются на основе решения системы линейных алгебраических уравнений (2.8). Полученное решение будет оптимальным по критерию минимума квадрата среднеквадратической ошибки (2.5). Изложенный метод решения называется методом наименьших квадратов31. Метод наименьших квадратов является одним из наиболее распространенных методов построения зависимостей по экспериментальным данным.
180. Рассмотрим далее вопрос оценки точности решения рассматриваемой задачи. Прежде всего, необходимо обратить внимание, что оценку точности решения задачи (2.5) не следует проводить на экспериментальных данных, которые непосредственно использовались для решения задачи. Эти данные представляют собой обучающую выборку. Оценку точности необходимо осуществлять на дополнительных данных – поверочной выборке, которые не участвовали в решении задачи. Данное требование составляет общее правило для процессов обучения.
В нашем случае разрешимость задачи (2.5) непосредственно определяется разрешимостью системы линейных алгебраических уравнений (2.8). Из теории линейных алгебраических уравнений известно, что необходимым и достаточным условием разрешимости системы уравнений (2.8) является неравенство нулю определителя системы уравнений: 0 . Это условие эквивалентно требованию линейной независимости каждой i -ой строки системы уравнений (2.8). В свою очередь данное требование эквивалентно требованию линейной независимости результатов наблюдений, составляющих обучающую выборку (2.1). Минимальное число линейно независимых результатов наблюдений равняется числу неизвестных в системе уравнений (2.8). Таким образом, для разрешимости задачи (2.8) минимальное число линейно независимых результатов наблюдений
31 Задачу построения неизвестной зависимости на основе метода наименьших квадратов впервые поставил и решил немецкий математик К. Гаусс. Гаусс решал астрономическую задачу оценки траектории движения планет при наличии возмущений.
258

N об |
n 1. |
(2.11) |
|
min |
|
|
|
При общем числе экспериментальных наблюдений - |
N , объем поверочной |
||
выборки составит |
|
|
|
N пов N N об |
N (n 1) . |
(2.12) |
|
|
min |
|
|
Поверочная выборка должна представлять собой линейно независимые результаты наблюдений.
С учетом сказанного, квадрат среднеквадратической ошибки решения задачи (2.5) определится выражением
|
1 |
N |
|
|
|
|||||||
E2 |
|
|
|
|
es |
|
|
|
2 . |
(2.13) |
||
|
|
|
|
|||||||||
N (n 1) |
||||||||||||
|
s 1 |
|
|
|
190. Точность (2.13) решения задачи (2.5) непосредственно связана со сложностью представления искомой зависимости (2.1).
Сложность искомой зависимости (2.1) будем оценивать числом ее неизвестных, другими словами, числом ее степеней свободы. В нашем
случае число степеней свободы |
|
Nсв n 1. |
(2.14) |
Число степеней свободы искомой зависимости должно соответствовать реальной сложности функциональных свойств исследуемого объекта. Если число степеней свободы искомой зависимости меньше реальной сложности функциональных свойств исследуемого объекта, то точность решения задачи (2.5) будет низкой. Аналогично в противоположном случае, если число степеней свободы искомой зависимости больше реальной сложности функциональных свойств исследуемого объекта, то точность решения задачи (2.5) также будет низкой. Общий характер связи точности решения задачи (2.5) от числа степеней свободы искомой зависимости представлен на рис. 3.5.2.
E2
Nсв
Nсвopt
Рис. 3.5.2. Связь точности построения зависимости от числа ее степеней свободы.
Из рисунка 3.5.2 следует, что существует оптимальное число степеней свободы искомой зависимости, обеспечивающее максимальную
259
точность представления функциональных свойств конкретного объекта исследования.
200. Другой проблемой является возможность информационной неполноты статистики, которая используется для построения эмпирических формул. В этом случае постановка задачи построения эмпирической формулы будет некорректной и необходимо использовать методы регуляризации.
С практической точки зрения здесь можно рекомендовать использовать в качестве регуляризующей функции оценку нормы уклонения искомого решения от некоторого номинального, имеющего регуляризующий эффект
|
1 |
n |
|
|
|||||||
R2 |
|
|
|
|
ai aiр |
|
|
2 . |
(2.15) |
||
|
|||||||||||
|
n 1 i 0 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
В итоге задача построения эмпирической зависимости сведется к задаче минимизации функции Лагранжа
|
min L(a), |
L(a) E2 (a) |
R |
R2 (a) ; |
(2.16) |
||
|
(a) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где R |
– параметр регуляризации. |
|
|
|
|
||
В этом случае система уравнений (2.8) преобразуется к виду |
|
||||||
|
n |
|
|
|
|
|
|
|
(cij ij R )a j di |
Raiр , |
i, |
j 0, 1, . . . , n ; |
(2.17) |
||
|
j 0 |
|
|
|
|
|
|
где ij |
– символ Кронекера: |
ij |
1, при i j; |
ij 0, при i j. |
|
Постановка задачи (2.16) формально сводит задачу построения эмпирических формул к задаче управления. Здесь степень отклонения искомой зависимости от номинальной зависит от величины параметра регуляризации. При малых значениях параметра регуляризации точность определения искомой зависимости повышается, однако снижается устойчивость решения задачи к воздействию различных возмущений. При больших значениях параметра регуляризации точность определения искомой зависимости падает, однако повышается устойчивость решения к возмущениям, и само решение задачи стремится к номинальному.
3.5.3. Построение эмпирических зависимостей в нелинейном случае
210. В нелинейном случае исходная эмпирическая формула имеет
общий вид |
|
y F[a](x) , |
(3.1) |
где a - вектор структурных параметров формулы, x - вектор переменных. 220. Предположим, что известно начальное приближение значения вектора
a a0 . Тогда в окрестности точки a0 формулу (3.1) можно разложить в линейный ряд
260

n |
|
|
y F[a](x) F[a0 ](x) ai i (x) , где |
ai ai ai 0 . |
(3.2) |
i 1
Линейный ряд (3.2) соответствует линейной эмпирической формуле (2.1), для которой был изложен метод наименьших квадратов определения неизвестных коэффициентов зависимости по экспериментальным данным. Данный метод можно применить и к определению неизвестных коэффициентов ai зависимости (3.2). В результате будут получены
искомые значения коэффициентов ai . Зная значения ai можно уточнить искомые значения структурных параметров зависимости (3.1)
ai1 ai 0 ai |
; i 0, 1, . . . , n . |
(3.3) |
Далее, рассматривая параметры |
{ai1} как начальное приближение |
для |
следующего шага решения, процедуру решения задачи можно повторить. В результате будет получено следующее приближение решения {ai 2 }.
Рекуррентно повторяя указанную процедуру решения, получим последовательность решений
a0 , a1 , a2 , . . . |
(3.4) |
||||||||
Если последовательность (3.4) сходится: |
|
|
|
||||||
lim |
|
|
|
ak ak 1 |
|
|
|
0 , |
|
|
|
|
|
|
|||||
k |
|
|
|
|
|
|
|
|
|
то она сходится к искомому решению.
Изложенный метод позволяет строить нелинейные эмпирические формулы на множестве экспериментальных данных. Он реализует метод Ньютона решения нелинейных уравнений.
3.5.4. Планирование экспериментов
230. Рассмотрим вопросы планирования экспериментов. При планировании экспериментов, прежде всего, необходимо определить критерий планирования. Одним из естественных критериев планирования является, например, разрешимость задачи построения искомой зависимости при минимальной сложности решения.
Как было показано ранее, разрешимость задачи (2.5) связана с разрешимостью системы линейных алгебраических уравнений (2.8) – (2.10). При этом решение задачи предельно упрощается, если данные
экспериментов удовлетворяют условиям |
|
cij 0 , для всех i j . |
(4.1) |
Тогда решение задачи
ai di ,
cii
при использовании регуляризации
261

|
|
|
a |
di R aiр |
; |
i 0, 1, ..., n . |
(4.2) |
|||
|
|
|
|
|
||||||
|
|
|
i |
|
|
cii R |
|
|
||
|
|
|
|
|
|
|
|
|||
В соответствии с соотношением (2.9) условия (4.1) выражаются в виде |
|
|||||||||
|
1 |
N |
|
1 |
N |
|
|
|||
cij |
i (xs ), j (xs ) |
|
j (xs ), i (xs ) 0 ; i, j 0, 1, ..., n ; i j |
|||||||
|
|
|||||||||
|
N s 1 |
|
N s 1 |
|
|
|||||
.(4.3) |
|
|
|
|
|
|
|
|
Условия (4.3) представляют собой условия ортогональности для плана эксперимента
э {xs : s 1, 2, ..., N}. |
(4.4) |
|
240. В качестве примера рассмотрим случай, когда |
|
|
i (xs ) xis , i 0, 1, ..., n ; |
(4.5) |
|
где xis – числовая переменная. Тогда зависимость (2.1) имеет вид |
|
|
N |
|
|
y ai xi , |
x0 1. |
(4.6) |
i 0
Предположим, что в процессе эксперимента значения переменных xi изменяются только на двух уровнях: максимальное значение - ximax и минимальное значение - ximin . Тогда на основе замены переменных можно перейти к безразмерным нормированным величинам
i |
|
x 0,5(xmax xmin ) |
, |
i 0, 1, . . . , n . |
(4.7) |
|||
i |
|
i |
i |
|||||
|
|
|
|
|
|
|||
|
|
xmax 0,5(xmax xmin ) |
|
|
|
|||
|
|
i |
|
i |
i |
|
|
|
При x xmax , переменная |
i |
1 |
, при x xmin , переменная |
1. |
||||
i i |
|
|
|
i |
|
i |
i |
Для нормированных переменных в качестве примера ортогонального плана эксперимента можно привести полный факторный эксперимент. Полный факторный эксперимент содержит все возможные сочетания значений нормированных переменных i . В таблице 3.5.4
приведен план полного факторного эксперимента для числа переменных n 3. Здесь при составлении таблицы положительное значение факторов «+1» условно обозначено знаком «+», аналогично значение «-1» обозначено как «-». Базовая часть плана эксперимента выделена рамкой. Вне рамки приводятся так называемые взаимодействия, представляющие собой произведения факторов.
Таблица 3.5.4
s |
0 |
1 |
2 |
3 |
|
1 2 |
1 3 |
2 3 |
1 2 3 |
y |
|
|
|
|
|
|
|
|
|
|
|
1 |
+ |
+ |
+ |
+ |
|
+ |
+ |
+ |
+ |
|
2 |
+ |
+ |
+ |
- |
|
+ |
- |
- |
- |
|
3 |
+ |
+ |
- |
+ |
|
- |
+ |
- |
- |
|
|
|
|
|
|
262 |
|
|
|
|
4 |
+ |
+ |
- |
- |
- |
- |
+ |
+ |
|
5 |
+ |
- |
+ |
+ |
- |
- |
+ |
- |
|
6 |
+ |
- |
+ |
- |
- |
+ |
- |
+ |
|
7 |
+ |
- |
- |
+ |
+ |
- |
- |
+ |
|
8 |
+ |
- |
- |
- |
+ |
+ |
+ |
- |
|
Базовая часть приведенного выше плана эксперимента, а также план взаимодействий являются ортогональными. В этом легко убедиться на основе подстановки значений факторов из плана эксперимента в формулу, выражающую условие ортогональности для плана (таб. 3.5.4)
|
1 |
N |
|
|
|
|
|
cij |
is js 0 |
, |
i, j 0, 1, ..., n ; |
i j . |
(4.8) |
||
|
|||||||
|
N s 1 |
|
|
|
|
||
Формула (4.8) непосредственно следует из формулы (4.3). |
|
||||||
Предположим, что искомая зависимость имеет вид |
|
|
|||||
|
|
N |
|
|
|
|
|
|
y ai i , |
0 |
1. |
|
(4.9) |
i 0
Тогда, для ортогонального плана вида (таб. 3.5.4) неизвестные коэффициенты ai зависимости (4.9) определятся по соотношениям
|
1 |
N |
|
|
|
|
ai |
is ys , |
i 0, |
1, ..., n . |
(4.10) |
||
|
||||||
|
N s 1 |
|
|
|
||
Формулы (4.10) являются частными случаями формул (4.2). |
|
|||||
Необходимо отметить, |
что формулы |
(4.10) справедливы |
и для |
взаимодействий. Так, если для таблицы 3.5.4 ввести обозначения
4 1 2 , 5 1 3 , 6 2 3 , 7 1 2 3 , (4.11)
то для расширенного состава переменных (4.11) формулы (4.10) останутся справедливыми.
250. Ортогональный план эксперимента вида (таб. 3.5.4) называется полным факторным экспериментом. Называется он так по той причине, что содержит полный перебор значений факторов. Для полного факторного эксперимента общее число экспериментов
N 2n . |
(4.12) |
При большом числе переменных n число экспериментов (4.12) становится большим, что является недостатком полного факторного эксперимента.
Для снижения числа экспериментов используют так называемые дробные реплики. Дробными репликами называют ортогональные планы экспериментов типа (таб. 3.5.4), в которых часть переменных рассматриваются как взаимодействия, при этом размерность таблицы экспериментов снижается.
260. Например, необходимо определить зависимость
263