Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КЛ по ВТиП-часть2_укр.pdf
Скачиваний:
40
Добавлен:
21.02.2016
Размер:
3.34 Mб
Скачать

Лекція 8. Метод найменших квадратів

Постановка задачі

Визначення виду функціональних залежностей, одержуваних у фізичному експерименті, має дуже важливе значення. Так, у результаті експериментів часто

одержують сукупність крапок (x1 , y1 )...(xN , yN ), абсциси яких {xk } різні. Одне із призначень чисельних методів – визначення формули виду y = f (x), що

зв'язує ці змінні, точніше – вибір класу припустимих формул, коефіцієнти в які повинні бути визначені.

Якщо всі чисельні значення {xk }, {yk } відомі з декількома знаками

точності, то інтерполяційний поліном може бути з успіхом використаний, інакше це неможливо. У деяких експериментах застосовується спеціалізоване встаткування, що дозволяє одержати вимірювані крапки, принаймні, з п'ятьма знаками точності. Однак більшість експериментів проводиться на встаткуванні, що надійно дає тільки три або менше знаки точності. Часто у вимірі присутнє

експериментальна помилка. І хоча записуються три цифри для значень {xk }, {yk }. Мається на увазі, що щире значення f (xk ) задовольняє рівності:

f (xk )= yk + εk

(8.1)

де εk – помилка виміру.

Для визначення кращого наближення функції до отриманих крапок, проведемо дослідження помилок (також називаних відхиленнями або

залишками):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

εk = f (xk )yk , для 1 k N .

 

 

(8.2)

Існує кілька норм, які можна використати із залишками в (8.2), щоб

виміряти, наскільки далеко від даних лежить крива y = f (x).

 

 

 

 

 

Максимальна помилка:

E

( f )= max{

 

f (xk )yk

 

}

 

 

(8.3)

 

 

 

 

 

 

1kN

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

N

 

 

 

 

 

Середня помилка:

 

E1 (

f )=

 

 

 

f (xk )yk

 

 

 

 

 

 

 

 

 

(8.4)

 

 

 

 

 

 

N

k=1

 

 

 

 

1 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

N

 

f (xk )yk

 

2

 

 

 

 

 

 

 

 

Среднеквадратическая помилка:

E2

( f )=

 

 

 

 

(8.5)

N

 

 

 

k=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Розглянемо це на прикладі.

Приклад 1. Зрівняти максимальну, середню й середньоквадратичну помилки для лінійного наближення функції y = f (x)= 8,6 1,6 x по заданих

крапках (1;10), (0;9), (1;7 ), (2;5), (3;4), (4;3), (5;0) і (6;1).

51

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f(xk)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1

0

1

2

3

 

4

5

 

 

 

6

 

 

 

 

 

 

-2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 8.1

 

 

Графік функції y = f (x)= 8,6 1,6 x з нанесеними крапками

Знайдемо помилки, використовуючи значення

функції

f (xk ) й εk ,

отримані в таблиці 8.1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблиця 8.1

 

 

 

 

 

Обчислення для знаходження E1 ( f )

й E2 ( f )

 

 

 

 

 

 

 

 

 

 

xk

 

 

 

 

 

 

yk

 

 

f (xk )= 8,6 1,6 xk

 

 

 

 

 

εk

 

 

 

 

 

εk2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

 

-1

 

 

 

 

10

 

 

 

 

 

10,2

 

 

 

 

 

 

 

 

 

 

 

 

 

0,04

0

 

 

 

 

9

 

 

 

 

 

8,6

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

0,16

1

 

 

 

 

7

 

 

 

 

 

7,0

 

 

 

 

 

 

 

0,0

 

 

 

 

 

 

0,00

2

 

 

 

 

5

 

 

 

 

 

5,4

 

 

 

 

 

 

 

0,4

 

 

 

 

 

 

0,16

3

 

 

 

 

4

 

 

 

 

 

3,8

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,04

4

 

 

 

 

3

 

 

 

 

 

2,2

 

 

 

 

 

 

 

0,8

 

 

 

 

 

 

0,64

5

 

 

 

 

0

 

 

 

 

 

0,6

 

 

 

 

 

 

 

0,6

 

 

 

 

 

 

0,36

6

 

 

 

 

-1

 

 

 

 

 

-1,0

 

 

 

 

 

 

 

0,0

 

 

 

 

 

 

0,00

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,6

 

 

 

 

 

 

1,40

E( f )= max{0,2;0,4;0,0;0,4;0,2;0,8;0,6;0,0}= 0,8

E1 ( f )= 81 (2,6 )= 0,325

E2

 

1,4

1 2

0,41833

( f )=

8

 

 

 

 

 

 

 

Ясно, що максимальна помилка найбільша і якщо одна крапка погана, те її значення визначає E( f ). Середня помилка E1 ( f ) – просто середнє абсолютних величин помилок різних різних крапок. Вона часто використається

52

завдяки простоті обчислення. Помилку E2 ( f ) часто використають при

вивченні помилок статистичної природи.

Найкраща побудована лінія визначається шляхом мінімізації однієї з величин, заданих вираженнями (8.3) – (8.5). Таким чином, можна знайти три

щонайкраще побудовані лінії. Традиційно вибирається третя норма E2 ( f ) тому, що її набагато легше мінімізувати.

Метод найменших квадратів

Нехай залежність між змінними x й y представлена таблицею даних,

отриманих в експерименті:

 

 

xN

 

X

x1

x2

 

 

 

 

 

yN

 

Y

y1

y2

Потрібно отримані дані описати деякою функціональною залежністю виду y = f (x). Така залежність повинна відбити основну тенденцію зміни змінної

yзі зміною змінної x й згладити випадкові погрішності вимірів, які неминучі

вексперименті.

Задача знаходження емпіричної формули (формули, що служить для аналітичного подання досвідчених даних) складається із двох основних етапів.

На першому етапі необхідно встановити вид залежності y = f (x), тобто

вирішити

 

чи

 

є

 

вона

лінійної

f (x)= a0 + a1 x ,

квадратичної

f (x)=a

0

+a

1

x+a

2

x2

,

логарифмічної

f (x)=a +a

1

ln(x) або

який-небудь

 

 

 

 

 

 

 

0

 

 

інший. Для цього експериментальні крапки наносяться на координатну площину й по їхньому розташуванню висувають гіпотезу про вид емпіричної залежності.

На другому етапі, коли загальний вид емпіричної функції обраний, необхідно визначити числові значення її параметрів a0 , a1 , a2 ,..., an . Критерієм

вибору значень параметрів є метод найменших квадратів (МНК).

У методі найменших квадратів апроксимуюча функція (поліном) будується на підставі того, що сума квадратів нев'язань по всіх крапках повинна бути найменшої. Т.е.:

N

N

 

F = δk

=( f (xk )yk )2 min ,

(8.6)

k=1

k=1

 

де δk – нев'язання.

Якщо взяти поліном у вигляді:

f (x)=a0 +a1 x+a2 x2 +...+am xm ,

(8.7)

те F = F (a0 ,a1 ,...,am )

Помітимо, що ступінь полінома m повинна бути менше числа крапок N . (У випадку m = N 1 одержимо поліном Лагранжа).

53

f (x)=a0 +a1 x

Лінійна апроксимація (інтерполяція)

У цьому випадку m = 1 , тоді апроксимуюча функція буде мати вигляд: (8.8)

Згідно МНК значення її параметрів підбираються таким чином, щоб відхилення експериментальних крапок (xk ; yk ) від обраної кривої було мінімальним. Т. е. параметри a0 , a1 повинні бути такими, щоб сума квадратів відхилень спостережуваних значень yk від розрахованих по функції (8.8), була мінімальною. Сума квадратів відхилень від лінійної функції (8.8) має вигляд:

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

yk )2 min

 

 

 

 

 

F (a0 , a1 )= (a0 + a1 xk

(8.9)

 

 

 

 

 

 

 

 

 

 

 

 

k=1

 

 

 

 

 

 

 

 

 

 

Величина E2 ( f ) буде мінімальної

тоді

й тільки тоді,

коли буде

мінімальної величина (8.9).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Величина F

(ao ,a1 )

 

є

функція

двох змінних.

Необхідною умовою

экстремума такої функції є рівність нулю всіх її часток похідних:

 

 

 

 

 

 

 

 

 

 

F (ao

,a1 )

 

= 0

 

 

 

 

F (ao

,a1 )

= 0

(8.10)

Вони мають вигляд:

 

 

a0

 

 

 

 

a1

 

 

 

 

 

 

 

 

 

 

(a0 , a1 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

= 2(a0 + a1 xk yk )= 0

 

 

 

 

 

 

 

a0

 

 

 

 

 

 

 

 

k=1

 

 

 

 

 

 

 

 

(8.11)

 

 

 

 

F (a0 , a1 )

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 2(a0 + a1 xk yk ) xk = 0

 

 

 

 

 

 

 

a1

 

 

 

 

 

 

 

k=1

 

 

 

 

 

 

 

 

 

Таким чином, після перетворення маємо нормальну систему двох

лінійних рівнянь щодо невідомих параметрів регресії a0 ,

a1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a0 N + a1 xk =

yk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k=1

 

k=1

 

 

 

 

 

 

(8.12)

 

 

 

 

 

 

 

 

 

 

N

 

 

 

N

N

 

 

 

 

 

 

 

 

 

 

 

 

a0 xk + a1 xk2 = yk xk

 

 

 

 

 

 

 

 

 

 

 

 

k=1

 

 

k=1

k=1

 

 

 

 

 

Рішення системи – значення параметрів a0 , a1 можна знайти методом

зворотної матриці1 . Представимо систему (8.12) у матричній формі:

 

 

 

N

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

N

xk

a

 

yk

 

 

або

a

 

 

 

 

 

 

 

k=1

 

 

a

0

= k=1

 

 

A

a

0

= B

 

 

 

 

N

N

 

 

1

 

N

 

 

 

 

 

 

 

 

 

 

xk

xk2

 

 

 

yk

xk

 

 

 

1

 

 

 

k=1

k=1

 

 

 

 

 

k=1

 

 

 

 

 

 

 

 

 

 

 

Тоді:

1 Основы работы с матрицами в MS Excel представлены в приложении 1

54