Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
CA.doc
Скачиваний:
1
Добавлен:
09.11.2019
Размер:
2.27 Mб
Скачать

3.1. Оцінка надійності коефіцієнтів моделі лінійної регресії

Оцінка надійності коефіцієнтів моделі лінійної регресії є кінцевим етапом отримання лінійної моделі об'єкту. Ця операція має на увазі оцінку вірогідності того, що при повторних дослідженнях об'єкта ми отримаємо те ж саме рівняння регресії з тими ж самими коефіцієнтами а0 та a1 значення яких можуть коливатися лише у деяких, раніше заданих визначених межах. Ця оцінка дозволяє визначити ступінь довіри до отриманої моделі об'єкта.

Як вже зазначалося середньоквадратична похибка при застосуванні отриманої моделі визначиться як:

З урахуванням недостатньої репрезентативності вибірки (за рахунок обмеження N), її значення може бути оцінено за допомогою виразу:

(3.8)

де k - число параметрів моделі, що визначаються в рівнянні регресії (в лінійній регресії k = 2, оскільки визначаються лише а0 та а1).

При оцінці надійності коефіцієнту регресії (а1) в [5] рекомендується застосувати вираз її середньої похибки, обумовленої обмеженим об'ємом вибірки (N), у вигляді:

При оцінці надійності вільного члена рівняння регресії 0) виразі середньої похибки матиме вигляд:

Прийнявши гіпотезу незалежності похибок та , загальну середню похибку моделі можна розрахувати як:

(3.9)

Тоді знаючи об'єм вибірки N і задавши рівень ймовірності довіри Р (зазвичай Р = 0,95 чи Р = 0,99) за таблицями t - розподілення Ст'юдента знаходимо значення коефіцієнта довіри (t), а потім інтервали довіри моделі:

(3.10)

При цьому межа коливань моделі ( = а0 + а1х) буде:

- при х = xтin мінімальною і рівною

(3.11)

- при х = xтax максимальною і рівною

(3.12)

Графічна інтерпретація отриманих виразів зображена на рис. 3.1, де заштриховане - це область довіри знаходження рівняння регресії.

Рис.3.1 Область довіри знаходження моделі регресі у(х)

3.2 Приклад побудови моделі лінійної регресії

Припустимо, що досліджується вплив пройденої автомобілем відстані на зношування шин. Щоб виключити вплив умов експлуатації були вибрані 5 різних типів автомобілів.

Експериментальні дані зведені до таблиці 3.2.

Таблиця 3.2 Дані експериментальних досліджень

Відстань

хі(км)

Величина зношування шин yij (мм) 5 автомобілів

1

2

3

4

5

10000

4

4

3

2

3

20000

6

6

5

4

7

30000

9

10

9

7

10

40000

12

12

11

9

13

50000

16

15

15

13

17

У якості інтервалу усереднення вибираємо Δх = 10000 км (і = 1,2,3,4,5), тобто N=5 (число інтервалів). Середнє по кожному інтервалу визначається за формулою:

де k - кількість типів автомобілів. Після розрахунків отримано: =3,2 мм, =5,6 мм, =9,0 мм, =11,4 мм, = 15,2 мм

Зобразимо розподілення значень інтервальних середніх на кореляційному полі (див. рис 3.2).

Рис. 3.2 Розподіл інтервальних середніх на кореляційному полі.

Очевидно, що найбільш підходящою апроксимацією у даному випадку буде лінійна регресія вигляду:

Зведемо данні усереднення до розрахункової таблиці 3.3

у(мм)

х(тис.км)

х2

ху

3,2

5,6

9,0

11,4

15,2

10

20

30

40

50

100

400

900

1600

2500

32,0

112,0

270,0

456

660

Всього

44,4

150

5500

1530

Сер. значення

8,88

30

Отже, рівняння лінійної регресії має вигляд:

де х - тис. км.; у – в мм.

Відмітимо, що початкове зношування а0 = 2,94 мм не має (фізичного змісту, оскільки модель застосовується лише при величинах пробігу

10000 ≤х≤50000 км.

Спробуємо дещо покращити якість моделі. Для цього введемо до експериментальних даних апріорну інформацію про відсутність зношування нових шин, тобто у = 0 при х = 0 і визначимо нові параметри моделі регресії (при n = 6) (див. таблицю 3.4).

Таблиця 3.4

у(мм)

х(тис.км)

х2

ху

0

0

0

0

3,2

10

100

32,0

5,6

20

400

112,0

9,0

30

900

270,0

11,4

40

1600

456

15,2

50

2500

660

Всього

44,4

150

5500

1530

Середнє значення

7,40

25,0

За даними таблиці знаходимо:

а0 = 7,7 - 0,24∙25 = 1,7 мм.

Рівняння регресії має вигляд:

Як слідує з отриманого рівняння, введення додаткової точки у=0 при суттєво підвищує точність розрахункового значення у(0).

Більш того, достовірне знання того, що у = 0 при х = 0 дозволяє обрати модель вигляду:

Тоді розрахунок коефіцієнта регресії можна провести на основі середніх значень

що ще більш уточнює параметри моделі.

Визначимо похибку застосування трьох вказаних моделей:

для лінійної апроксимації експериментальних даних. Розрахункові величини зведемо до таблиці 3.5.

Таблиця 3.5

xi

yi

10

20

30

40

50

3,2

5,6

9,0

11,4

15,2

4,92

6,9

8,88

10,86

12,84

4,1

6,5

8,6

11,3

13,7

2,96

5,92

8,88

11,84

14,8

2,598

1,690

0,014

0,292

5,570

0,81

0,81

0,01

0,01

2,25

0,058

0,102

0,014

0,195

0,160

Сума квадратів відхилень

10,164

3,89

0,529

Середньоквадратична похибка відхилень

2,03

0,778

0,106

Порівняння характеристик точності моделей показує, що введення додаткових достовірних даних дозволяє збільшити точність моделі.

У загальному випадку, якщо в моделі можливе врахування будь-якої достовірної інформації, то така модель завжди буде точнішою.

Для розрахунку значень загальної, факторної та залишкової дисперсії складемо наступну таблицю 3.6 (наприклад, для випадку першої моделі

).

Таблиця 3.6

yi

3,2

5,6

9,0

11,4

15,2

4,92

6,9

8,88

10,86

12,84

-5,6

-3,2

0,20

2,6

6,4

-1,72

-1,3

0,12

0,54

2,36

31,36

10,24

0,04

6,76

40,96

2,96

1,69

0,014

0,29

5,57

Всього

44,4

89,36

10,5256

Середнє значення

8,88

Розрахуємо факторну дисперсію:

Тоді коефіцієнт детермінації визначиться як

тобто 88% зношування шин обумовлено дальністю пробігу автомобіля. Коефіцієнт регресії

що свідчить про велику близькість реальної залежності у(х) до лінійної форми.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]