. Кореляційний аналіз дослідних даних

Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальная металлургическая академия Украины

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Книга1 МОНД.doc

Скачиваний:

Добавлен:

15.11.2019

Размер:

4.64 Mб

Скачать

☆

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 1920 / 4320 21 22 23 24 25 26 27 28 29 30 31 32 > Следующая >>>

. Кореляційний аналіз дослідних даних

Кореляційний аналіз є складовою частиною математичного апарату обробки експериментальних даних. За його допомогою оцінюють зв’язок між змінними, відсіюють зв’язки, що є незначущими, або несуттєві фактори.

Вибірковий коефіцієнт кореляції визначають за формулою:

де N – кількість дослідів;

- оцінки математичного сподівання змінних х та у;

S_x , S_y – оцінки середньоквадратичних відхилень цих змінних.

Для перевірки значимості коефіцієнту кореляції використовують критерій Стьюдента, тобто, знаходять його розрахункове значення t_р і порівнюють з табличним t_т . Розрахунковий t – критерій:

t_р = .

Табличне значення t_т знаходять для числа ступенів свободи f = N – 2 і рівня значимості q = 0,05 (або заданого). У разі виконання умови: t_р > t_т лінійний зв’язок між х і у існує.

Приклад. В результаті досліджень впливу питомої витрати пари на розпил мазуту в форсунки (х₁, ) і продуктивності обертової печі для обпалу вапняку (х₂, ) на питому витрату палива (у, ) отримані дані, які наведені в табл. 4.3. Знайти коефіцієнти кореляції між факторами х₁ , х₂ та змінною у, а також оцінити їх значимість.

Таблиця 4.3

Вихідні дані для розрахунку коефіцієнтів кореляції

№№ дослідів	х₁	х₂	У
1	0,69	29	50,5
2	0,66	91	30,9
3	0,45	82	37,4
4	0,49	99	37,8
5	0,48	148	19,7
6	0,48	165	15,5
7	0,41	133	49,0
Σ	3,66	747	240,8

Рішення. З даних таблиці знаходимо:

- середні значення параметрів = 0,523; = 106,71; = 34,4;

- їх середньоквадратичні відхилення S_x1 = 0,1076; S_x2 = 46,096; S_у = 13,407;

- вибіркові коефіцієнти кореляції r_x1
x2 = - 0,585; r_x2
у = - 0,605; r_x1
у = + 0,166;

- розрахункові значення критерію Стьюдента t_p1 = 1,61; t_p2 = 0,38; t_p3 = 1,70.

Табличне значення t - критерію для числа ступенів свободи f = 7 – 2 =5 і рівня значимості q = 0,05 складає t_т = 2,37. Оскільки для всіх випадків t_pі < t_т (і = 1, 2, 3), з імовірністю 95% можна зробити висновок, що лінійного зв’язку між змінними немає.

Апроксимація експериментальних даних

Шляхом апроксимації результатів експерименту можуть бути отримані різні функціональні залежності – поліноміальні, ступеневі, логарифмічні і т. д.

Основним математичним апаратом для отримання апроксимаційних моделей є метод найменших квадратів. Регресивний аналіз звичайно проводять за результатами пасивного або неспланованого активного експерименту. Основними передумовами регресивного аналізу є наступні.

1. Вихідна змінна об’єкту дослідження є випадковою величиною з нормальним законом розподілу;

2. Кореляція між вхідними змінними відсутня;

3. Дисперсія вихідної змінної не залежить від її абсолютної величини, тобто, дисперсії вихідної змінної є однорідними в будь – який точці факторного простору;

4. Об’єкт дослідження позбавлений динамічних властивостей.

Рівняння лінійної вибіркової регресії має вигляд:

= вх,

де - відхилення розрахункового значення вихідного параметра від середнього за вибіркою ;

- відхилення вхідної змінної Х від її середнього вибіркового значення ;

в – вибірковий коефіцієнт регресії, який визначають за формулою:

де - відхилення вибіркового значення вихідного параметру У від середнього ;

N – кількість дослідів (спостережень, вимірів).

Тобто, рівняння регресії можна записати у вигляді:

Для оцінки ступеня згоди лінії регресії з дослідними даними визначають відхилення від регресії d_ху = . Величина є основою для оцінки помилки, яка виникає при виборі лінії регресії. Оскільки в розрахунку використовуються дві середні величини ( та ), то число ступенів свободи дорівнює (N – 2). Тоді середній квадрат відхилень від регресії і вибіркове стандартне відхилення коефіцієнту регресії:

; .

Критерій суттєвості для коефіцієнту в визначають за формулою: t_p = та порівнюють його з табличним значенням t – критерію для числа ступенів свободи f = N –2 і заданого рівня значимості q. За умови t_p ≥ t_т коефіцієнт в є значимим.

Приклад. Досліджувався вплив продуктивності агрегату Х, на викиди пилу з нього У, ; результати вимірів наведені в табл. 4.4. Знайти залежність між цими параметрами у вигляді лінійної функції.

Таблиця 4.4

Результати вимірів

№№ вимірів	1	2	3	4	5
Х	35	45	55	65	75
У	114	124	143	158	166

Рішення. Середні значення параметрів:

; .

Результати проміжних розрахунків зводимо в табл. 4.5

Таблиця 4.5

Розрахункові параметри

№№	Х -	У -	(Х - )²	(У - )²	(Х- )* (У - )			(У- )²
1	- 20	- 27	400	729	540	113,4	0,6	0,36
2	- 10	- 17	100	289	170	127,2	- 3,2	10,24
3	0	2	0	4	0	141,0	2,0	4,0
4	10	17	100	289	170	154,8	3,2	10,24
5	20	25	400	625	500	168,6	- 2,6	6,76
Σ	0	0	1000	1936	1380		0	31,60

Вибірковий коефіцієнт регресії: .

В початкових одиницях рівняння регресії має вигляд:

- = в(Х - ); - 141 = 1,38(Х - 55); = 65,1 + 1,38Х, .

Для оцінки ступеня згоди лінії регресії з даними вимірів визначаємо , (У - ), (У - )², значення яких наведені в табл. 4.5, число ступенів свободи f = 5 – 2 = 3, середній квадрат відхилень і стандартне відхилення від регресії:

; S_xy = 3,24.

Вибіркове стандартне відхилення коефіцієнта регресії та розрахунковий критерій Стьюдента для нього:

; .

Табличний критерій Стьюдента для f = 3 i q = 5% складає t_т = 3,18, що значно перевищує розрахункову величину. Тому коефіцієнт регресії є значимим.

Рівняння множинної регресії має вигляд:

де в₁ , в₂ ,…, в_n – коефіцієнти часткової регресії, які визначають за методом найменших квадратів з системи нормальних рівнянь. Для двох вхідних факторів об’єкту вона має вигляд:

Рішення цієї системи відносно коефіцієнтів часткової регресії:

Перевірку значимості коефіцієнтів часткової регресії виконують в наступному порядку:

- обчислюють відхилення вибіркових значень У від розрахункових : d_у = У - , знаходять квадрати d_y² та суму квадратів цих відхилень від лінії регресії ;

- оцінюють середній квадрат відхилень від регресії шляхом ділення на число ступенів свободи f ( в даному випадку – це кількість дослідів N мінус три ступіні на середні величини , , ) та визначають середньоквадратичне відхилення:

;

- розраховують вагові коефіцієнти:

;

та вибіркові стандартні відхилення коефіцієнтів регресії:

; ;

- визначають розрахункові значення критерію Стьюдента t₁ = ; t₂ = та порівнюють їх з табличними для числа ступенів свободи (N – 3) і заданого рівня значимості q. Якщо t₁ (t₂) > t_т , то відповідний коефіцієнт в₁ (або в₂) є значимим.

Приклад. На печі по виробництву вапна досліджувався вплив вологості Х₁,% та середнього розміру шматків Х₂, мм вапняку на питому витрату палива У, . За даними табл. 4.6 отримати залежність між цими параметрами.

Таблиця 4.6

Результати дослідів

№№ дослідів	Х₁,%	Х₂, мм	У,
1	0,4	53	64
2	0,4	23	60
3	3,1	19	71
4	0,6	34	61
5	4,7	24	54
6	1,7	65	77
7	9,4	44	81
8	10,1	31	93
9	11,6	29	93
10	12,6	58	51
11	10,9	37	76
12	23,1	46	96
13	23,1	50	77
14	21,6	44	93
15	23,1	56	95
16	1,9	36	54
17	26,8	58	168
18	29,9	51	99

Рішення. Середні значення параметрів:

; ;

Характеристики відхилень від середніх:

; ; ; ; ; ;

Коефіцієнти часткової регресії:

;

Рівняння регресії:

Для перевірки значимості коефіцієнтів розраховуємо , (У_і - ) (табл. 4.7).

Таблиця 4.7

Прогнозована питома витрата палива та відхилення дослідних даних

№№ дослідів		(У_і - )
1	61,6	2,4
2	59,0	1,0
3	63,4	7,6
4	60,3	0,7
5	66,7	- 12,7
6	64,9	12,1
7	76,9	4,1
8	77,0	16,0
9	79,6	13,4
10	83,8	- 32,8
11	79,0	- 3,0
12	101,6	- 5,6
13	101,9	- 24,9
14	98,7	- 5,7
15	102,4	- 7,4
16	62,8	- 8,8
17	109,2	58,8
18	114,2	- 15,2

Сума квадратів відхилень від регресії складає:

Середній квадрат відхилень:

Вагові коефіцієнти:

;

Вибіркові стандартні відхилення коефіцієнтів регресії:

S_в1² = С₁₁S² = 0,0007249*427,6 = 0,310; S_в1 = 0,557;

S_в2² = С₂₂S² = 0,0004027*427,6 = 0,1722; S_в2 = 0,415.

Розрахункове значення t – критерію для коефіцієнтів:

; .

Оскільки табличне значення критерію Стьюдента для f = 18 – 3 = 15 і q = 5% складає t_т = 2,13, то коефіцієнт в₁ є значимим, а в₂ – незначущим.

Таким чином, вологість сировини суттєво впливає на питому витрату палива, а впливу її гранулометричного складу на енерговитрати за дослідними даними не виявлено.

Збільшення числа змінних призводить лише до ускладнення обчислювання. Наприклад, для трьох незалежних змінних Х₁, Х₂, Х₃ і однієї залежної У рівняння регресії має вигляд:

і коефіцієнти регресії визначають з системи рівнянь:

;

Для створення криволінійної регресивної моделі використовують два підходи. При першому будують графіки дослідних даних спочатку з застосуванням рівномірних шкал по осях координат. Якщо на графіку не отримана лінійна залежність, починають послідовно вибирати функціональні шкали по одній або по двох осях координат. Для цього використовують логарифмічні шкали. Наприклад, якщо має місце експонентна залежність вигляду: W = AB^Х, то шляхом логарифмування цього рівняння можна отримати рівняння прямої лінії:

LnW = lnA + ХlnB або У = а + вХ.

Цей спосіб використання логарифму замість самої величини називають способом спрямлення. Інколи для спрямлення використовують інші функції, наприклад, ; і т. д.

Приклад. В табл. 4.8 наведені результати експериментальних досліджень впливу ступеня збагачення повітря киснем на концентрацію оксидів азоту в продуктах згоряння палива. Знайти залежність між вмістом кисню в окислювачі Х, % і концентрацією NO_x в продуктах згоряння У, .

Таблиця 4.8

Результати експериментів

№№ дослідів	Х,%	У, *10²
1	21	3
2	23	8
3	25	18
4	27	43
5	29	110

Рішення. Для вибору виду апроксимаційної моделі будуємо графік У = f(Х) в рівномірних шкалах по осях координат (рис. 4.1а). Оскільки отримана залежність має відверто нелінійний характер, приймемо в якості апроксимуючої моделі рівняння:

У = ае^в^Х.

Логарифмуванням цього рівняння отримуємо:

lnУ = lna + вХ; У^/ = а^/ + вХ.

Перетворені дані зводимо до табл. 4.9 і на рис. 4.1б будуємо залежність У^/ = f(X), яка виявилася близькою до лінійної. Тому виконуємо розрахунки для лінійної регресії.

Таблиця 4.9

Розрахункові дані до апроксимації нелінійною моделлю

№	Х	У^/	Х-	У^/ -	(Х- )* (У^/ - )	(Х- )²		*10⁴
1	21	1,0986	-4	-1,80742	7,22968	16	1,1289	9,18
2	23	2,0794	-2	-0,82662	1,65324	4	2,01746	38,365
3	25	2,8904	0	-0,01562	0	0	2,90602	2,439
4	27	3,7612	2	0,85518	1,71036	4	3,79458	11,142
5	29	4,7005	4	1,79448	7,17792	16	4,68314	3,013
Σ	125	14,5301	0	0	17,7712	40		64,138

Середні значення параметрів:

;

Вибірковий коефіцієнт регресії:

Рівняння регресії:

; - 2,90602 = 0,44428(Х – 25);

= 0,44428Х – 8,20098

Середній квадрат відхилень та середньоквадратичне відхилення:

; S = 0,0462374

Вибіркове стандартне відхилення коефіцієнта регресії та розрахункове значення t – критерію для нього:

;

Отримане значення t_р значно більше t_т = 3,18 для f = 3 i q = 5%, тобто в є значимим.

Шляхом потенціювання отримуємо модель в натуральному масштабі:

lnУ = 0,44428Х – 8,20098;

Другий підхід полягає у використанні полінома другого порядку:

У = а + вХ + сХ².

Тут замість спрямлення даних виконується додавання третьої змінної – квадрату Х. Тим самим задача зводиться до використання множинної регресії. Процес обчислення є однаковим, але тут в якості незалежних змінних фігурують Х та Х². Замість Х² можуть бути взяті , lnX, і т. д.

В регресивному аналізі дослідного масиву може бути використаний також метод Брандона. За цим методом шукають рівняння у вигляді:

де і = 1, 2, …, К – номер незалежної змінної об’єкту досліджень;

К – їх кількість.

Для двох змінних рівняння має вигляд:

Обробка масиву виконується послідовно по кожному параметру. Спочатку визначають параметри рівняння регресії:

f₁(X₁) = = ,

де та - середні значення У та Х₁ за вибіркою;

- коефіцієнт регресії Х₁ на У;

х₁ = Х₁ - ; у = У - - відхилення параметрів від середніх значень.

Потім оцінюють різницю між експериментальними та розрахунковими даними d_x1
y = У - , визначають суму їх квадратів , середньоквадратичне відхилення , стандартну помилку коефіцієнта і розрахункове значення критерію Стьюдента .

Якщо t₁ > t_т для числа ступенів свободи (N – 1), то складають вибірку нової величини:

В разі невиконання вказаної умови приймають У₂ = У, оскільки коефіцієнт регресії в₁ є не значимим і повинен відсіюватися.

Вважаючи залежність лінійною, знаходять величини:

; ; ; ;

і складають рівняння регресії:

Аналогічно, як і для в₁, перевіряють значимість коефіцієнта в₂ послідовним визначенням величин:

d_x2
y2 = У₂ - ; ; ; ; .

Якщо коефіцієнт в₁ був на першому етапі відсіяний, то в знаменнику формули для визначення треба взяти величину (N –1).

Умовою значимості в₂ є співвідношення: t₂ > t_т .

Потім оцінюють відхилення від регресії за кожним u – тим дослідом , визначають середнє його значення: та записують рівняння в кінцевому вигляді: з урахуванням відсіяних коефіцієнтів.

За означеною процедурою виконується складання рівняння множинної регресії і для більшої кількості змінних об’єкту.

<<< < Предыдущая 8 9 10 11 12 13 14 15 16 17 18 1920 / 4320 21 22 23 24 25 26 27 28 29 30 31 32 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
12.02.20161.04 Mб22Класифікація забруднень.doc
#
04.09.20192.97 Mб2Клин ди@гностик@.doc
#
19.11.2019340.48 Кб4КН 11 часть 2.doc
#
10.11.2019723.97 Кб10КН-11. часть 1.doc
#
12.02.20164.25 Mб31Книга Фин. рынок.doc
#
15.11.20194.64 Mб13Книга1 МОНД.doc
#
12.02.20169.79 Mб17Кокс и химия, № 1 2010.doc
#
12.02.20169.99 Mб14Кокс и химия, № 10 2010.doc
#
12.02.20169.44 Mб15Кокс и химия, № 12 2010.doc
#
12.02.20169.48 Mб14Кокс и химия, № 4 2010.doc
#
12.02.20169.41 Mб24Кокс и химия, № 8 2010.doc

. Кореляційний аналіз дослідних даних

Апроксимація експериментальних даних