
- •Аналіз даних лабораторні роботи
- •Лабораторна робота 1. Дисперсійний аналіз
- •1.4.4 Розподіл станків за продуктивністю.
- •Лабораторна робота 2. Кореляційний аналіз
- •2.3.8 Розрахунок множинних коефіцієнтів кореляції. З’ясуємо наявність багатовимірних лінійних залежностей між перемінними. Розрахункова формула:
- •Лабораторна робота 3. Проста лінійна регресія
- •Лабораторна робота 4. Мультілінійна регресія
- •1) На практиці у таких випадках за залежні вважають такі перемінні, які важче вимірювати.
2.3.8 Розрахунок множинних коефіцієнтів кореляції. З’ясуємо наявність багатовимірних лінійних залежностей між перемінними. Розрахункова формула:
,
(2.5)
де det( R ) – визначник кореляційної матриці,
Rii – алгебраїчне доповнення елементу (і,і) кореляційної матриці.
Слід самостійно скласти і записати програму розрахунків коефіцієнту множинної кореляції і навести її у звіті про роботу.
Для згаданого прикладу значення коефіцієнтів множинної кореляції по кожної з перемінних наведені у таблиці 2.4.
Значні величини коефициєнтів множинної кореляції (коефіцієнтів детермінації) по більшості з перемінних свідчать про наявність сильного лінійного багатопараметрового зв’язку між переміними, тобто, що на основі наведених даних можна створити лінійну модель.
Таблиця 2.4
i |
Rii |
Det R |
i |
1 |
0,00022272 |
3,74296E-05 |
0,83194 |
2 |
4,3856E-05 |
3,74296E-05 |
0,14653 |
3 |
0,003889 |
3,74296E-05 |
0,99038 |
4 |
0,00056616 |
3,74296E-05 |
0,93389 |
5 |
0,0009974 |
3,74296E-05 |
0,96247 |
6 |
0,00261237 |
3,74296E-05 |
0,98567 |
7 |
0,00011958 |
3,74296E-05 |
0,68699 |
8 |
0,00018116 |
3,74296E-05 |
0,79339 |
9 |
4,9015E-05 |
3,74296E-05 |
0,23636 |
2.4 Вибір варіанту
2.4.1 Вхідні дані одержуються за допомогою програми-генератору даних за допомогою викладача і копіюються у власну робочу книгу.
2.4.2 При виконанні роботи та її оформленні дотримуватися порядку розрахунків та вимог розділу 2.3
2.5 Контрольні запитання
1 Що таке “кореляційний зв’язок”, що він відображає?
2 Яка величина характеризує наявність кореляційного зв’язку між двома перемінними? Наведіть формулу для розрахунку цей величини.
3 У яких межах змінюється коєфіціент парної кореляції? Як можна його розрахувати у середовищі Excel?
4 Наведіть кількісні градації коефіцієнту кореляції, їх зміст
5 Наведіть зміст поняття “множинна кореляція”. Якими величинами вона характеризується кількісно?
6 Зміст поняття “частинний коефіцієнт кореляції”, його розрахунки.
7 Зміст поняття “множинний коефіцієнт кореляції”, його розрахунки.
8 Зміст поняття “значимість коефіцієнта кореляції”.
9 Як перевірити значимість коефіцієнту кореліцїї
10 Зміст поняття “кореляційна матриця”, її властивості.
11 Як побудувати кореляційну матрицю у середовищі Excel?
12 Принципи побудови програми для розрахунку коефіцієнтів множинної кореляції та часткових коефіцієнтів кореляції.
Лабораторна робота 3. Проста лінійна регресія
3.1 Мета роботи: побудувати за експериментальними даними регресій ні моделі лінійного типу або ті, що зводяться до лінійних і провести їх дослідження.
3.2 Постановка задачі
3.2.1 Для створення системи управління процесом випаровування розчину неорганічної речовини необхідно мати рівняння, що пов’язує розчинність цей речовини (г/100 г води) з температурою. Задано експериментальну залежність розчинності від температури в діапазоні 0- 100оС. Слід підібрати і проаналізувати модель процесу.
3.2.2 Вам доручено побудувати за експериментальними даними математичну модель, яка б описувала залежність вихідної перемінної Y від вхідної перемінної Х у вигляді лінеаризуємої моделі наступного вигляду:
квадратична;
експоненційна,
показникові,
дрібно-лінійна.
Слід обрати найкращу модель за величиною коефіцієнту детермінації.
3.3 Теоретична частина
3.3.1 Теоретичні основи регресійного аналізу викладено у розділі 4 лекційного курсу.
3.3.2 При оформленні роботи у звіті слід стисло навести визначення основних понять і базові формули для розрахунків.
3.3.3 Студент повинен знати відповіді на контрольні запитання, що наведені у підрозділі 3.5
3.4 Порядок виконання роботи
3.4.1 Порядок виконання роботи і оформлення наведені нижче.
3.4.2 Перша частина роботи – побудувати та дослідити модель розчинності нитрату барію. Дані наведено у таблиці 3.1
Таблиця 3.1 – Залежність розчинності нітрату барію (Х, г/100 г) від температури (t,oC)
t |
0 |
10 |
20 |
30 |
40 |
50 |
60 |
70 |
80 |
90 |
100 |
X |
5 |
7 |
9,2 |
11,6 |
14,2 |
17,1 |
20,3 |
23,6 |
27 |
30,6 |
34,2 |
3.4.2 Перший крок – побудова точкового графіку залежності Х від t (рис. 3.1)
Рисунок 3.1
З рисунку 3.1 випливає, що дані групуються навколо деякої прямої, тому, у першому наближенні, можна описати дані прямолінійною залежністю.
3.4.2 Побудова рівняння лінійної регресії.
а) За допомогою функцій ОТРЕЗОК() і НАКЛОН() знаходимо коефіцієнти А0, А1 рівняння регресії:
=
А0
+ А1t.
(3.1)
б) Розраховуємо за рівнянням (3.1) значення і у кожній точці.
в) Розраховуємо у кожній точці квадрати різностей:
і2 = (Xi - і )2 (3.2)
г) Знаходимо залишкову суму квадратів відхилень і остаточну дисперсію.
д) Розраховуємо для вибірки Х вибіркове середнє та вибіркову дисперсію. На основі вибіркової дисперсії розраховуємо загальну суму квадратів відхилень.
3.4.3 Оцінка значимості рівняння регресії:
а) Розраховуємо суму квадратів відхилень, що обумовлена регресією оскільки ця дисперсія має кількість ступенів воли 1, ця величина співпадає з дисперсією відносно регресії.
б) Розраховуємо відношення Фішера (відношення дисперсії відносно регресії до залишкової дисперсії)
в) За допомогою функції Fраспобр() розраховуємо критичну точку розподілу Фішера для рівня значимості =0,05 і кількості ступенів волі k1=1 і k2=11 – 2 = 9.
г) Оскільки критичне значення набагато менше за розрахункове, робимо висновок, що регресія є значимою.
3.4.4 Приклад розрахунків наведено на скриншоті (рис. 3.2). Формули комірок:
G4: =ОТРЕЗОК(C6:C16;B6:B16);
H4: =НАКЛОН(C6:C16;B6:B16);
I4: =СРЗНАЧ(C6:C16);
J4: =ДИСП(C6:C16);
K4: =J4*(A16-1);
L4: =1-E17/K4;
Рисунок 3.2
D6:D16 =$G$4+$H$4*B6;
E6:E16 =(C6-D6)^2;
E17: =СУММ(E6:E16);
E18: =E17/(A16-2);
G18: =E18^0,5
G7: =K4;
H7: =E17;
I7: =G7-H7;
J7: =I7/E18;
G9: =FРАСПОБР(I9;G9;H9).
В інші комірки дані заносяться вручну.
3.4.5 Встановлення значимості коефіцієнтів регресії:
а) Розраховуємо головний визначник системи рівнянь методу найменших квадратів за формулою:
D = det(tTt), (3.3)
де t – матриця –стовпець вхідних даних, у якому:
1) усі елементи першого стовпця дорівнюють 1,
2) елементи другого стовпця дорівнюють поточним значенням температури ti.
б) Розраховуємо визначники мінорів Di, що одержуються шляхом вилучення з матриці головного визначнику (3.3) і-го рядку та і-го стовпця. Значення і=1 відповідає коефіцієнту А0, і=2 – коефіцієнту А1.
в) Розраховуємо стандартні відхилення коефіцієнтів за формулами:
,
(3.5)
,
(3.6)
де sзал – залишкове середньоквадратичне відхилення.
г) Для кожного з коефіцієнтів розраховуємо t-відношення:
.
(3.7)
д) За допомогою функції СТЬЮДРАСПОБР() розраховуємо tcr - критичне значення критерію Стьюдента за рівнем значимості 0,05 та кількістю ступенів волі k=n-2.
e) Порівняємо значення ti з tcr:
1) Якщо ti > tcr – коефіцієнт значимо відрізняється від нуля.
2) Якщо ti < tcr – коефіцієнт не значимо відрізняється від нуля (коефіцієнт не значимий).
3.4.6 Приклад розрахунків наведено на скріншоті (рис. 3.3). У цьому прикладі формули комірок:
E3:F4 ={МУМНОЖ(ТРАНСП(B4:C14);B4:C14)} (масив);
H3: =МОПРЕД(E3:F4);
E6: =F4;
Рисунок 3.3
Е11: =H6*(E6/H3)^0,5;
F11: =H6*(E7/H3)^0,5;
E12: =E10/E11;
F12: =F10/F11;
G12: =СТЬЮДРАСПОБР(G12;H12).
В інші комірки значення уводяться вручну або шляхом копіювання з інших робочих аркушів.
3.4.5 Висновоки:
а) Усі коефіцієнти регресії є значимими.
б) Оскільки рівняння регресії є значимим, це означає, що рівняння лінійної регресії задовільно описує дані і може бути використано за призначенням для вирішення практичних завдань (створення керування технічною системою)
3.4.6 Друга частина – підбір лінійної залежності за наступними даними:
Х |
0 |
1 |
2 |
3 |
6 |
12 |
18 |
42 |
165 |
Y |
0 |
35 |
48 |
55 |
67 |
75 |
80 |
88 |
96 |
а) Будуємо графік залежності (рис. 3.4)
Рисунок 3.4
З рисунку випливає, що залежність є суто нелінійною. Крім того, крива повинна проходити через початок координат. Виходячи з цього, проаналізуємо деякі стандартні криві як потенційні для апроксимації даних:
1) Поліном – потенційно поліном без вільного члену можна використовувати.
2) Експоненціальна залежність: Y = AeBX є принципово непридатною, оскільки вона не проходить через початок координат.
3) Степенева залежність Y = AXB є принципово придатною
4) Дробова функція
також проходить через початок координат,
тому вона є потенційно придатною
3.4.7 Поліноміальна апроксимація: за допомогою Майстра діаграм будуємо методом найменших квадратів поліноміальний тренд для ступеню n = 2 та 3. Порядок побудови тренду:
а) Викликаємо Майстра діаграм, будуємо точкову діаграму.
б) Наводимо курсор на одну з точок рисунку і натискуємо ліву кнопку миша. У меню, но зявилося, обираємо опцію “Добавить линию тренда”.
в) У меню тренда обираємо поліномаільну апроксимацію, встановлюємо степінь поліному (2 та 3) і натискуємо на кнопку “Параметри”.
г) У меню “Параметри” (рис. 3.5) встановити:
Рисунок 3.5 – Меню параметрів лінії тренда
- пересічення з віссю Y у точці 0;
- показувати рівняння на діаграмі;
- показати на діаграмі достовірність апроксимації R^2 (коефіцієнт детермінації)
На рис. 3.6 наведено графік найкращого полінома 3-го ступеню. Як випливає з рис. 3.6, поліном погано описує залежність. Описання є якісно невірним, оскільки апроксимуюча крива має екстремуми, у той час, як цього явно не випливає з експериментальної залежності.
Рисунок 3.6 – Поліноміальна апроксимація (поліном 3-го ступеня)
3.4.8 Степенева залежність Y = AXB є стандартною у Майстрі діаграм, тому немає необхідності проводити перетворення координат. Однак слід вилучити точку (0,0), бо розрахунки проводяться через логарифми.
а) Будуємо точковий графік, обираємо лінію тренда
б) У меню лінії тренда обираємо степеневу функцію, у меню параметрів встановлюємо опції:
- показувати рівняння на діаграмі;
- показати на діаграмі достовірність апроксимації R^2
Одержуємо графік (рисунок 3.7)
З рисунку (3.7) випливає, що графік якісно вірно передає хід експериментальної кривої, однак розбіжності між експериментальними точками та кривою достатньо великі. Наприкінці кривої немає тенденції до насичення.
Рисунок 3.7 – Степенева апроксимація
3.4.9 Дробно-лінійна апроксимація. Приведемо функцію до лінійного виду. Для цього:
а) Проведемо обернення обох частин виразу:
.
(3.8)
б) Якщо позначити: z=1/Y, u =1/X; C1= 1/A; C0 = B/A, то рівняння (3.8) можна переписати у виді:
z = C1u + C0, (3.9)
Рівняння (3.9) є лінійним. Тобто, якщо виконується дрібно-лінійна залежність між перемінними, слід очікувати наявності лінійної залежності у координатах 1/Y від 1/Х.
Розрахунки наведено на скриншоті (рис. 3.8).
3.4.10 З рис. 3.4.9 випливає, що:
а) Залежність між 1/Y та 1/X, дійсно, є лінійною, з коефіцієнтом кореляції, близьким до 1.
б) Параметри регресії: С0 = 0,0115; С1 = 0,0177. Звідсі для дрібно-лінійної функції:
А -= 1/С1 = 1/0,0177 = 56,5; В = С0А = 56,50,0115 = 0,65
Рисунок 3.8
Звідси рівняння дрібно-лінійної функції:
. (3.10)
3.5 Вибір варіантів
3.5.1 Варіанти завдання генеруються за допомогою програми генератору у присутності викладача і копіюються у власну робочу книгу
3.5.2 Розрахунки і оформлення роботи проводити за прикладом розділу 3.4, на робочому аркуші Еxcel або у середовищі Word, з доданням файлів Еxcel з розрахунковим проектом.
3.5.3 Наприкінці роботи повинні бути висновки з роботи.
3.6 Контрольні запитання
1 Який метод покладено до основи регресійного аналізу? Запишіть загальне рівняння.
2 Запишіть матричну форму методу найменших квадратів.
3 Наведить формули для розрахунків коефіцієнтив простій линийної регресії
4 Яким чином можна розраховувати коефіцієнти регресії в середовищі Excel? Наведіть 3 методу і надайте їь характеристику.
5 Для чого слід проводити дослідження рівняння регресії? Перелічите етапи дослідження.
6 Яка теорема лежить у основі дослідження значимості рівняння регресії?
7 Зміст поняття “значимість рівняння регресії”. Як його проводять?
8 Порядок проведення перевірки на значимість у Excel
9 Зміст поняття “значимість коефіцієнту”. Що слід робити, якщо коефіцієнт не є значимим?
10 За яким критеріїм встановлюють значимість коефіцієнтів. Порядок встановлення значимості у середовищі Excel.
11 Зміст поняття “адекватність моделі”. Принципи встановлення адекватності