
- •Контрольнi запитання
- •Методика виконання роботи
- •Додадок 1.1
- •Контрольнi запитання
- •Методика виконання роботи
- •2.Визначити статистичні характеристики для масиву даних за завданням викладача.
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •3. Які існують способи завдання одномірних і багатомірних масивів даних у системі Maxima?
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
Контрольнi запитання
1. Які існують алгоритми побудови лінійної регресійної моделі оптимальної структури?
2. Як можна провести оцінку значимості коефіцієнтів рівняння регресії у системі комп’ютерної математики Маxiма?
3. Які додаткові статистики можна отримати у результаті виконання функції simple_linear_regression ?
4. Як можна використовувати результати оцінки отриманого рівняння регресії для проведення подальшого статистичного аналізу?
Методика виконання роботи
Завантажити систему Маxiма і створити локумент.
Завантажити пакет розширення stats.
Для заданого масиву даних побудувати лінійну регресійну модель.
Побудувати графіки залежностей статистичних оцінок отриманої лінійної регресійної моделі за указівкою викладача.
Додадок 6.1.
Регресійний аналіз є одним з найбільш розповсюджених методів обробки результатів спостережень при вивченні залежностей у техніці, фізиці, економіки й інших областях. Ціль регресійного аналізу полягає у визначенні загального виду рівняння регресії, побудови статистичних оцінок невідомих коефіцієнтів, що входять у рівняння регресії, і перевірка вивконання статистичних гіпотез відносно регресії. У системі Maxima функції регресійного аналізу знаходяться у відповідних пакетах розширення (stats, lsquares).
Функція simple_linear_regression (Х)
simple_linear_regression (Х, option 1, …)
Визначає параметри рівняння одномірної лінійної регресії y = a + bx + ε, де ε - помилка регресійної моделі. Аргумент Х повинен бути або матрицею з двох стовбців у і х, або лист пар значеннь.
Опції:
• conflevel, по замовченню 0.95, рівень значимості для довірчого інтервалу.
• regressor, по замовченню x, ім‘я незалежної змінної.
Функція simple_linear_regression повертає об’єкт Maxima inference_result з наступними результатами:
1. model: оцінки коефіцієнтів рівняння регресії;
2. means: середні значення змінних;
3. variances: дисперсія для обох змінних;
4. correlation: коефіцієнт парної кореляції між х та у;
5. adc: скоректований коефіцієнт детермінації;
6. a_estimation: оцінка значення коефіціента регресії a;
7. a_conf_int: довірчий інтервал для коефіціента регресії a;
8. b_estimation: оцінка значення коефіціента регресії b;
9. b_conf_int: довірчий інтервал для коефіціента регресії a;
10. hypotheses: нульова й альтернативна гіпотези щодо значимості коефіціента регресії b;
11. statistic: значення вибіркової статистики, яке використане для перевірки нульової гіпотези;
12. distribution: використовуваний розподіл для оцінки вибіркової статистики разом з його параметрами;
13. p_value: p-значення щодо значимості коефіціента регресії b;
14. v_estimation: незміщена оцінка дисперсії моделі;
15. v_conf_int: довірчий інтервал для дисперсії моделі;
16. cond_mean_conf_int: довірчий інтервал для середнього значення залежної змінної;
17. new_pred_conf_int: довірчий інтервал для модельного середнього значення залежної змінної;
18. residuals: лист пар [модельне значення, залишок – різниця між експериментальним і модельним значеннями], упорядкований відносно модельних значеннь.
Тільки позіції 1, 4, 14, 9, 10, 11, 12, і 13 отриманого звіту виводятся по замовченню. Для виведення інших отриманих результатів використують наступні функції:
items_inference (obj) – повертає лист імен результатів, що знаходяться у obj.
take_inference (n, obj)
take_inference (name, obj)
take_inference (list, obj)
Повертає n- значення використуючи obj якщо n є позитивне ціле число, або отриманий параметр з назвою name. Якщо перший аргумент є ліст, який вміщає числа або/і символи, функція take_inference повертає ліст відповідних результатів.
Приклад:
Побудова одномірної лінійної моделі.
Вхідна комірка t %i4 будує графік, який вміщає точки та лінію регресії;
вхідна комірка %i5 рахує y для заданого значення x=113;
середне та довірчий інтервал для нового варианту, коли нова точка x=113 також рахується.
(%i1) load("stats")$
(%i2) s:[[125,140.7], [130,155.1], [135,160.3], [140,167.2], [145,169.8]]$
(%i3) z:simple_linear_regression(s,conflevel=0.99);
| SIMPLE LINEAR REGRESSION
|
| model = 1.405999999999985 x - 31.18999999999804
|
| correlation = .9611685255255155
|
| v_estimation = 13.57966666666665
|
(%o3) | b_conf_int = [.04469633662525263, 2.767303663374718]
|
| hypotheses = H0: b = 0 ,H1: b # 0
|
| statistic = 6.032686683658114
|
| distribution = [student_t, 3]
|
| p_value = 0.0038059549413203
(%i4) plot2d([[discrete, s], take_inference(model,z)], [x,120,150],[gnuplot_curve_styles, ["with points", "with lines"]] )$
(%i5) take_inference(model,z), x=133;
(%o5) 155.808
(%i6) take_inference(means,z);
(%o6) [135.0, 158.62]
(%i7) take_inference(new_pred_conf_int,z), x=133;
(%o7) [132.0728595995113, 179.5431404004887]
The output of a hypothesis test is a p-value, which is the probability of the sample estimate being as extreme as it is given that the hypothesized population parameter is true.
ЛАБОРАТОРНА РОБОТА № 7
НЕЛІНІЙНИЙ РЕГРЕСІЙНИЙ АНАЛІЗ ДАНИХ У СИСТЕМІ MAXIMA
Мета роботи – вивчення правил побудови нелінійних регресійних моделей на основі лінійних та нелінійних комбінацій заданих базових функцій і вибору оптимальної регресійної моделі у системі комп’ютерної математики Маximа.