Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LabМЗКИТ-Мах-Ukr09.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
216.06 Кб
Скачать

Контрольнi запитання

1. Які існують алгоритми побудови лінійної регресійної моделі оптимальної структури?

2. Як можна провести оцінку значимості коефіцієнтів рівняння регресії у системі комп’ютерної математики Маxiма?

3. Які додаткові статистики можна отримати у результаті виконання функції simple_linear_regression ?

4. Як можна використовувати результати оцінки отриманого рівняння регресії для проведення подальшого статистичного аналізу?

Методика виконання роботи

  1. Завантажити систему Маxiма і створити локумент.

  2. Завантажити пакет розширення stats.

  3. Для заданого масиву даних побудувати лінійну регресійну модель.

  4. Побудувати графіки залежностей статистичних оцінок отриманої лінійної регресійної моделі за указівкою викладача.

Додадок 6.1.

Регресійний аналіз є одним з найбільш розповсюджених методів обробки результатів спостережень при вивченні залежностей у техніці, фізиці, економіки й інших областях. Ціль регресійного аналізу полягає у визначенні загального виду рівняння регресії, побудови статистичних оцінок невідомих коефіцієнтів, що входять у рівняння регресії, і перевірка вивконання статистичних гіпотез відносно регресії. У системі Maxima функції регресійного аналізу знаходяться у відповідних пакетах розширення (stats, lsquares).

Функція simple_linear_regression (Х)

simple_linear_regression (Х, option 1, …)

Визначає параметри рівняння одномірної лінійної регресії y = a + bx + ε, де ε - помилка регресійної моделі. Аргумент Х повинен бути або матрицею з двох стовбців у і х, або лист пар значеннь.

Опції:

conflevel, по замовченню 0.95, рівень значимості для довірчого інтервалу.

regressor, по замовченню x, ім‘я незалежної змінної.

Функція simple_linear_regression повертає об’єкт Maxima inference_result з наступними результатами:

1. model: оцінки коефіцієнтів рівняння регресії;

2. means: середні значення змінних;

3. variances: дисперсія для обох змінних;

4. correlation: коефіцієнт парної кореляції між х та у;

5. adc: скоректований коефіцієнт детермінації;

6. a_estimation: оцінка значення коефіціента регресії a;

7. a_conf_int: довірчий інтервал для коефіціента регресії a;

8. b_estimation: оцінка значення коефіціента регресії b;

9. b_conf_int: довірчий інтервал для коефіціента регресії a;

10. hypotheses: нульова й альтернативна гіпотези щодо значимості коефіціента регресії b;

11. statistic: значення вибіркової статистики, яке використане для перевірки нульової гіпотези;

12. distribution: використовуваний розподіл для оцінки вибіркової статистики разом з його параметрами;

13. p_value: p-значення щодо значимості коефіціента регресії b;

14. v_estimation: незміщена оцінка дисперсії моделі;

15. v_conf_int: довірчий інтервал для дисперсії моделі;

16. cond_mean_conf_int: довірчий інтервал для середнього значення залежної змінної;

17. new_pred_conf_int: довірчий інтервал для модельного середнього значення залежної змінної;

18. residuals: лист пар [модельне значення, залишок – різниця між експериментальним і модельним значеннями], упорядкований відносно модельних значеннь.

Тільки позіції 1, 4, 14, 9, 10, 11, 12, і 13 отриманого звіту виводятся по замовченню. Для виведення інших отриманих результатів використують наступні функції:

items_inference (obj) – повертає лист імен результатів, що знаходяться у obj.

take_inference (n, obj)

take_inference (name, obj)

take_inference (list, obj)

Повертає n- значення використуючи obj якщо n є позитивне ціле число, або отриманий параметр з назвою name. Якщо перший аргумент є ліст, який вміщає числа або/і символи, функція take_inference повертає ліст відповідних результатів.

Приклад:

Побудова одномірної лінійної моделі.

Вхідна комірка t %i4 будує графік, який вміщає точки та лінію регресії;

вхідна комірка %i5 рахує y для заданого значення x=113;

середне та довірчий інтервал для нового варианту, коли нова точка x=113 також рахується.

(%i1) load("stats")$

(%i2) s:[[125,140.7], [130,155.1], [135,160.3], [140,167.2], [145,169.8]]$

(%i3) z:simple_linear_regression(s,conflevel=0.99);

| SIMPLE LINEAR REGRESSION

|

| model = 1.405999999999985 x - 31.18999999999804

|

| correlation = .9611685255255155

|

| v_estimation = 13.57966666666665

|

(%o3) | b_conf_int = [.04469633662525263, 2.767303663374718]

|

| hypotheses = H0: b = 0 ,H1: b # 0

|

| statistic = 6.032686683658114

|

| distribution = [student_t, 3]

|

| p_value = 0.0038059549413203

(%i4) plot2d([[discrete, s], take_inference(model,z)], [x,120,150],[gnuplot_curve_styles, ["with points", "with lines"]] )$

(%i5) take_inference(model,z), x=133;

(%o5) 155.808

(%i6) take_inference(means,z);

(%o6) [135.0, 158.62]

(%i7) take_inference(new_pred_conf_int,z), x=133;

(%o7) [132.0728595995113, 179.5431404004887]

The output of a hypothesis test is a p-value, which is the probability of the sample estimate being as extreme as it is given that the hypothesized population parameter is true.

ЛАБОРАТОРНА РОБОТА № 7

НЕЛІНІЙНИЙ РЕГРЕСІЙНИЙ АНАЛІЗ ДАНИХ У СИСТЕМІ MAXIMA

Мета роботи – вивчення правил побудови нелінійних регресійних моделей на основі лінійних та нелінійних комбінацій заданих базових функцій і вибору оптимальної регресійної моделі у системі комп’ютерної математики Маximа.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]