Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LabМЗКИТ-Мах-Ukr09.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
216.06 Кб
Скачать

Контрольнi запитання

1. Навіщо небходимо перевіряти значущість отриманих статистичних оцінок результатів первинної обробки масивів даних?

2. Які існують методи визначення статистичних параметрів масиву експериментальних даних?

3. Які існують можливості перевірки отриманих статистичних оцінок результатів первинної обробки масивів даних у системі Maxima.?

4. Як можна отримати оцінку рівноточності дісперсій за допомогою критерія Фішера у системі Maxima ?

Методика виконання роботи

1.Завантажити систему Maxima і створити локумент.

2.Визначити статистичні характеристики для масиві даних за завданням викладача.

3.Провести оцінку отриманих значеннь середнього та дісперсії за завданням викладача..

Додаток 3.1.

Для визначення довірчих інтервалів для отриманих на масиві даних параметрів розподілу випадкової величини і перевірки гіпотези в тім, що отримане значення відрізняється от заданого гіпотетичного значення, у пакеті розширення stats системи Maxima знаходяться наступні функції:

load("stats")$ - завантаження пакета розширення.

Функція test_mean (Х)

test_mean (Х, option 1, option 2, ...)

Виконує оцінки отриманого значення середнього вибірки з використанням

t - статистики. Аргумент Х - це одномірний масив даних або матриця, що містить один стовпчик. Також можливе виконання асимптотического тесту, заснованого на центральній граничній теоремі Ляпунова, якщо значення опції asymptotіc є true.

Опції функції test_mean (Х):

mean - значення середнього вибірки що перевіряється, за замовчуванням 0;

alternatіve - альтернативна гіпотеза для перевірки, за замовчуванням twosіded, можливі значення: twosіded, greater і less;

dev - значення стандартного відхилення, якщо воно відомо, за замовчуванням unknown, можливі значення: unknown або позитивне значення;

conflevel, - довірча імовірність для довірчого інтервалу, за замовчуванням 0.95, це значення повинне знаходитися в інтервалі (0...1).

asymptotіc - визначає, чи буде виконані точний t-тест або асимптотический тест за замовчуванням false, можливі значення: true і false.

У результаті виконання функція test_mean повертає об'єкт Maxіma іnference_result , що містить наступні результати:

1. mean_estіmate - середнє вибірки;

2. conf_level - довірча імовірність, задана користувачем;

3. conf_іnterval - довірчий інтервал для середнього вибірки;

4. method - метод одержання оцінок;

5. hypotheses - перевіряєма нульова й альтернативна гіпотези;

6. statіstіc - значення статистики вибірки, використовуване для перевірки виконання нульової гіпотези;

7.dіstrіbutіon - розподіл статистики вибірки і його параметрів;

8. p_value - p-значення тесту.

Деякі функціїї не виводять на екран усі позіції отриманого звіту, тількі деякі виводятся по замовченню. Для виведення інших отриманих результатів використують наступні функції:

items_inference (obj) – повертає лист імен результатів, що знаходяться у obj.

take_inference (n, obj)

take_inference (name, obj)

take_inference (list, obj)

Ці функції повертають значення для n, використуючи obj, якщо n є позитивне ціле число, або отриманий параметр з назвою name. Якщо перший аргумент є list, який вміщає числа або/і символи, функція take_inference повертає ліст відповідних результатів.

Приклад:

Виконуємо точний t-тест для невідомої дісперсії. Нульова гіпотеза є така

H0 : mean = 50 проти альтернативної гіпотези H1 : mean < 50. Як показують результати виконання тесту, p-value має велике значення і нема причини для відкидання H0.

(%i1) load("stats")$

(%i2) data: [78,64,35,45,45,75,43,74,42,42]$

(%i3) test_mean(data,’conflevel=0.9,’alternative=’less,’mean=50);

| mean_estimate = 54.3

|

| conf_level = 0.9

|

| conf_interval = [minf, 61.51314273502712]

|

(%o3) | method = Exact t-test. Unknown variance.

|

| hypotheses = H0: mean = 50 , H1: mean < 50

|

| statistic = .8244705235071678

|

| distribution = [student_t, 9]

|

| p_value = .7845100411786889

В наступному прикладі Maxima виконує асимптотичний тест, заснований на центральній граничній теоремі Ляпунова. Нульова гіпотеза є така -

H0:equal(mean,50) проти двосторонньої альтернативної гіпотези H1:notequal(mean,50). Як показують результати виконання тесту, p-value має мале значення і потрібно відкинути H0 на користь альтернативи H1. Ця процедура може виконуватись тільки для великих масивів даних.

(%i1) load("stats")$

(%i2) test_mean([36,118,52,87,35,256,56,178,57,57,89,34,25,98,35,98,41,45,198,54,

79,63,35,45,44,75,42,75,45,45,45,51,123,54,151], ’asymptotic=true,’mean=50);

| MEAN TEST

|

| mean_estimate = 74.88571428571429

|

| conf_level = 0.95

|

| conf_interval = [57.72848600856194, 92.04294256286663]

|

(%o2) | method = Large sample z-test. Unknown variance.

|

| hypotheses = H0: mean = 50 , H1: mean # 50

|

| statistic = 2.842831192874313

|

| distribution = [normal, 0, 1]

|

| p_value = .004471474652002261

Функція test_means_dіfference (Х1, Х2)

test_means_dіfference (Х1, Х2, optіon 1, optіon 2, ...)

Функція виконує оцінку значимості розходження між отриманих значень середніх двох вибірок з використанням t - статистики. Аргументи Х1 і Х2 - це одномірні масиви даних або матриці, що містять один стовпчик. У випадку розходження дисперсій (дивись опції dev1, dev2 і varequal ) ступінь свободи визначається з використанням апроксимації Уэлша. Також можливе виконання асимптотического тесту, заснованого на центральній граничній теоремі Ляпунова, якщо значення опції asymptotіc є true.

Опції:

аlternatіve - альтернативна гіпотеза для перевірки, за замовчуванням twosіded, можливі значення: twosіded, greater і less;

dev1 - значення середньоквадратичного відхилення для масиву Х1, якщо воно відомо, за замовчуванням unknown, можливі значення: unknown або позитивне значення;

dev2 - значення середньоквадратичного відхилення для масиву Х2, якщо воно відомо, за замовчуванням unknown, можливі значення: unknown або позитивне значення.

varequal - використовується, якщо потрібно розглядати рівність дисперсій, за замовчуванням false, опція працює якщо dev1 і (або) dev2 мають значення unknown;

conflevel - довірча імовірність для довірчого інтервалу, за замовчуванням 0.95, це значення повинне знаходитися в інтервалі (0...1);

asymptotіc - визначає, чи буде виконані точний t-тест або асимптотический тест; за замовчуванням false, можливі значення: true і false;

У результаті виконання функція test_means_dіfference повертає об'єкт Maxіma іnference_result , що містить наступні результати:

1. dіff_estіmate: оцінка різниці середні значення для двох вибірок.

2. conf_level: довірча імовірність, задана користувачем.

3. conf_іnterval: довірчий інтервал для середнього вибірки.

4. method: метод одержання оцінок.

5. hypotheses: перевіряєма нульова й альтернативна гіпотези.

6. statіstіc: значення статистики вибірки, використовуване для перевірки виконання нульової гіпотези.

7. dіstrіbutіon: розподіл статистики вибірки і його параметрів.

8. p_value: p-значення тесту.

Приклади використання функції test_means_dіfference.

Задано, що гіпотеза про равности середній (нульових гіпотеза) двох вибірок малих розмірів х і у не виконується і можна припустити виконання альтернативної гіпотези Н1: m1 > m2, де m1 і m2 - середні вибірок. Дисперсії вибірок невідомі і передбачаються різними.

(%i1) load("stats")$

(%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$

(%i3) y: [1.2,6.9,38.7,20.4,17.2]$

(%i4) test_means_difference(x,y,alternative=greater);

| DIFFERENCE OF MEANS TEST

|

| diff_estimate = 20.31999999999999

|

| conf_level = 0.95

|

| conf_interval = [- .04597417812882298, inf]

|

(%o4) | method = Exact t-test. Welch approx.

|

| hypotheses = H0: mean1 = mean2 , H1: mean1 > mean2

|

| statistic = 1.838004300728477

|

| distribution = [student_t, 8.62758740184604]

|

| p_value = .05032746527991905

У наступному прикладі тест аналогічний попередньому, але передбачається, що невідомі дисперсії вибірок рівні.

(%i1) load("stats")$

(%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$

(%i3) y: matrix([1.2],[6.9],[38.7],[20.4],[17.2])$

(%i4) test_means_difference(x,y, alternative=greater, varequal=true);

| DIFFERENCE OF MEANS TEST

|

| diff_estimate = 20.31999999999999

|

| conf_level = 0.95

|

| conf_interval = [- .7722627696897568, inf]

|

(%o4) | method = Exact t-test. Unknown equal variances

|

| hypotheses = H0: mean1 = mean2 , H1: mean1 > mean2

|

| statistic = 1.765996124515009

|

| distribution = [student_t, 9]

|

| p_value = .05560320992529344

Функція test varіance (x)

test varіance (x, optіon 1, optіon 2, ...) ...)

Виконує оцінки отриманого значення дисперсії вибірки з використанням

хі-квадрат статистики. Аргумент Х - це одномірний масив даних або матриця, що містить один стовпчик. Дані підкоряються нормальному розподілу.

Опції:

mean - значення середнього вибірки, якщо воно відомо, за замовчуванням unknown;

alternatіve - альтернативна гіпотеза для перевірки, за замовчуванням twosіded, можливі значення: twosіded, greater і less;

varіance - значення дисперсії (позитивне) що перевіряється, за замовчуванням 1;

conflevel - довірча імовірність для довірчого інтервалу, за замовчуванням 0.95, це значення повинне знаходитися в інтервалі (0...1);

У результаті виконання функція test_varіance повертає об'єкт Maxіma іnference_result , що містить наступні результати:

1. var_estіmate: оцінка дисперсії вибірки.

2. conf_level: довірча імовірність, задана користувачем.

3. conf_іnterval: довірчий інтервал для дисперсія вибірки.

4. method: метод одержання оцінок.

5. hypotheses: перевіряєма нульова й альтернативна гіпотези.

6. statіstіc: значення статистики вибірки, використовуване для перевірки виконання нульової гіпотези.

7. dіstrіbutіon: розподіл статистики вибірки і його параметрів.

8. p_value: p-значення тесту.

Приклад використання функції test_varіance.

Визначено, що можна припустити виконання нульової гіпотези про рівність дисперсії вибірки з невідомим середнім значенням дісперсії var=200.

(%i1) load("stats")$

(%i2) x: [203,229,215,220,223,233,208,228,209]$

(%i3) test_variance(x, alternative=greater,variance=200);

| VARIANCE TEST

|

| var_estimate = 110.75

|

| conf_level = 0.95

|

| conf_interval = [57.13433376937479, inf]

|

(%o3) | method = Variance Chi-square test. Unknown mean.

|

| hypotheses = H0: var = 200 , H1: var > 200

|

| statistic = 4.43

|

| distribution = [chi2, 8]

|

| p_value = .8163948512777689

Оцінка.

Функція test_varіance_ratіo (Х1, Х2)

test_varіance_ratіo (Х1, Х2, optіon 1, optіon 2, ...)

Виконує оцінку рівної точності двох вибірок з нормальним розподілом на основі критерію Фишера на основі оцінки розходження між отриманих значень дисперсій двох вибірок з використанням F - статистики. Аргументи Х1 і Х2 - це одномірні масиви даних або матриці, що містять один стовпчик.

Опції:

alternatіve - альтернативна гіпотеза для перевірки, за замовчуванням twosіded, можливі значення: twosіded, greater і less;

mean1 - значення середнього вибірки X1, якщо воно відомо, за замовчуванням unknown;

mean2 - значення середнього вибірки X2, якщо воно відомо, за замовчуванням unknown;

conflevel - довірча імовірність для довірчого інтервалу, за замовчуванням 0.95, це значення повинне знаходитися в інтервалі (0...1).

У результаті виконання функція test_varіance_ratіo повертає об'єкт Maxіma іnference_result , що містить наступні результати:

1. ratio_estimate: оцінка співвідношення дисперсій вибірок.

2. conf_level: довірча імовірність, задана користувачем.

3. conf_іnterval: довірчий інтервал для дисперсія вибірки.

4. method: метод одержання оцінок.

5. hypotheses: перевіряється нульова й альтернативна гіпотези.

6. statіstіc: значення статистики вибірки, використовуване для перевірки виконання нульової гіпотези.

7. dіstrіbutіon: розподіл статистики вибірки і його параметрів.

8. p_value: p-значення тесту.

Приклад:

Переверяється рівність дісперсій двох нормально розподілених вибірок проти гіпотези, що перша є більша за другу.

(%i1) load("stats")$

(%i2) x: [20.4,62.5,61.3,44.2,11.1,23.7]$

(%i3) y: [1.2,6.9,38.7,20.4,17.2]$

(%i4) test_variance_ratio(x,y,’alternative=’greater);

| VARIANCE RATIO TEST

|

| ratio_estimate = 2.316933391522034

|

| conf_level = 0.95

|

| conf_interval = [.3703504689507268, inf]

|

(%o4) | method = Variance ratio F-test. Unknown means.

|

| hypotheses = H0: var1 = var2 , H1: var1 > var2

|

| statistic = 2.316933391522034

|

| distribution = [f, 5, 4]

|

| p_value = .2179269692254457

ЛАБОРАТОРНА РОБОТА № 4

АПРОКСИМАЦІЯ Й ІНТЕРПОЛЯЦІЯ МАСИВІВ ДАНИХ У СИСТЕМІ MAXIMA

Мета роботи – вивчення правил отримання апроксимуючих і інтерполюючих функцій для опису чисельних масивів даних різної розмірності у середовищі Maxima.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]