Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LabМЗКИТ-Мах-Ukr09.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
216.06 Кб
Скачать

Контрольнi запитання

1. Навіщо необхідно перевіряти нормальність розподілу експериментальних даних і погрішностей математичних моделей?

2. Які існують методи перевірки розподілу масиву експериментальних даних?

3. Які існують можливості перевірки нормальності розподілу масивів даних у системі Maxima?

4. Як можна одержати критерій згоди для перевірки значимості коефіцієнтів асиметрії й ексцесу?

5. Що представляє із себе об'єкт типу гістограми у системі Maxima і як його можна одержати?

Методика виконання роботи

1.Завантажити систему Maxima і створити локумент.

2.Визначити статистичні характеристики для масиву даних за завданням викладача.

3.Перевірити значимість отриманих коефіцієнтів асиметрії й ексцесу для заданого масиву даних і зробити висновок о нормальності розподілу.

4.Побудувати гістограми для заданих масивів даних і зробити висновок о нормальності розподілу.

Додадок 2.1

Перевірка нормальності розподілу отриманих експериментальних результатів і випадкових погрішностей є необхідною умовою подальшої застосовності методів статистичного аналізу і побудови статистичних моделей. Існує цілий ряд різних критеріїв для рішення цієї проблеми.

У системі Maxima реалізован тест Шапіро-Вілка для перевірки нормальності розподілу вибірки даних за допомогою функції test_normality (x), яка знаходиться у пакеті розширення stats.

Функция test_normality (x)

Повертає об’єкт Maxima inference_result з наступними результатами:

1. statistic: значення W статистики;

2. p_value: значення параметра p на користь припущення про нормальність розподілу.

Значення p рахується шляхом порівняння отриманної статистики з t розподілом.

Аргумент x є масив даних у вигляді листа розміром більш ніж 2 і меньш ніж 5000 значень.

Приклад:

(%i1) load("stats")$

(%i2) x:[12,15,17,38,42,10,23,35,28]$

(%i3) test_normality(x);

| SHAPIRO - WILK TEST

|

(%o3) | statistic = .9251055695162436

|

| p_value = .4361763918860381

Також перевірку того, підкоряється отримана вибірка нормальному розподілу, чи ні, роблять шляхом визначення значень вищих центральних моментів вибірки і побудови гістограми вибірки. Найбільше часто використовують обчислення таких параметрів вибірки даних як коефіцієнт асиметрії А і коефіцієнт ексцесу Е.

У Maxima відповідні функції skewness і kurtosis знаходяться в пакеті розширення descriptive, який загружається наступним чином:

load (descriptive)$.

Функція skewness (list)

skewness (matrix)

Повертає коефіцієнт ассиметрії A (або приведений третій центральний момент) m3 / s3 для масиву даних list або для кожного стовбця багатомірного масиву даних matrix.

Функція kurtosis (list)

kurtosis (matrix)

Повертає коефіцієнт ексцесу E (або приведений четвертий центральний момент) m4 / s4 для масиву даних list або для кожного стовбця багатомірного масиву даних matrix.

Далі необхідно підрахувати дисперсії цих величин по наступних формулах:

DA = 6(n–1) / (n+1)(n–3);

DE = 24(n–2)(n–3) / (n+1)2 (n+1)(n+5);

де n – кількість точек у масиві даних.

Зіставлення отриманих величин із критерієм згоди дозволяє зробити висновок про нормальність розподілу вибірки. Критерій згоди формулюється в такий спосіб: якщо коефіцієнти асиметрії й ексцесу задовольняють нерівностям

|A|  3 (DA )1/2 i |E|  5 (DE )1/2

то розподіл, що спостерігається, можна вважати нормальним.

Іншої, менш строгий, але більш наочний спосіб оцінки характеру розподілу складається в побудові гістограм - стовпчастих діаграм, що відбивають імовірність розподілу випадкових величин по окремих інтервалах значень. Функції для побудови спеціальних графіків знаходяться в пакетi розширення descriptive. Для побудови гістограм використують наступну функцію:

Функція histogram (Х1)

histogram (Х1, option 1, option 2, ...)

Масив даних Х1 повинен бути представлен у вигляді листа або у вигляді одностовбцевої матриці.

Опції:

outputdev, по замовченню "x", указує вихідний пристрій; можливі значення "x", "eps" и "png", які задають виведення на екран, або у файли у форматі postscript и png відповідно.

maintitle, по замовченню " ", основний підпис до малюнка, текст якого знаходиться між лапками.

axisnames, по замовченню ["x", "Fr."], лист, що містить написи до осей x і y.

picturescales, по замовченню [1.0, 1.0], масштабний множник для зміни розміру малюнка.

nclasses, по замовченню 10, число інтервалів, на які розбивається діапазон зміни досліджуваної величини (визначає число стовпців на гістограме).

relbarwidth, по замовченню 0.9, число в діапазоні між 0 і 1, що задає ширину стовпців.

barcolor, по замовченню 1, ціле число, що задає колір стобців.

colorintensity, по замовченню 1, число в діапазоні між 0 і 1, що задає інтенсивність кольору стовпців.

Приклади побудови гістограм.

(%i1) load (descriptive)$

(%i2) load (numericalio)$

(%i3) s1 : read_list (file_search ("pidigits.data"))$

(%i4) histogram (s1, maintitle = "pi digits",axisnames = ["", "Absolute frequency"], relbarwidth = 0.2,

barcolor = 3, colorintensity = 0.6)$

(%i5) s2 : [11,10,9,2,4,11,10,9,1,8,8,3,2,5,6,3,4,7,5,6,1,4,6,3,6,4,7,8,3,5,4,6,5,3,4,6]$

(%i6) histogram (s2, maintitle = "Распределение", axisnames = ["Ось Х", "Частоты"], relbarwidth = 0.9,

barcolor = 5, colorintensity = 0.9, nclasses = 11)$

Аналіз вигляду отриманої стовпчастої діаграми дозволяє зробити висновок, чи мають аналізуємі дані розподіл Гаусса, чі ні.

ЛАБОРАТОРНА РОБОТА № 3

ПРОВЕДЕННЯ СТАТИСТИЧНИХ ОЦІНОК РЕЗУЛЬТАТІВ ОБРОБКИ МАСИВІВ ДАНИХ У СИСТЕМІ МАХІМА

Мета роботи – вивчення можливостей отримання статистичних оцінок результатів первинної обробки масивів даних у системі комп'ютерної математики Maxima.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]