- •Контрольнi запитання
- •Методика виконання роботи
- •Додадок 1.1
- •Контрольнi запитання
- •Методика виконання роботи
- •2.Визначити статистичні характеристики для масиву даних за завданням викладача.
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •3. Які існують способи завдання одномірних і багатомірних масивів даних у системі Maxima?
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
- •Контрольнi запитання
- •Методика виконання роботи
Контрольнi запитання
1. Навіщо необхідно перевіряти нормальність розподілу експериментальних даних і погрішностей математичних моделей?
2. Які існують методи перевірки розподілу масиву експериментальних даних?
3. Які існують можливості перевірки нормальності розподілу масивів даних у системі Maxima?
4. Як можна одержати критерій згоди для перевірки значимості коефіцієнтів асиметрії й ексцесу?
5. Що представляє із себе об'єкт типу гістограми у системі Maxima і як його можна одержати?
Методика виконання роботи
1.Завантажити систему Maxima і створити локумент.
2.Визначити статистичні характеристики для масиву даних за завданням викладача.
3.Перевірити значимість отриманих коефіцієнтів асиметрії й ексцесу для заданого масиву даних і зробити висновок о нормальності розподілу.
4.Побудувати гістограми для заданих масивів даних і зробити висновок о нормальності розподілу.
Додадок 2.1
Перевірка нормальності розподілу отриманих експериментальних результатів і випадкових погрішностей є необхідною умовою подальшої застосовності методів статистичного аналізу і побудови статистичних моделей. Існує цілий ряд різних критеріїв для рішення цієї проблеми.
У системі Maxima реалізован тест Шапіро-Вілка для перевірки нормальності розподілу вибірки даних за допомогою функції test_normality (x), яка знаходиться у пакеті розширення stats.
Функция test_normality (x)
Повертає об’єкт Maxima inference_result з наступними результатами:
1. statistic: значення W статистики;
2. p_value: значення параметра p на користь припущення про нормальність розподілу.
Значення p рахується шляхом порівняння отриманної статистики з t розподілом.
Аргумент x є масив даних у вигляді листа розміром більш ніж 2 і меньш ніж 5000 значень.
Приклад:
(%i1) load("stats")$
(%i2) x:[12,15,17,38,42,10,23,35,28]$
(%i3) test_normality(x);
| SHAPIRO - WILK TEST
|
(%o3) | statistic = .9251055695162436
|
| p_value = .4361763918860381
Також перевірку того, підкоряється отримана вибірка нормальному розподілу, чи ні, роблять шляхом визначення значень вищих центральних моментів вибірки і побудови гістограми вибірки. Найбільше часто використовують обчислення таких параметрів вибірки даних як коефіцієнт асиметрії А і коефіцієнт ексцесу Е.
У Maxima відповідні функції skewness і kurtosis знаходяться в пакеті розширення descriptive, який загружається наступним чином:
load (descriptive)$.
Функція skewness (list)
skewness (matrix)
Повертає коефіцієнт ассиметрії A (або приведений третій центральний момент) m3 / s3 для масиву даних list або для кожного стовбця багатомірного масиву даних matrix.
Функція kurtosis (list)
kurtosis (matrix)
Повертає коефіцієнт ексцесу E (або приведений четвертий центральний момент) m4 / s4 для масиву даних list або для кожного стовбця багатомірного масиву даних matrix.
Далі необхідно підрахувати дисперсії цих величин по наступних формулах:
DA = 6(n–1) / (n+1)(n–3);
DE = 24(n–2)(n–3) / (n+1)2 (n+1)(n+5);
де n – кількість точек у масиві даних.
Зіставлення отриманих величин із критерієм згоди дозволяє зробити висновок про нормальність розподілу вибірки. Критерій згоди формулюється в такий спосіб: якщо коефіцієнти асиметрії й ексцесу задовольняють нерівностям
|A| 3 (DA )1/2 i |E| 5 (DE )1/2
то розподіл, що спостерігається, можна вважати нормальним.
Іншої, менш строгий, але більш наочний спосіб оцінки характеру розподілу складається в побудові гістограм - стовпчастих діаграм, що відбивають імовірність розподілу випадкових величин по окремих інтервалах значень. Функції для побудови спеціальних графіків знаходяться в пакетi розширення descriptive. Для побудови гістограм використують наступну функцію:
Функція histogram (Х1)
histogram (Х1, option 1, option 2, ...)
Масив даних Х1 повинен бути представлен у вигляді листа або у вигляді одностовбцевої матриці.
Опції:
• outputdev, по замовченню "x", указує вихідний пристрій; можливі значення "x", "eps" и "png", які задають виведення на екран, або у файли у форматі postscript и png відповідно.
• maintitle, по замовченню " ", основний підпис до малюнка, текст якого знаходиться між лапками.
• axisnames, по замовченню ["x", "Fr."], лист, що містить написи до осей x і y.
• picturescales, по замовченню [1.0, 1.0], масштабний множник для зміни розміру малюнка.
• nclasses, по замовченню 10, число інтервалів, на які розбивається діапазон зміни досліджуваної величини (визначає число стовпців на гістограме).
• relbarwidth, по замовченню 0.9, число в діапазоні між 0 і 1, що задає ширину стовпців.
• barcolor, по замовченню 1, ціле число, що задає колір стобців.
• colorintensity, по замовченню 1, число в діапазоні між 0 і 1, що задає інтенсивність кольору стовпців.
Приклади побудови гістограм.
(%i1) load (descriptive)$
(%i2) load (numericalio)$
(%i3) s1 : read_list (file_search ("pidigits.data"))$
(%i4) histogram (s1, maintitle = "pi digits",axisnames = ["", "Absolute frequency"], relbarwidth = 0.2,
barcolor = 3, colorintensity = 0.6)$
(%i5) s2 : [11,10,9,2,4,11,10,9,1,8,8,3,2,5,6,3,4,7,5,6,1,4,6,3,6,4,7,8,3,5,4,6,5,3,4,6]$
(%i6) histogram (s2, maintitle = "Распределение", axisnames = ["Ось Х", "Частоты"], relbarwidth = 0.9,
barcolor = 5, colorintensity = 0.9, nclasses = 11)$
Аналіз вигляду отриманої стовпчастої діаграми дозволяє зробити висновок, чи мають аналізуємі дані розподіл Гаусса, чі ні.
ЛАБОРАТОРНА РОБОТА № 3
ПРОВЕДЕННЯ СТАТИСТИЧНИХ ОЦІНОК РЕЗУЛЬТАТІВ ОБРОБКИ МАСИВІВ ДАНИХ У СИСТЕМІ МАХІМА
Мета роботи – вивчення можливостей отримання статистичних оцінок результатів первинної обробки масивів даних у системі комп'ютерної математики Maxima.
