Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб2_в.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
708.61 Кб
Скачать

Лабораторна робота № 2 Основи аналізу даних

Мета. Навчитись отримувати та аналізувати показники описової статистики, визначати міру зв’язку між двома вибірками (коваріація та коефіцієнт кореляціїї) та декількома вибірками (кореляційна матриця) за допомогою Excel.

Частина 1. Описова статистика

Метою описової статистики є узагальнити первинні результати, отримані в результаті спостережень і експериментів.

Нехай задано набір даних, представлений в таблиці:

x

y

1

9

2

7

2

12

2

15

2

17

3

19

4

21

5

23,4

6

25,6

6

27,8

Табл.1

Необхідно отримати статистичний звіт, який містить інформацію про центральну тенденцію та мінливість (варіацію) вхідних даних. Для отримання статистичного звіту, представленого в табл. 2, необхідно виконати дії:

  1. Відмітити діапазон вхідних даних

  2. Аналіз даних, описова статистика

  3. Вкладка “вхідний інтервал” – активізувати комірку, з якої почнеться виведення результату

  4. Поставити перемикач у вкладці “Итоговая статистика”

x

 

y

 

Среднее

3,3

Среднее

17,68

Стандартная ошибка

0,578312

Стандартная ошибка

2,210922382

Медиана

2,5

Медиана

18

Мода

2

Мода

#Н/Д

Стандартное отклонение

1,828782

Стандартное отклонение

6,991550456

Дисперсия выборки

3,344444

Дисперсия выборки

48,88177778

Эксцесс

-1,328557

Эксцесс

-1,106006058

Асимметричность

0,53682

Асимметричность

-0,128299221

Интервал

5

Интервал

20,8

Минимум

1

Минимум

7

Максимум

6

Максимум

27,8

Сумма

33

Сумма

176,8

Счет

10

Счет

10

Табл.2

Завдання 1.1. Отримати та проаналізувати описову статистику заданих наборів даних (Додаток В).

Завдання 2.1. Аналітично оцінити варіабельність вибірки. (Додаток В). Отримані занести в таблицю:

Вибіркове середнє значення ( )

Розмах варіації R

Середнє лінійне відхилення a

Дисперсія D

Стандартне відхилення

Коефіцієнт варіації v

Помилка середнього ps

t – розподіл Ст’юдента t

Величина відхилу ε= ps* t

±ε

Порівняти отримані показники з окремими даними описової статистики.

Частина 2. Визначення зв’язку між ознаками за допомогою коваріації та коефіцієнта кореляції

Одна з найбільш поширених завдань статистичного дослідження полягає у вивченні зв'язку між вибірками. Зазвичай зв'язок між вибірками носить не функціональний, а імовірнісний (або стохастичний) характер. У цьому випадку немає суворої, однозначної залежності між величинами. Визначити ступінь зв’язку між ознаками можна за допомогою коваріації та коефіцієнта кореляції.

(1)

(2)

(3)

Приклад: Порахувати коваріацію та коефіцієнт кореляції для визначення напряму і сили зв’язку між кількістю кальцію в воді і жорстістю води, якщо відомі наступні дані:

Жорсткість води (в градусах)

Кількість кальцию в воді (в мг/л)

4 8 11 27 34 37

28 56 77 191 241 262

dx = ,

Жорсткість води (в градусах)

х

Кількість кальцию в воді (в мг/л)

у

dх

dу

dх х dу

dx2

dy2

4 8 11 27 34 37

28 56 77 191 241 262

-16 -12 -9 +7 +14 +17

-114 -86 -66 +48 +98 +119

1851 1052 600 331 1362 2011

261 148 84 46 191 283

13110 73482 4290 2352 9702 14280

срзнач=Σ х / n

срзнач=Σ у / n

 

Σ dх * dу=7209

Σ dх2=1014

Σ dy2=51217

срзнач=120/6=20

срзнач=852/6=142

 

2.1 Рахуємо коваріацію за формулою (1)

=1201

2.2 Коефіцієнт кореляції рахуємо за формулою (3)

Достовірність коефіцієнта кореляції оцінюється за таблицею "Стандартні коефіцієнти кореляції" (додаток А). При числі ступенів свободи (n - 2) = 6 - 2 = 4, наш розрахунковий коефіцієнт кореляції r = + 0,99 більше табличного (Rтабл = + 0,917 при P = 99%).

Висновок. Чим більше кальцію у воді, тим вона більш жорстка (зв'язок прямий, сильний і достовірний: Rху = + 0,99, P > 99,9%).

Завдання 2.1. Встановити ступінь лінійного зв’язку між 2 змінними, застосовуючи:

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]