
- •В результаті вивчення дисципліни студент освоює наступні компетенції:
- •Тема 1. Методи перевірки статистичних гіпотез
- •1.1 Основні поняття теорії гіпотез
- •1.2 Побудова критичної області
- •1.3 Критерій згоди
- •1.4 Критерій Пірсона (2)
- •1.5 Критерій Колмогорова ()
- •1.6 Критерій знаків
- •1.7 Критерій Вілкоксона
- •1.8 Критерій серій
- •1.9 Питання для самоперевірки теми 1
- •1.10 Лабораторна робота № 1
- •1.11 Лабораторна робота № 2
- •Вказівки до лабораторної роботи№2
- •Тема 2 основи дисперсійного аналізу
- •2.1 Однофакторний дисперсійний аналіз
- •2.2 Однакове число випробувань на різних рівнях
- •2.3 Неоднакове число випробувань на різних рівнях
- •2.4 Поняття про двофакторний дисперсійний аналіз
- •2.5 Питання для самоперевірки теми 2
- •2.6 Лабораторна робота № 3
- •Приклад завдання для лабораторної роботи №3
- •Тема 3 основи регресійного та кореляційного аналізу
- •3.1 Функціональна, статистична й кореляційна залежності
- •3.2 Лінійна парна регресія
- •3.3 Коефіцієнт кореляції
- •3.4 Поняття про множинну кореляцію
- •3.5 Питання для самоперевірки теми 3
- •3.6 Лабораторна робота № 4
- •3.7 Лабораторна робота № 5
- •3.8 Лабораторна робота № 6
- •Тема 4 використання програмного забезпечення для реалізації емпіричних методів програмної інженерії
- •4.1 Використання електронних таблиць Exel
- •4.2 Використання спеціалізованих статистичних пакетів програм
- •4.3 Загальні відомості про мову r
- •4.4 Лабораторна робота № 7
- •Приклад лабораторної роботи №7
- •Вказівки до лабораторної роботи №7
- •Список використаної літератури
4.4 Лабораторна робота № 7
За наданою матрицею близькості виконати класифікацію об’єктів, використавши систему R:
для заданої кількості кластерів;
для заданого параметру близькості об’єктів.
Приклад лабораторної роботи №7
Для кластерного аналізу вибрано 12 професій: 1. Екскурсовод. 7. Програміст 2. Учитель. 8. Агроном. 3. Лікар. 9. Лісничий 4. Будівельник.. 10. Письменник. 5. Шофер. 11. Актор. .6. Інженер. 12. Космонавт.
Вказівки до лабораторної роботи №7
Спочатку розбиваємо на декілька груп за критерієм схожості. Дані носять суб'єктивний характер. Для обробки цих даних застосовується агломативний метод і використовується наступна схема: 1. Визначаємо деякий показник схожості між об'єктами і класами (в n-бальною системою). 2. Виконуємо наступні дії:
Визначається найменша відстань між об'єктами і кластерами. b. Об'єднують в першому кластері ті об'єкти, відстань між якими мінімальне. c. Обчислюємо відстань від нового кластера до кожного об'єкта або кластера. d. Повторюємо весь цикл до тих пір, поки число кластерів не буде рівних заданому або мінімальне розходження не стануть великими на перед заданої величини. Як показники схожості вибираємо кількість випробовуваних, які віднесли ці професії до одного класу. Дані заносимо в матрицю схожості.
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
1 |
x |
9 |
7 |
2 |
2 |
7 |
2 |
6 |
2 |
4 |
8 |
5 |
2 |
|
x |
11 |
3 |
4 |
7 |
3 |
7 |
1 |
4 |
4 |
7 |
3 |
|
|
x |
2 |
2 |
4 |
3 |
4 |
1 |
6 |
6 |
6 |
4 |
|
|
|
x |
13 |
9 |
7 |
7 |
5 |
3 |
2 |
4 |
5 |
|
|
|
|
x |
7 |
7 |
5 |
4 |
2 |
2 |
3 |
6 |
|
|
|
|
|
x |
8 |
10 |
2 |
2 |
2 |
6 |
7 |
|
|
|
|
|
|
x |
4 |
4 |
4 |
5 |
6 |
8 |
|
|
|
|
|
|
|
x |
7 |
3 |
1 |
5 |
9 |
|
|
|
|
|
|
|
|
x |
5 |
3 |
3 |
10 |
|
|
|
|
|
|
|
|
|
x |
10 |
5 |
11 |
|
|
|
|
|
|
|
|
|
|
x |
3 |
12 |
|
|
|
|
|
|
|
|
|
|
|
x |
На першому кроці об'єднуємо в один кластер ті два об'єкти, схожість між якими максимально. В якості відстані даного кластера до решти об'єктів вибираємо максимальну відстань для цих двох кластерів
|
1 |
2 |
3 |
4,5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
1 |
x |
9 |
7 |
2 |
7 |
2 |
6 |
2 |
4 |
8 |
5 |
2 |
|
x |
11 |
4 |
7 |
3 |
7 |
1 |
4 |
4 |
7 |
3 |
|
|
x |
2 |
4 |
3 |
4 |
1 |
6 |
6 |
6 |
4,5 |
|
|
|
x |
9 |
7 |
7 |
5 |
3 |
2 |
4 |
6 |
|
|
|
|
x |
8 |
10 |
2 |
2 |
2 |
6 |
7 |
|
|
|
|
|
x |
4 |
4 |
4 |
5 |
6 |
8 |
|
|
|
|
|
|
x |
7 |
3 |
1 |
5 |
9 |
|
|
|
|
|
|
|
x |
5 |
3 |
3 |
10 |
|
|
|
|
|
|
|
|
x |
10 |
5 |
11 |
|
|
|
|
|
|
|
|
|
x |
3 |
12 |
|
|
|
|
|
|
|
|
|
|
x |
2 + 3 6 + 8 10 + 11 Процес зупиняють за рівнем схожості (> = 3) або кількістю кластерів (2).