- •Екзаменаційний білет №1
- •3. Інтервальна шкала – це шкала,
- •Екзаменаційний білет № 2
- •Екзаменаційний білет № 3
- •Екзаменаційний білет № 4
- •Екзаменаційний білет № 5
- •Екзаменаційний білет № 6
- •Екзаменаційний білет № 7
- •Екзаменаційний білет № 8
- •1. Яка вам відома Классификация технологических методов Data Mining?
- •Екзаменаційний білет № 9
- •Екзаменаційний білет № 10
- •Екзаменаційний білет № 11
- •Екзаменаційний білет № 12
- •Екзаменаційний білет № 13
- •Екзаменаційний білет № 14
- •Екзаменаційний білет № 15
Екзаменаційний білет № 5
І. Теоретична частина
1. В чому полягає задача класифікації даних?
2. Які завдання можно розв’язувати за допомогою корреляційно-регресіонного аналізу?
ІІ. Тестова частина
1. Яка з перерахованих нижче груп методів досить часто використовує для виявлення взаємозв'язків в даних концепцію усереднення по вибірці?
(Відзначте один правильний варіант відповіді.)
a. Data Mining
b. OLAP
c. статистичні методи.
2. В ході вирішення яких з перерахованих завдань встановлюються закономірності між подіями, пов'язаними в часі?
(Відзначте один правильний варіант відповіді.)
a. завдання пошуку асоціативних правил
b. завдання пошуку послідовних асоціативних правил
c. завдання аналізу відхилень
3. Відзначте ті з варіантів, в яких дані структуровані:
a. Дані про продажі компанії, представлені у вигляді щомісячних звітів в форматі MS Word.
b. Таблиця з щоденними показаннями температури приміщення за рік в файлі формату csv.
c. Текст педагогічної поеми А.С. Макаренко, представлений в форматі PDF.
d. Бібліотека фільмів, представлених у форматі mpeg4 на одному жорсткому диску.
4. Назвіть чинники, що зумовили виникнення і розвиток Data Mining:
a. вдосконалення апаратного і програмного забезпечення
b. вдосконалення технологій зберігання і запису даних
c. накопичення великої кількості ретроспективних даних
d. вдосконалення алгоритмів обробки інформації
e. необхідність заміни аналітика інформаційною технологією
5. Якщо порівнювати Data Mining, машинне навчання і статистику, яка з дисциплін сконцентрована на єдиному процесі аналізу даних, включає очищення даних, навчання, інтеграцію і візуалізацію результатів:
a. Data Mining
b. машинне навчання
c. статистика
6. Інструменти Data Mining:
a. можуть самостійно будувати гіпотези про взаємозв'язки в даних
b. не можуть самостійно будувати гіпотези про взаємозв'язки в даних
c. можуть самостійно будувати гіпотези про взаємозв'язки в даних, які обов'язково підтверджуються.
ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:
A. Нормалізувати дані.
B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).
С. Провести розбиття даних на 3 кластера
Прізвище |
Зріст (см) |
Вага (кг) |
Вік (років) |
Рівень інтелекту |
Освіта |
Кушнір |
185 |
95 |
23 |
87 |
Середня |
Савчук |
177 |
78 |
78 |
115 |
Наук. ступень |
Шаригін |
183 |
87 |
15 |
90 |
Середня |
Удовенко |
167 |
102 |
20 |
125 |
Вища |
Козачук |
170 |
62 |
43 |
82 |
Вища |