- •Екзаменаційний білет №1
- •3. Інтервальна шкала – це шкала,
- •Екзаменаційний білет № 2
- •Екзаменаційний білет № 3
- •Екзаменаційний білет № 4
- •Екзаменаційний білет № 5
- •Екзаменаційний білет № 6
- •Екзаменаційний білет № 7
- •Екзаменаційний білет № 8
- •1. Яка вам відома Классификация технологических методов Data Mining?
- •Екзаменаційний білет № 9
- •Екзаменаційний білет № 10
- •Екзаменаційний білет № 11
- •Екзаменаційний білет № 12
- •Екзаменаційний білет № 13
- •Екзаменаційний білет № 14
- •Екзаменаційний білет № 15
Екзаменаційний білет № 3
І. Теоретична частина
1. В чому заключається метод найближчого сусіда?
2. Якої меті служить завдання ассоціації?
ІІ. Тестова частина
1. Виберіть невірну відповідь:
a. Великі дані - це дані обсягу понад 1 Тб
b. Проблема великих даних - це проблема, коли при існуючих технологіях зберігання і обробки сутнісна обробка даних затруд-нена або неможлива.
c. Великі дані - це тренд в області ІТ, підігрівається маркетинговимі кампаніями великих вендорів.
d. Великі дані як правило не структуровані.
2. Якщо порівнювати Data Mining, машинне навчання і статистику, яка з дисциплін сконцентрована на єдиному процесі аналізу даних, включає очищення даних, навчання, інтеграцію і візуалізацію результатів:
(Відзначте один правильний варіант відповіді.)
a. Data Mining
b. машинне навчання
c. статистика
3. Частиною якої з перерахованих стадій є валідація закономірностей?
(Відзначте один правильний варіант відповіді.)
a. аналіз винятків
b. прогностичне моделювання
c. вільний пошук
4. Яка з перерахованих дисциплін більш зосереджена на теорії перевірки гіпотез?
a. Data Mining
b. статистика
c. візуалізація
5. В результате использования одних и тех же данных и различных методов…
a. должна появляться разная информация
b. должна появляться только одинаковая информация
c. может появляться разная информация, это зависит от выбранных методов обработки данных
6. Классификация — это ...
a. отнесение объектов к одному из заранее известных классов
b. отнесение объектов к одной из заранее неизвестных групп
c. процесс формирования групп и отнесения объектов к одному из них.
ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:
A. Нормалізувати дані.
B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).
С. Провести розбиття даних на 3 кластера
Прізвище |
Зріст (см) |
Вага (кг) |
Вік (років) |
Рівень інтелекту |
Освіта |
Ільин |
185 |
95 |
23 |
87 |
Среднее |
Погорелов |
177 |
78 |
78 |
115 |
Уч. степень |
Сидоров |
183 |
67 |
15 |
90 |
Высшее |
Степанов |
167 |
102 |
20 |
135 |
Высшее |
Фѐдоров |
165 |
52 |
43 |
82 |
Среднее |
Екзаменаційний білет № 4
І. Теоретична частина
1. Що таке штучні нейронні мережі?
2. В яких випадках доцільно використовувати аналіз временніх рядів?
ІІ. Тестова частина
1. Закономірності, знайдені в процесі використання технології Data Mining повинні володіти такими властивостями:
(Відповідь вважається вірним, якщо відзначені всі правильні варіанти відповідей.)
a. чим більше знайдено закономірностей, тим краще
b. бути об'єктивними
c. бути практично корисними
d. бути очевидними
e. бути неочевидними
2. Підготовка даних в процесі Data Mining є:
a. необов'язковим етапом роботи
b. істотним етапом роботи
c. може взагалі бути відсутнім
3. В ході вирішення якої з перерахованих завдань встановлюються закономірності між пов'язаними подіями в наборі даних?
(Відзначте один правильний варіант відповіді.)
a. завдання пошуку асоціативних правил
b. завдання пошуку послідовних асоціативних правил
c. завдання аналізу відхилень
4. Data Mining - це процес виявлення в сирих даних знань, необхідних для:
a. прийняття рішень в різних сферах людської діяльності
b. заміни аналітика в процесі прийняття рішень
c. збільшення вартості аналізу даних
5. В процесі роботи Data Mining програми користувач може отримати такі результати:
a. великий відсоток помилкових, недостовірних або безглуздих результатів
b. тільки вірні результати, помилкові висновки виключені
c. тільки статистично достовірні результати
6. Задачу классификации нельзя решить с помощью...
a. метода деревьев решений
b. метода линейной регрессии
c. алгоритма Apriori
ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:
A. Нормалізувати дані.
B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).
С. Провести розбиття даних на 3 кластера
Наименование перегона |
Длина (км) |
Время с последнего капитального ремонта (дней) |
Электрификация перегона |
Пропускная способность (ваг/год) |
Количество путей |
Харків-Київ |
595 |
904 |
Да |
1985 |
3 |
Харків-Полтава |
265 |
1032 |
Да |
655 |
2 |
Харків-Львів |
1453 |
844 |
Нет |
3204 |
2 |
Харків-Чернігів |
789 |
642 |
Нет |
654 |
1 |
Харків-Миргород |
316 |
165 |
Нет |
4510 |
2 |