Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Екзамен_Билет.doc
Скачиваний:
33
Добавлен:
25.05.2020
Размер:
347.65 Кб
Скачать

Екзаменаційний білет № 5

І. Теоретична частина

1. В чому полягає задача класифікації даних?

2. Які завдання можно розв’язувати за допомогою корреляційно-регресіонного аналізу?

ІІ. Тестова частина

1. Яка з перерахованих нижче груп методів досить часто використовує для виявлення взаємозв'язків в даних концепцію усереднення по вибірці?

(Відзначте один правильний варіант відповіді.)

a. Data Mining

b. OLAP

c. статистичні методи.

2. В ході вирішення яких з перерахованих завдань встановлюються закономірності між подіями, пов'язаними в часі?

(Відзначте один правильний варіант відповіді.)

a. завдання пошуку асоціативних правил

b. завдання пошуку послідовних асоціативних правил

c. завдання аналізу відхилень

3. Відзначте ті з варіантів, в яких дані структуровані:

a. Дані про продажі компанії, представлені у вигляді щомісячних звітів в форматі MS Word.

b. Таблиця з щоденними показаннями температури приміщення за рік в файлі формату csv.

c. Текст педагогічної поеми А.С. Макаренко, представлений в форматі PDF.

d. Бібліотека фільмів, представлених у форматі mpeg4 на одному жорсткому диску.

4. Назвіть чинники, що зумовили виникнення і розвиток Data Mining:

a. вдосконалення апаратного і програмного забезпечення

b. вдосконалення технологій зберігання і запису даних

c. накопичення великої кількості ретроспективних даних

d. вдосконалення алгоритмів обробки інформації

e. необхідність заміни аналітика інформаційною технологією

5. Якщо порівнювати Data Mining, машинне навчання і статистику, яка з дисциплін сконцентрована на єдиному процесі аналізу даних, включає очищення даних, навчання, інтеграцію і візуалізацію результатів:

a. Data Mining

b. машинне навчання

c. статистика

6. Інструменти Data Mining:

a. можуть самостійно будувати гіпотези про взаємозв'язки в даних

b. не можуть самостійно будувати гіпотези про взаємозв'язки в даних

c. можуть самостійно будувати гіпотези про взаємозв'язки в даних, які обов'язково підтверджуються.

ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:

A. Нормалізувати дані.

B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).

С. Провести розбиття даних на 3 кластера

Прізвище

Зріст (см)

Вага (кг)

Вік (років)

Рівень інтелекту

Освіта

Кушнір

185

95

23

87

Середня

Савчук

177

78

78

115

Наук. ступень

Шаригін

183

87

15

90

Середня

Удовенко

167

102

20

125

Вища

Козачук

170

62

43

82

Вища

Соседние файлы в предмете Технологии OLAP и Data Mining