Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Екзамен_Билет.doc
Скачиваний:
33
Добавлен:
25.05.2020
Размер:
347.65 Кб
Скачать

Екзаменаційний білет № 3

І. Теоретична частина

1. В чому заключається метод найближчого сусіда?

2. Якої меті служить завдання ассоціації?

ІІ. Тестова частина

1. Виберіть невірну відповідь:

a. Великі дані - це дані обсягу понад 1 Тб

b. Проблема великих даних - це проблема, коли при існуючих технологіях зберігання і обробки сутнісна обробка даних затруд-нена або неможлива.

c. Великі дані - це тренд в області ІТ, підігрівається маркетинговимі кампаніями великих вендорів.

d. Великі дані як правило не структуровані.

2. Якщо порівнювати Data Mining, машинне навчання і статистику, яка з дисциплін сконцентрована на єдиному процесі аналізу даних, включає очищення даних, навчання, інтеграцію і візуалізацію результатів:

(Відзначте один правильний варіант відповіді.)

a. Data Mining

b. машинне навчання

c. статистика

3. Частиною якої з перерахованих стадій є валідація закономірностей?

(Відзначте один правильний варіант відповіді.)

a. аналіз винятків

b. прогностичне моделювання

c. вільний пошук

4. Яка з перерахованих дисциплін більш зосереджена на теорії перевірки гіпотез?

a. Data Mining

b. статистика

c. візуалізація

5. В результате использования одних и тех же данных и различных методов…

a.  должна появляться разная информация 

bдолжна появляться только одинаковая информация 

c. может появляться разная информация, это зависит от выбранных методов обработки данных

6. Классификация — это ...

a. отнесение объектов к одному из заранее известных классов  

b. отнесение объектов к одной из заранее неизвестных групп  

c. процесс формирования групп и отнесения объектов к одному из них. 

ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:

A. Нормалізувати дані.

B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).

С. Провести розбиття даних на 3 кластера

Прізвище

Зріст (см)

Вага (кг)

Вік (років)

Рівень інтелекту

Освіта

Ільин

185

95

23

87

Среднее

Погорелов

177

78

78

115

Уч. степень

Сидоров

183

67

15

90

Высшее

Степанов

167

102

20

135

Высшее

Фѐдоров

165

52

43

82

Среднее

Екзаменаційний білет № 4

І. Теоретична частина

1. Що таке штучні нейронні мережі?

2. В яких випадках доцільно використовувати аналіз временніх рядів?

ІІ. Тестова частина

1. Закономірності, знайдені в процесі використання технології Data Mining повинні володіти такими властивостями:

(Відповідь вважається вірним, якщо відзначені всі правильні варіанти відповідей.)

a. чим більше знайдено закономірностей, тим краще

b. бути об'єктивними

c. бути практично корисними

d. бути очевидними

e. бути неочевидними

2. Підготовка даних в процесі Data Mining є:

a. необов'язковим етапом роботи

b. істотним етапом роботи

c. може взагалі бути відсутнім

3. В ході вирішення якої з перерахованих завдань встановлюються закономірності між пов'язаними подіями в наборі даних?

(Відзначте один правильний варіант відповіді.)

a. завдання пошуку асоціативних правил

b. завдання пошуку послідовних асоціативних правил

c. завдання аналізу відхилень

4. Data Mining - це процес виявлення в сирих даних знань, необхідних для:

a. прийняття рішень в різних сферах людської діяльності

b. заміни аналітика в процесі прийняття рішень

c. збільшення вартості аналізу даних

5. В процесі роботи Data Mining програми користувач може отримати такі результати:

a. великий відсоток помилкових, недостовірних або безглуздих результатів

b. тільки вірні результати, помилкові висновки виключені

c. тільки статистично достовірні результати

6. Задачу классификации нельзя решить с помощью...

aметода деревьев решений 

bметода линейной регрессии 

c. алгоритма Apriori

ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:

A. Нормалізувати дані.

B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).

С. Провести розбиття даних на 3 кластера

Наименование перегона

Длина (км)

Время с последнего капитального ремонта (дней)

Электрификация перегона

Пропускная способность (ваг/год)

Количество путей

Харків-Київ

595

904

Да

1985

3

Харків-Полтава

265

1032

Да

655

2

Харків-Львів

1453

844

Нет

3204

2

Харків-Чернігів

789

642

Нет

654

1

Харків-Миргород

316

165

Нет

4510

2

Соседние файлы в предмете Технологии OLAP и Data Mining