Добавил:

danrus007 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Харьковский институт банковского дела УБД НБУ

Предмет:

Технологии OLAP и Data Mining

Файл:

Екзамен_Билет.doc

Скачиваний:

Добавлен:

25.05.2020

Размер:

347.65 Кб

Скачать

☆

<<< < Предыдущая 12 / 92 3 4 5 6 7 8 9 > Следующая >>>

Екзаменаційний білет № 3

І. Теоретична частина

1. В чому заключається метод найближчого сусіда?

2. Якої меті служить завдання ассоціації?

ІІ. Тестова частина

1. Виберіть невірну відповідь:

a. Великі дані - це дані обсягу понад 1 Тб

b. Проблема великих даних - це проблема, коли при існуючих технологіях зберігання і обробки сутнісна обробка даних затруд-нена або неможлива.

c. Великі дані - це тренд в області ІТ, підігрівається маркетинговимі кампаніями великих вендорів.

d. Великі дані як правило не структуровані.

2. Якщо порівнювати Data Mining, машинне навчання і статистику, яка з дисциплін сконцентрована на єдиному процесі аналізу даних, включає очищення даних, навчання, інтеграцію і візуалізацію результатів:

(Відзначте один правильний варіант відповіді.)

a. Data Mining

b. машинне навчання

c. статистика

3. Частиною якої з перерахованих стадій є валідація закономірностей?

(Відзначте один правильний варіант відповіді.)

a. аналіз винятків

b. прогностичне моделювання

c. вільний пошук

4. Яка з перерахованих дисциплін більш зосереджена на теорії перевірки гіпотез?

a. Data Mining

b. статистика

c. візуалізація

5. В результате использования одних и тех же данных и различных методов…

a. должна появляться разная информация

b. должна появляться только одинаковая информация

c. может появляться разная информация, это зависит от выбранных методов обработки данных

6. Классификация — это ...

a. отнесение объектов к одному из заранее известных классов

b. отнесение объектов к одной из заранее неизвестных групп

c. процесс формирования групп и отнесения объектов к одному из них.

ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:

A. Нормалізувати дані.

B. Обчислити відстань між об'єктами, що кластерізуємо і побудувати матрицю відстаней (використовувати формулу для обчислення евклідової відстані).

С. Провести розбиття даних на 3 кластера

Прізвище	Зріст (см)	Вага (кг)	Вік (років)	Рівень інтелекту	Освіта
Ільин	185	95	23	87	Среднее
Погорелов	177	78	78	115	Уч. степень
Сидоров	183	67	15	90	Высшее
Степанов	167	102	20	135	Высшее
Фѐдоров	165	52	43	82	Среднее

Екзаменаційний білет № 4

І. Теоретична частина

1. Що таке штучні нейронні мережі?

2. В яких випадках доцільно використовувати аналіз временніх рядів?

ІІ. Тестова частина

1. Закономірності, знайдені в процесі використання технології Data Mining повинні володіти такими властивостями:

(Відповідь вважається вірним, якщо відзначені всі правильні варіанти відповідей.)

a. чим більше знайдено закономірностей, тим краще

b. бути об'єктивними

c. бути практично корисними

d. бути очевидними

e. бути неочевидними

2. Підготовка даних в процесі Data Mining є:

a. необов'язковим етапом роботи

b. істотним етапом роботи

c. може взагалі бути відсутнім

3. В ході вирішення якої з перерахованих завдань встановлюються закономірності між пов'язаними подіями в наборі даних?

(Відзначте один правильний варіант відповіді.)

a. завдання пошуку асоціативних правил

b. завдання пошуку послідовних асоціативних правил

c. завдання аналізу відхилень

4. Data Mining - це процес виявлення в сирих даних знань, необхідних для:

a. прийняття рішень в різних сферах людської діяльності

b. заміни аналітика в процесі прийняття рішень

c. збільшення вартості аналізу даних

5. В процесі роботи Data Mining програми користувач може отримати такі результати:

a. великий відсоток помилкових, недостовірних або безглуздих результатів

b. тільки вірні результати, помилкові висновки виключені

c. тільки статистично достовірні результати

6. Задачу классификации нельзя решить с помощью...

a. метода деревьев решений

b. метода линейной регрессии

c. алгоритма Apriori

ІІІ. Практична частина. За даними наведеними в таблиці виконати кластеризацію даних. Для цього необхідно:

A. Нормалізувати дані.

С. Провести розбиття даних на 3 кластера

Наименование перегона	Длина (км)	Время с последнего капитального ремонта (дней)	Электрификация перегона	Пропускная способность (ваг/год)	Количество путей
Харків-Київ	595	904	Да	1985	3
Харків-Полтава	265	1032	Да	655	2
Харків-Львів	1453	844	Нет	3204	2
Харків-Чернігів	789	642	Нет	654	1
Харків-Миргород	316	165	Нет	4510	2

<<< < Предыдущая 12 / 92 3 4 5 6 7 8 9 > Следующая >>>

Соседние файлы в предмете Технологии OLAP и Data Mining

#
25.05.2020347.65 Кб33Екзамен_Билет.doc
#
25.05.202068.9 Кб49Образец выполнения КР (1).xlsx