Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1079.pdf
Скачиваний:
59
Добавлен:
07.01.2021
Размер:
854.54 Кб
Скачать

чать ли модель априорным вероятностям классов. Полный список параметров можно найти здесь. Я рекомендую сосредоточиться на предобработке данных и отборе признаков.

Следует отметить, что в случае НБА использование ансамблевых методов, таких как бэггинг (bagging) и бустинг (boosting), не дает результатов. Данные подходы направлены на уменьшение дисперсии, что неприменимо по отношению к НБА.

4. ТЕМЫ ДЛЯ ПОДГОТОВКИ К ИТОГОВОЙ ФОРМЕ КОНТРОЛЯ

1.Основные задачи разработки данных н машинного обуче-

ния.

2.Приведите содержательные примеры задач классификации

ирегрессии.

3.Анализ формальных понятий в контексте разработки дан-

ных.

4.Объясните идею метода К-средних.

5.Поиск частых (замкнутых) множеств признаков.

6.Опишите меры оценки качества в машинном обучении и объясните работу метода скользящего контроля.

7.Поиск ассоциативных правил.

8.Объясните работу алгоритма Apriori.

9.Алгоритмы IDЗ и С4.5.

10.Объясните принцип наивной классификации Байеса.

11.Метод k-средних.

12.Классификация текстов и фильтрация спама.

13.Спектральная кластеризация.

14.Объясните идею метода k-средних.

15.Неточные множества: основные определения и прикладное

значение.

16.Опишите и объясните способы измерения расстояний между кластерами.

17.ДСМ-метод в терминах АФП. Прикладные задачи.

18.Примеры практических задач алгоритмов IDЗ и С4.5.

19.Задачи классификации и регрессии

20.Примеры практических задач спектральной кластеризации.

21.Байесовский подход в задачах классификации.

22. Примеры практических задач агломеративной кластериза-

ции.

23.Меры и методы оценки качества результатов в разработке данных и машинном обучении.

24.Объясните способы вычисления расстояние между объектами в задачах кластеризации

5.ТИПОВЫЕ ТЕСТОВЫЕ ЗАДАНИЯ

5.1.Типовой вариант по всем темам дисциплины

«Машинное обучение и анализ данных»

1Машинное обучение — …

a)специализированный программный решение (или набор ре-

шений), который включает в себя все инструменты для извлечения закономерностей из сырых данных

b)эта группировка объектов (Наблюдений, событий) на основе данных, описывающих свойства объектов

c)набор данных, каждая запись которого представляет собой учебный пример, содержащего заданный входной влияние, что и отвечает ему правильный выходной результат

d)подразделение искусственного интеллекта, изучающее методы построения алгоритмов, способных обучаться на данных

2Эксперт это …

a)специалист в области анализа и моделирование

b)специалист в предметной области

c)человек, решать определенные задачи

d)человек, который имеет опыт в программировании

3Задача классификации сводится к …

a)нахождения частых зависимостей между объектами или со-

бытиями

b)определения класса объекта по его характеристиками

c)определение по известным характеристиками объекта значение некоторого его параметра

d)поиска независимых групп и их характеристик в всем множестве анализируемых данных

4Задача регрессии сводится к …

a)нахождения частых зависимостей между объектами или со-

бытиями

b)определения класса объекта по его характеристиками

c)определение по известным характеристиками объекта значение некоторого его параметра

d)поиска независимых групп и их характеристик в всем множестве анализируемых данных

5Задача кластеризации заключается в …

a)нахождения частых зависимостей между объектами или со-

бытиями

b)определения класса объекта по его характеристиками

c)определение по известным характеристиками объекта значение некоторого его параметра

d)поиска независимых групп и их характеристик в всем множестве анализируемых данных

6Целью поиска ассоциативных правил является …

a)нахождения частых зависимостей между объектами или со-

бытиями

b)определения класса объекта по его характеристиками

c)определение по известным характеристиками объекта значение некоторого его параметра

d)поиска независимых групп и их характеристик в всем множестве анализируемых данных.

7До предполагаемых моделей относятся такие модели данных:

a)модели классификации и последовательностей

b)регрессивные, кластеризации, исключений, итоговые и ассоциации

c)классификации, кластеризации, исключений, итоговые и ассоциации

d)модели классификации, последовательностей и исключений

8В описательных моделей относятся следующие модели дан-

ных:

a)модели классификации и последовательностей

b)регрессивные, кластеризации, исключений, итоговые и ассоциации

c)классификации, кластеризации, исключений, итоговые и ассоциации

d)модели классификации, последовательностей и исключений

9Модели классификации описывают …

a)правила или набор правил в соответствии с которыми можно

отнести описание любого нового объекта к одному из классов

b)функции, которые позволяют прогнозировать изменения не-

прерывных числовых параметров

c)функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме

d)группы, на которые можно разделить объекты, данные о которых подвергаются анализ

1Модели последовательностей описывают …

a)правила или набор правил в соответствии с которыми можно

отнести описание любого нового объекта к одному из классов

b)функции, которые позволяют прогнозировать изменения непрерывных числовых параметров

c)функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме

d)группы, на которые можно разделить объекты, данные о которых подвергаются анализа

1Регрессивные модели описывают …

a)правила или набор правил в соответствии с которыми можно

отнести описание любого нового объекта к одному из классов

b)функции, которые позволяют прогнозировать изменения непрерывных числовых параметров

c)функциональные зависимости между зависимыми и независимыми показателями и переменными в понятной человеку форме

d)группы, на которые можно разделить объекты, данные о которых подвергаются анализа

1Модели ассоциации проявляют …

a)исключительные ситуации в записях, которые резко отлича-

ются произвольной признаку от основной множества записей

b)ограничения на данные анализируемого массива

c)закономерности между связанными событиями

d)группы, на которые можно разделить объекты, данные о которых подвергаются анализа

1Очистка данных — …

a)комплекс методов и процедур, направленных на устранение

причин, мешающих корректной обработке: аномалий, пропусков, дубликатов, противоречий, шумов и т.д.

b)процесс дополнения данных некоторой информацией, позволяющей повысить эффективность развязку аналитических задач

c)объект, содержащий структурированные данные, которые могут оказаться полезными для развязку аналитического задачи

d)комплекс методов и процедур, направленных на извлечение

данных из различных источников, обеспечение необходимого уровня их

1Что называют данными в машинном обучении?

a)функция

b)алгоритм

c)признаки

d)объекты

e)матрицы

1Задача ранжирования - это:

a)исследование влияние одного или нескольких признаков на

объект

b)определение порядка признака согласно рангу

c)множество объектов, разделенных на классы

1Верно ли утверждение? Всякая оптимизация по неполной ин-

формации и избыточная сложность параметров приводит в переобучению.

a)да

b)нет

1 Верно ли следующее утверждение? Многие виды задач меди-

цинской диагностики решаются задачами классификации.

a)да

b)нет

1Какие задачи, из ниже перечисленных, являются задачами

прогнозирования?

a)задачи поискового вывода.

b)математический прогноз даты сильных землетрясений;

c)определение длительности и исхода заболевания;

d)прогнозирование вероятности летального исхода;

e)обнаружение спама;

1 Какая, из ниже перечисленных задач, является задачей клас-

сификации на 4 класса?

a)Y={-1;+1}

b)Y={1,2,3,4}

c)Y={0,1}M

d)Y={0,1}

2Какой тип экспериментального исследования имеет цель - по-

нимание, на что влияют параметры метода обучения?

a)исследование задач ранжирования

b)исследование задач классификации

c)исследование на модельных данных

2 Что из перечисленного является задачей обучения с учителем

(supervised learning)?

a)Выявить сочетания товаров, часто встречающихся вместе в покупках клиентов

b)Выделить группы покупателей на основе сведений об истории их покупок

c)Определить пол владельца аккаунта ВКонтакте, используя базу из 10000 аккаунтов с указанным полом

d)Сформировать репрезентативную выборку для социологического опроса

2 Что является выходными данными в алгоритме синтеза би-

нарного решающего дерева ID3?

a)множество элементарных предикатов

b)обучающая выборка

c)максимальный ранг конъюнкций

d)ограничение на число конъюнкций ТС

e)корневая вершина дерева

2Как называют априорную вероятность вида ?

a)шумовой

b)фоновой

c)тематической

d)робастной

2На какой из теории основан байесовский подход?

a)на теории утверждающей, что если известны плотности рас-

пределения каждого из классов, то искомый алгоритм можно выписать в явном аналитическом виде

b) на теории утверждающей, что если известны априорные вероятности Py и функции правдоподобия Py(x), то минимум средне-

го риска R(a) достигается алгоритмом

c)на теории утверждающей, что если классы имеют n-мерные

нормальные плотности распределения , то байесовский классификатор задаёт квадратичную разделяющую поверхность

d) на теории утверждающей, что если случайная величина r равномерно распределена на [0,1]

2С чем, из ниже перечисленного сравнивают линейный класси-

фикатор?

a)с правилом Хебба

b)с нейроном

c)с генетическим алгоритмом

d)с аксоном

2 Какие задачи, из ниже перечисленных, являются задачами

ранжирования?

a)определение наиболее целесообразного способа лечения

b)задачи поискового вывода

c)обнаружение спама

2К любым ли базовым алгоритмам и их методам обучения при-

меним алгоритм CCEL?

a)да

b)нет

2Какие из этих утверждения верны?

a)Регрессия - типичная задача машинного обучения с учителем

b)Классификация - типичная задача машинного обучения без учителя

c)Кластеризация - типичная задача машинного обучения без учителя

d)Выявление аномалий - типичная задача машинного обучения

сучителем

e)Ничего из вышеперечисленного

2 На рисунке изображено дерево решений в пространстве (0,1)4

найдите вероятность класса 1

a)33/80

b)31/70

c)17/31

d)19/52

e)15/44

3 Какие из этих задач являются типичными для машинного

обучения с учителем?

a)Ранжирование поисковой выдачи

b)Предсказание вероятности клика на рекламу Группировка изображений по визуальным признакам

c)Выявление тематик в корпусе текстов

d)Оценка тональности комментария

3Переобучение в машинном обучении и статистике - это:

a)Явление, когда построенная модель хорошо объясняет при-

меры из обучающей выборки, но относительно плохо работает на примерах, не участвовавших в обучении

b)Повторное обучение модели для проверки ее корректности

c)Излишнее обучение модели, не дающее прироста точности

d)Состояние предельного обучения модели, когда улучшить ее точность больше невозможно

e)Повторное использование данных из обучающей выборки для дальнейшего обучения модели

3 Ошибка обучения — …

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]