
Лекция 7
Промежуточные вопросы:
Найдено 6 правил, максимальная достоверность 81,48%
Увеличить минимальное число объектов, в узлле-отце или в узле-сыне
y=0,7; Объект следует отнести к первой группе
y=0,305. Кредит следует выдать
1. Что вкладывается в понятие "Управление знаниями"?
а) Это новое направление в менеджменте, позволяющее получить конкурентные преимущества компании.
б) Это средства, дающие конечному пользователю возможности доступа и последующего анализа прикладных структурированных данных, с целью прогнозирования и принятия решений.
в) Это методология, направленная на повышение уровня конкурентоспособности и защищенности компании за счет использования полного набора инструментов охраны управления и экономики нематериальных активов компании.
г) Это структурные изменения в менеджменте, когда материальное производство становится вторичным по отношению к производству информации и знаний. Главной производственной силой становится неизвестная доселе категория — работники знаний, занимающая место, принадлежавшее прежде индустриальным работникам или крестьянам.
2. Какие информационные технологии составляют основу технического обеспечения технологии управления знаниями?
а) электронная почта, средства для организации совместной работы, корпоративные сети и Интернет-сервисы;
б) системы управления документооборотом;
в) средства поддержки принятия решений;
г) офисные, складские, бухгалтерские и т. д. автоматизированные рабочие места пользователей.
3. В трансформации бизнеса можно выделить пять фаз развития компании:
управления функциями; управления знаниями; управление горизонтальными связями; управления реализацией бизнес-идеи; управления процессами;
Расставьте их в порядке возрастания приоритетности.
управления функциями: 2
управления знаниями: 5
управление горизонтальными связями: 4
управления реализацией бизнес-идеи: 1
4. В чем состоят задачи систем поддержки принятия решений?
Сбор первичной информации для принятия управленческих решений;
Хранение информации в хранилищах данных и последующее извлечение их для процесса принятия решений
Сбор данных о результатах реализации принятых решений и оценка результатов.
Компьютерный анализ возможных последствий принимаемых решений.
5. В чем различие технологий OLAP и Data Mining?
Выберите правильные ответы.
а) OLAP -это технологии оперативной аналитической обработки данных в базах данных, когда закономерности выявляет сам аналитик.
б) в технологиях Data Mining речь идет о программных продуктах, выявляющих закономерности в данных и оценивающих степень достоверности полученных закономерностей.
в) OLAP -это технологии оперативной обработки транзакций с целью выявления имеющихся закономерностей.
г) Для применения OLAP технологий требуется организовать специальные хранилища данных, а для технологий Data Mining это не нужно делать.
6. Экспертная система — это...
программа для компьютера, которая используется для обработки входного набора данных "налету" для принятия оперативных управленческих решений.
программа для компьютера, которая оперирует исходными данными в определенной предметной области с целью выработки рекомендаций или решения проблем.
программа для компьютера, которая оперирует со знаниями в определенной предметной области с целью выработки рекомендаций или решения проблем.
программа класса СППР, перед которой ставятся задачи в виде совокупности фактов, описывающих некоторую ситуацию, и система с помощью базы знаний пытается вывести заключение из этих фактов.
7. Деятельность по структурированию знаний эксперта называется ...
Структурным анализом данных
Созданием экспертной системы
Созданием системы поддержки принятия решений
Инженерией знаний
8. Ассоциативным правилом называется ...
Правило: если множество объектов содержит объект Х, то это множество содержит и объект Y с вероятностью, меньшей, нежели 0,5.
Импликация (правило) если Х то Y
Правило: если множество объектов содержит объект Х, то это множество содержит и объект Y с вероятностью, большей, нежели 0,5.
Правило: если множество объектов содержит объект А, то это множество содержит и объект B
9. Среди всех транзакций, в корзине покупателя хлеб и молоко встречается в 3 % случаев, а правило: если в корзине покупателя есть хлеб, то есть и молоко, выполняется в 75 % случаев. Чему равна поддержка этого ассоциативного правила?
Ответ ввести в виде целого числа без указания знака %.
Ответ: 3
10. Дайте правильные определения понятий "поддержка" и "достоверность" ассоциативных правил
Доля транзакций во всем наборе данных, содержащих оба элемента Х и Y: Поддержка правила
Вероятность встретить правило если X, то Y среди всех транзакций: Достоверность правила
Доля транзакций во всем наборе данных, содержащих хотя бы один из элементов Х или Y: Вероятность реализации элементов Х и Y.
Вероятность встретить правило если X, то Y среди всех транзакций, в которых есть элемент Х: Достоверность правила
11. Дерево решений (Decision Tree) PASW это ...
логический алгоритм, основанный на построении классификации объектов без "учителя"
логический алгоритм классификации с учителем, основанный на поиске внутренних закономерностей в данных
логический алгоритм, основанный на построении дискриминантной функции для классификации объектов и извлечения правил классификации
логический алгоритм, позволяющий сформулировать правила классификации
12. Анализируются данные о кредитных рейтингах 2464 клиентов банка (результативная переменная), пользовавшихся банковскими услугами в прошлом, а также такие данные о клиентах, как возраст (число лет), уровень дохода (низкий, средний высокий), число используемых кредитных карт (меньше 5, больше 5), уровень образования (высшее, среднее специальное) и число кредитов на покупку автомашины (нет или 1, 2 и более). Дерево решений приведено на рисунке. Какие из приведенных ниже правил являются верными?
а) Если уровень дохода низкий, то с вероятностью 82,1% кредитный рейтинг плохой;
б) Если уровень дохода средний, то с вероятностью 86,2% кредитный рейтинг хороший;
в) Если уровень дохода высокий и число кредитных карт менее 5, то с вероятностью 96,9% кредитный рейтинг хороший;
г) Если уровень дохода средний и число кредитных карт менее 5 то с вероятностью 13,8% кредитный рейтинг плохой.
13. Может ли с помощью дерева решений решаться задача предсказания стоимости квартиры, в зависимости от ее параметров?
а) Да, может, только при использовании алгоритма CRT для построения дерева решений;
б) Нет, не может, поскольку результирующая переменная должна измеряться в номинативной шкале;
в) Да, может, поскольку интервальная переменная может быть сведена к порядковой, путем деления на интервалы;
14. Какие существуют методы остановки ветвления дерева решений в PASW?
Уменьшение максимального числа уровней расщепления дерева решений
Уменьшение числа объектов в узле-отце и узле-сыне.
Увеличение числа объектов в узле-отце и узле-сыне.
Увеличение максимального числа уровней расщепления дерева решений
15. Найдите соответствие при определении понятия риск при построении дерева решений
Риск для категориальных переменных это ...: Доля неверно классифицированных случаев
Риск для переменных, измеренных в интервальной шкале это ..: Средняя из групповых дисперсий в терминальных узлах
16. На рисунке изображена таблица риска, полученная при построении модели невозврата кредита клиентами банка
Чему равна доля неверно классифицированных случаев невозврата кредита клиентами банка?
Ответ: 0,261
17. На рисунке представлены параметры корневого узла при построении модели предсказания стоимости покупаемого автомобиля для различных категорий граждан США с помощью дерева решений в PASW и полученная при построении модели таблица риска.
Чему равна доля объясненной дисперсии (аналог фактора детерминации в регрессионном анализе) в этой задаче.
Ответ записать с точностью двух знаков после запятой.
Примечание: Объясненная дисперсия – это доля вариации данных, учитываемая моделью (например, множественной регрессии, дисперсионного анализа, нелинейного оценивания или нейронной сети).
Ответ: 0,85
18. Какой смысл имеет дискриминантная функция в дискриминантном анализе для случаая двух переменных?
а) Значения дискриминантной функции для каждого объекта позволяет классифицировать объекты;
б) Значения дискриминантной функции для каждого объекта позволяет классифицировать объекты; если значение этой функции равно нулю, то объект принадлежит первой группе, если значение равно единице – ко второй;
в) Если значение этой функции больше, нежели сумма ее значений в центроидах групп, то объект принадлежит к одной группе, если меньше — к другой;
г) Если значение этой функции больше, нежели полусумма ее значений в центроидах групп, то объект принадлежит к одной группе, если меньше к другой;
19. Центроиды групп при классификации объектов на два класса А и В это ...
а) координаты центров множеств объектов, отнесенных к классу A или B;
б) средние значения для координат объектов, отнесенных к классу А или к классу В;
в) суммарные значения координат объектов, отнесенных к классу А или к классу В;
г) Величины, определяемые формулами
Примечание: Центроид — это средние значения для дискриминантных показателей конкретной группы. Центроидов столько, сколько групп, т.е. один центроид для каждой группы. Средние группы для всех функций — это групповые центроиды.
20. Коэффициенты дискриминантной функции для некоторой модели оказались равными b1 = 0,4; b2 = 0,6. Чему равно значение дискриминантной функции для объекта, имеющего следующие значения параметров: х1 = -0,5; х2 = 1,5?
Ответ привести с точностью двух знаков после запятой.
Решение:
Y(x) = 0,4*(-0,5) + 0,6*1,5 = 0,7
Ответ: 0,7
21. Значение дискриминантной функции в центроидах первой и второй групп для некоторой модели оказались равными -0,35 и 1,35 соответственно. Чему равно значение константы с, с которой следует сравнивать значения дискриминантной функции для объекта, с целью определения принадлежности объекта к той, или иной группе?
Решение:
Ответ: 0,5
22. Для определения профиля клиентов банка, которые не склонны возвращать взятый кредит, построена модель дискриминантного анализа. Ненормированные значения дискриминантной функции приведены в таблицах ниже.
Какое значение примет каноническая дискриминантная функци y, если применить модель дискриминантного анализа, для нового клиента банка, имеющего следующие характеристики:
стаж в бизнесе - 10 лет;
не менял адрес, лет - 6 лет;
отношение долга к доходу в % - 17,3;
долги по кредитной карте (в тыс. долларов США) - 1,36.
Ответ привести с точностью двух знаков после запятой.
Решение: Y = (-0,123)*10 + (-0,032)*6 + 0,07*17,3 + 0,321*1,36 + 0,079 = 0,30
Ответ: 0,3
23. Найдите правильные соответствия для переменных, участвующих в анализе.
Какой тип имеет результативная переменная при построении дерева решений?: номинативный, порядковый
Какой тип имеет результативная переменная при построении модели дискриминантного анализа: номинативный, порядковый количественный
Какой тип может имееть объясняющая переменная при построении дерева решений?: номинативный, порядковый
Какой тип может иметь объясняющая переменная при построении модели дискриминантного анализа?: номинативный, порядковый количественный.