- •Інформаційні системи та технології в управлінні методичні вказівки
- •1 Введення до систем підтримки прийняття рішень 4
- •2 Бізнес - прогнозування 25
- •3 Кластерний аналіз в бізнес-аналітиці 43
- •4 Вирішення задач класифікації
- •5 Література 120
- •1 Введение в Системы Поддержки Принятия Решений (сппр)
- •1.1 Определение сппр
- •1.2 Классификация сппр
- •1.3 Архитектура сппр
- •1.4 Анализ данных – основные принципы
- •1.5 Базовые методы анализа
- •1) Online Analytical Processing
- •2) Knowledge Discovery in Databases
- •3) Data Mining
- •1.6 Примеры задач, где применяются методы Data Mining
- •1.7 Программа Deductor – платформа для создания сппр
- •1.8 Контрольные вопросы
- •2 Корреляционный анализ
- •2.1 Теоретические сведения
- •2.3 Задание для самостоятельной работы
- •2.4. Контрольные вопросы
- •3 Бизнес - Прогнозирование
- •3.1 Теоретические сведения
- •3.2 Компьютерные пакеты для решения задач прогнозирования
- •3.3 Временные ряды
- •3.3.1 "Наивные" модели прогнозирования
- •3.3.2 Средние и скользящие средние
- •3.3.3 Моделирование временного ряда
- •Ar(p) -авторегрессионая модель порядка p. Модель имеет вид:
- •3.3.4 Нейросетевые модели прогнозирования
- •3.3.6 Предобработка данных
- •3.4 Пример прогнозирования с помощью линейной регрессии
- •3.4.1 Импорт данных из файла
- •3.4.2 Настройка параметров столбцов
- •3.4.3 Расчет автокорреляции столбцов
- •3.4.4 Удаление аномалий
- •3.4.5 Сглаживание данных – удаление шумов
- •3.4.6 Преобразование данных к скользящему окну
- •3.4.7 Прогнозирование с помощью линейной регрессии
- •3.5 Прогнозирование с помощью нейронных сетей
- •3.5.1 Исходные данные
- •3.5.2 Удаление аномалий и сглаживание
- •3.5.3 Обучение нейросети (прогноз на 1 месяц вперед)
- •3.5.4 Построение прогноза
- •3.5.5 Результат
- •3.5.6 Выводы
- •3.6 Задание к лабораторной работе
- •3.7 Контрольные вопросы
- •4 Кластерный анализ в бизнес-аналитике
- •4.1. Теоретические основы
- •4.2 Меры близости в алгоритмах кластеризации
- •4.3 Алгоритмы кластеризации
- •4.4 Решение типовой задачи кластеризации в Deductor
- •4.4.1 Кластеризация
- •4.4.2 Выводы
- •4.6 Задания для самостоятельной работы
- •4.7 Контрольные вопросы
- •5 Методы решения задач классификации
- •5.1 Опис процесу класифікації
- •5.2 Оцінка якості моделі класифікації
- •5.3 Скоринговые модели для оценки кредитоспособности заемщиков – пример задачи классификации на основе логистической регрессии
- •5.3.1 Постановка задачи
- •5.3.2 Скоринговая карта на основе логистической регрессии
- •5.3.3 Построение модели в системе Deductor.
- •5.4 Классификация на основе дерева решений
- •5.4.1 Процесс конструирования дерева решений
- •5.4.2 Скоринговая модель на основе дерева решений
- •5.3.4 Интерактивное дерево решений
- •5. Задания к лабораторной работе
- •5.5 Контрольные вопросы
- •5 Литература
5. Задания к лабораторной работе
Используя файл о кредитных историях, собранный в банке - loans.txt, построить классификатор на основе
а) логистической регрессии;
б) деревьев решений
в программе Deductor. Сравнить полученные модели и оценить их качество.
Построить модели классификации на данных, приведенных ниже в заданиях 5.1 и 5.2.
Сравнить результаты с классификацией на основе нейронной сети.
Задание 5.1. Главным управлением экономического развития области был проведен выборочный анализ финансового состояния хозяйствующих субъектов, в результате которого получены три группы промышленных предприятий: нормально функционирующие, нуждающиеся в финансовой поддержке и предприятия, которые находятся в состоянии банкротства. Выводы относительно конкретного предприятия делались на основе анализа коэффициента рентабельности ( ), коэффициента текущей ликвидности ( ), коэффициента обеспеченности собственными средствами ( ) и коэффициента утраты (восстановления) платежеспособности ( ).
Таблица 5.4 - Результаты выборочного анализа финансового состояния хозяйствующих субъектов, действующих на територии области
Наименование предприятий |
|
|
|
|
|
- 1 - |
- 2 - |
- 3 - |
-4 - |
- 5 - |
|
Группа нормально функционирующих предприятий |
|||||
Г.П. «Медтехника» |
8,09 |
1,30 |
0,23 |
1,13 |
|
Завод «Гамма» |
8,09 |
1,56 |
2,36 |
1,48 |
|
ОАО «Искра» |
23,17 |
17,76 |
0,85 |
17,46 |
|
ОАО «Автозапчасти» |
2,10 |
28,78 |
0,97 |
31,02 |
|
ОАО «Видеофон» |
4,48 |
1,18 |
0,15 |
1,04 |
|
ЗАО «Гидрогаз» |
7,32 |
1,28 |
0,23 |
1,19 |
|
ЗАО «Агропродукт» |
12,00 |
1,89 |
0,47 |
1,79 |
|
ОАО «Машоборудование» |
4,45 |
7,52 |
0,87 |
7,42 |
|
Дорожные электромеханические мастерские |
2,79 |
2,00 |
0,50 |
1,69 |
|
ОАО «Преобразователь» |
1.32 |
10,02 |
0,24 |
9,46 |
|
Группа предприятий, нуждающихся в финансовой поддержке |
|||||
Завод «Радиоприбор» |
0,52 |
0,95 |
-0,033 |
0,97 |
|
Производственно-коммерческая фирма «Флаттер» |
2,84 |
0,98 |
-0,02 |
0,81 |
|
ОАО «Судоремонтный завод» |
-84,86 |
2,02 |
0,50 |
1,99 |
|
ОАО «Автодор» |
34,8 |
9,82 |
-0,22 |
0,68 |
|
- 1 - |
- 2 - |
- 3 - |
-4 - |
- 5 - |
|
ОАО «Рембыттехника» |
8,42 |
1,09 |
0,08 |
0,96 |
|
Группа предприятий, которые находятся в состоянии банкротства |
|||||
ОАО «Втормет» |
-2,13 |
0,73 |
-0,36 |
0,59 |
|
ОАО «Вэлт» |
-321,06 |
0,64 |
-1,02 |
0,72 |
|
ОАО «ЗПП» |
-48,53 |
0,97 |
-0,03 |
0,96 |
|
ОАО «Тяжэкс» |
-356,24 |
0,32 |
-2,16 |
0,37 |
|
ОАО «ЗСАК» |
-41,47 |
0,92 |
-0,09 |
0,51 |
Требуется, используя приведенные данные как обучающую выборку, построить модель классификации на основе одного из методов, рассмотренных выше, а затем установить принадлежность следующих предприятий к одному из трех классов, определив тем самым его финансовое состояние.
Таблица 5.5 - Показатели финансового состояния классифицируемых хозяйствующих субъектов
Наименование предприятий |
|
|
|
|
ЗАО «ЭПП-микрон» |
-5,17 |
2,97 |
-0,36 |
3,15 |
ОАО Молочный комбинат |
27,8 |
19,11 |
2,6 |
16,48 |
ООО Продовольственная компания |
0,33 |
0,79 |
-0,61 |
0,51 |
ОАО «Фруктовые воды» |
-9,19 |
-0,1 |
0,19 |
0,51 |
Задание 5.2. При оценке эффективности деятельности предприятий легкой промышленности были получены два класса предприятия: с высокой и низкой производительностью труда. Кроме того , были выявлены факторы, определяющие соответствующий уровень производительности труда: 1) Доля рабочих, занятых вручную не при машинах и механизмах % ( ); 2) Процент текучести кадров ( ); 3) Коэффициент сменности по всем рабочим ( ); 4) Доля профильной продукции в общем объеме продукции ( ); 5) Электровооруженность, кВт ( ); В последней колонке приведено Модельное значение выработки, тыс.грн. (табл. 5.6). Опираясь на полученные результаты: 1) проанализируйте резервы роста производительности труда в группе худших предприятий; 2) проведите классификацию предприятий, представленных в табл. 5.7.
Таблица 5.6 - Классификация предприятий по уровню производительности труда
Пред-прия-тие |
Факторы |
Модельнзначение выработки, тыс.грн. |
||||
|
|
|
|
|
||
Группа предприятий с высокой производительностью труда |
||||||
1 |
34,1 |
11 |
1,47 |
93,4 |
21,3 |
69,75 |
2 |
33,7 |
12 |
1,29 |
91,7 |
32,2 |
63,89 |
3 |
23,6 |
23 |
1,17 |
95,3 |
27,8 |
60,64 |
4 |
29,6 |
12 |
1,47 |
95,3 |
22,6 |
81,62 |
5 |
25,3 |
16 |
1,44 |
96,3 |
21,9 |
81,02 |
6 |
17,9 |
27 |
1,52 |
91,1 |
27,8 |
62,53 |
7 |
29,3 |
13 |
1,62 |
94,5 |
23,5 |
83,55 |
Группа предприятий с низкой производительностью труда |
||||||
8 |
38,4 |
12 |
1,36 |
96,4 |
15,5 |
61,68 |
9 |
37,5 |
15 |
1,44 |
95,2 |
12,3 |
54,86 |
10 |
32,2 |
19 |
1,29 |
96,1 |
16,4 |
54,71 |
11 |
26,1 |
19 |
1,46 |
92,3 |
11,4 |
55,90 |
12 |
30,7 |
25 |
1,57 |
92,9 |
23,4 |
51,34 |
13 |
28,7 |
18 |
1,47 |
85,2 |
22,7 |
41,14 |
Таблица 5.7 - Характеристики предприятий, подлежащих классификации
Предпри-ятие |
Факторы |
||||
|
|
|
|
|
|
14 |
31,5 |
19 |
1,76 |
92,7 |
18,4 |
15 |
31,2 |
23 |
1,37 |
94,6 |
17,9 |
16 |
19,7 |
20 |
1,52 |
96,2 |
27,1 |
17 |
28,7 |
24 |
1,56 |
92,2 |
27,8 |