
- •Практическая работа 4 технология big data (большие данные) Технологии Big Data в системах поддержки принятия решений
- •Технологии Big Data
- •Предиктивная аналитика
- •Имитационное моделирование
- •Визуализация данных, статистический анализ
- •Data Mining: классификация, кластеризация, регрессия, ассоциативные правила, анализ отклонений
- •Контрольные вопросы
Контрольные вопросы
1. Какие цифровые технологии отнесены к сквозным? Сквозные цифровые технологии включают: искусственный интеллект (AI), квантовые вычисления, робототехнику, большие данные (Big Data), интернет вещей (IoT), новые производственные технологии (включая 3D-печать), технологии распределённого реестра (например, блокчейн), сенсорные технологии, нейротехнологии.
2. Что представляет собой система поддержки принятия решений (СППР)? СППР — это информационная система, предназначенная для помощи в принятии управленческих решений в условиях неопределённости, анализируя большие объёмы данных и предлагая возможные варианты решений.
3. Какова структура СППР? Структура СППР включает:
Базу данных (с фактическими данными),
Модельную базу (набор математических моделей),
Систему управления данными,
Пользовательский интерфейс (для взаимодействия с системой).
4. Понятие и структура ETL. ETL (Extract, Transform, Load) — процесс извлечения данных из источников, их преобразования к нужному формату и загрузки в хранилище данных. Структура:
Extract (извлечение): получение данных,
Transform (преобразование): очистка, валидация, форматирование данных,
Load (загрузка): сохранение данных в систему хранения.
5. Какие технологии входят в технологии Big Data? Технологии Big Data включают:
Hadoop,
Spark,
NoSQL базы данных (например, MongoDB, Cassandra),
Инструменты потоковой обработки данных (Kafka, Flink),
Машинное обучение для анализа больших данных.
6. Big Data: предиктивная аналитика. Примеры. Предиктивная аналитика предсказывает будущие события на основе данных. Примеры:
Прогнозирование урожайности в сельском хозяйстве,
Оценка кредитоспособности в банках,
Прогнозирование спроса на товары в ритейле.
7. Big Data: имитационное моделирование. Примеры. Имитационное моделирование воспроизводит реальные процессы для их изучения. Примеры:
Моделирование транспортных потоков в городе,
Симуляция роста урожая в зависимости от погодных условий,
Моделирование работы фабрики для оптимизации производства.
8. Big Data: визуализация данных, статистический анализ. Примеры.
Визуализация данных: построение графиков, тепловых карт, дашбордов (например, в Power BI или Tableau),
Статистический анализ: выявление закономерностей в поведении клиентов банка, анализ посещаемости интернет-магазинов.
9. Какие технологии включает Data Mining? Data Mining включает:
Классификацию,
Кластеризацию,
Ассоциативный анализ (поиск закономерностей),
Анализ отклонений (анализ аномалий),
Регрессионный анализ.
10. Примеры методов классификации и кластеризации:
Классификация: метод опорных векторов (SVM), деревья решений, логистическая регрессия,
Кластеризация: алгоритм k-средних (k-means), иерархическая кластеризация, DBSCAN.
11. Примеры применения в сельском хозяйстве методов регрессии, ассоциативных правил, анализа отклонений:
Регрессия: прогнозирование урожайности в зависимости от количества осадков и температуры,
Ассоциативные правила: выявление связей между типом почвы и эффективностью удобрений,
Анализ отклонений: обнаружение аномалий в показателях роста растений, выявление заражений или болезней растений.