Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

BigData тесты

.docx
Скачиваний:
3
Добавлен:
23.12.2024
Размер:
37.43 Кб
Скачать

<question> Что из перечисленного относится к основным характеристикам больших данных (Big Data)? <variant> Объем, скорость, разнообразие. <variant> Малый объем, высокая доступность, простота обработки <variant> Высокая стоимость, сложность, единый формат <variant> Легкость хранения, высокая согласованность данных, доступность <variant> Однородность данных, стабильность, низкая скорость обработки

<question> Какая технология используется для распределенной обработки больших данных? <variant> Apache Spark. <variant> Microsoft Excel <variant> SQL Server Management Studio <variant> Google Sheets <variant> Python IDE

<question> Какой формат данных наиболее часто используется при хранении больших объемов информации? <variant> JSON. <variant> DOCX <variant> PDF <variant> HTML <variant> PPT

<question> Что такое Hadoop Distributed File System (HDFS)? <variant> Распределенная файловая система для хранения больших данных. <variant> Программный инструмент для обработки текстов <variant> Система управления базами данных <variant> Облачная платформа для анализа данных <variant> Модуль для управления версиями кода

<question> Какая из перечисленных технологий подходит для обработки потоков данных в реальном времени? <variant> Apache Kafka. <variant> MySQL <variant> PostgreSQL <variant> Microsoft Word <variant> TensorFlow

<question> Что такое MapReduce? <variant> Модель программирования для обработки больших данных. <variant> Алгоритм машинного обучения <variant> Метод компрессии данных <variant> Средство визуализации данных <variant> Протокол передачи данных

<question> Какая база данных предназначена для обработки нереляционных данных? <variant> MongoDB. <variant> Oracle Database <variant> Microsoft Access <variant> PostgreSQL <variant> SQLite

<question> Какое преимущество имеет распределенное хранилище данных? <variant> Высокая отказоустойчивость и масштабируемость. <variant> Легкость интеграции с любым программным обеспечением <variant> Минимальная стоимость внедрения <variant> Низкое энергопотребление <variant> Возможность работы без доступа к сети

<question> Какой язык программирования чаще всего используется для анализа больших данных? <variant> Python. <variant> PHP <variant> C# <variant> Ruby <variant> Swift

<question> Что такое NoSQL базы данных? <variant> Базы данных, не использующие реляционную модель. <variant> Табличные базы данных <variant> Системы управления файлами <variant> Инструменты для анализа данных <variant> Протоколы сетевого взаимодействия

<question> Какая из перечисленных технологий используется для кластерного анализа данных? <variant> Apache Mahout. <variant> Microsoft Excel <variant> SQLite <variant> Tableau <variant> RStudio

<question> Что из перечисленного относится к облачным платформам для работы с большими данными? <variant> Google BigQuery. <variant> Notepad++ <variant> Adobe Photoshop <variant> IntelliJ IDEA <variant> GitHub Desktop

<question> Как называется процесс преобразования необработанных данных в структурированный вид? <variant> ETL (Extract, Transform, Load). <variant> MapReduce <variant> RDD (Resilient Distributed Dataset) <variant> DevOps <variant> IoT

<question> Какой тип базы данных чаще всего используется для хранения графовых данных? <variant> Neo4j. <variant> MySQL <variant> Cassandra <variant> Amazon S3 <variant> Apache Hive

<question> Какая концепция используется для горизонтального масштабирования в Big Data? <variant> Sharding (шардинг). <variant> Normalization (нормализация) <variant> Partitioning (разбиение) <variant> Fragmentation (фрагментация) <variant> Compression (сжатие)

<question> В чем заключается задача Data Mining? <variant> Извлечение полезной информации и знаний из данных. <variant> Сохранение всех данных <variant> Упрощение данных до минимального объема <variant> Создание случайных данных <variant> Удаление неиспользуемых данных

<question> Что такое «информация» в Data Mining? <variant> Обработанные данные, представляющие ценность для анализа. <variant> Все данные в системе <variant> Произвольные данные, которые можно собрать <variant> Личные данные пользователей <variant> Архивные данные

<question> Чем отличается «информация» от «знаний» в Data Mining? <variant> Информация — это обработанные данные, а знания — это осмысленные выводы. <variant> Информация — это сырые данные, а знания — это чистые данные <variant> Информация — это результат анализа, а знания — это сами данные <variant> Информация и знания не различаются <variant> Знания — это любые доступные данные

<question> Какую цель преследует извлечение знаний из данных? <variant> Обнаружение скрытых закономерностей и трендов. <variant> Создание отчетов с сырыми данными <variant> Упрощение хранения данных <variant> Выявление случайных ошибок <variant> Упрощение интерфейса пользователя

<question> Что можно считать результатом Data Mining? <variant> Знания, которые можно использовать для принятия решений. <variant> Неполные данные без обработки <variant> Исходные данные без изменений <variant> Исключительно текстовые отчеты <variant> Графические представления сырых данных

<question> Какую роль играет «информация» в Data Mining? <variant> Она служит промежуточным этапом для получения знаний. <variant> Является конечной целью Data Mining <variant> Определяет требования к базе данных <variant> Используется только для хранения данных <variant> Применяется для шифрования данных

<question> Почему важны знания, полученные из Data Mining? <variant> Они помогают в принятии обоснованных решений. <variant> Они ускоряют передачу данных <variant> Они увеличивают объем базы данных <variant> Они снижают потребность в анализе <variant> Они помогают удалить ненужные данные

<question> Какое из следующих утверждений описывает информацию? <variant> Данные, обработанные для дальнейшего анализа. <variant> Любые данные, которые собираются в системе <variant> Сырые данные, собранные из разных источников <variant> Только текстовые данные из базы данных <variant> Данные, которые не требуют обработки

<question> Зачем нужен этап извлечения информации в Data Mining? <variant> Чтобы подготовить данные для создания знаний. <variant> Чтобы снизить объем данных в системе <variant> Чтобы увеличить скорость обработки <variant> Чтобы создать резервную копию данных <variant> Чтобы сделать данные менее доступными

<question> В каком случае информация в Data Mining становится знанием? <variant> Когда она помогает принимать обоснованные решения. <variant> Когда она еще не обработана <variant> Когда хранится в базе данных <variant> Когда очищена от лишних данных <variant> Когда используется только в отчетах

<question> Какой результат является примером полученных знаний в Data Mining? <variant> Выявление закономерности в поведении клиентов. <variant> Создание таблицы со всеми данными <variant> Сортировка данных по дате <variant> Изменение формата данных <variant> Добавление данных в отчет

<question> В чем заключается основная ценность знаний, полученных из информации? <variant> В возможности использовать их для улучшения процессов. <variant> В уменьшении объема данных <variant> В создании резервной копии данных <variant> В очистке базы данных от ошибок <variant> В ускорении загрузки данных

<question> Какую задачу решает Data Mining в бизнесе? <variant> Повышение точности прогнозирования спроса. <variant> Архивирование старых данных <variant> Упрощение интерфейса отчетности <variant> Удаление дублирующихся данных <variant> Разделение данных по категориям

<question> Что позволяет сделать Data Mining с большими объемами данных? <variant> Превратить их в полезную информацию. <variant> Удалить их из базы данных <variant> Сохранить их в неизменном виде <variant> Разделить их на мелкие части <variant> Переименовать в новых форматах

<question> Как можно определить информацию в контексте Data Mining? <variant> Обработанные данные, подготовленные для анализа. <variant> Любые данные, которые собираются <variant> Только числовые данные в системе <variant> Текстовые данные, которые не используются <variant> Исключительно зашифрованные данные

<question> … – это процесс преобразования входных данных в выходные в контексте алгоритмов: <variant> Энкодинг. <variant> Итерация <variant> Отображение <variant> Компиляция <variant> Токенизация

<question> … – это распределенная база данных, разработанная для обработки больших объемов данных на множестве серверов без единой точки отказа; обеспечивает высокую доступность и масштабируемость: <variant> Cassandra. <variant> MongoDB <variant> Redis <variant> Elasticsearch <variant> SQLite

<question> Проклятием размерности в анализе данных называют … <variant> возрастание сложности и уменьшение точности анализа данных при увеличении их размерности. <variant> увеличение времени обработки данных с увеличением их объема <variant> сложности, возникающие при работе с данными большого объема <variant> проблемы с хранением больших объемов данных <variant> автоматизацию обработки данных с использованием нейронных сетей

<question> Автоматизировать запуск пакетных задач в рамках конвейера обработки больших данных по расписанию можно с помощью: <variant> Apache Kafka. <variant> Apache AirFlow <variant> Apache Hadoop <variant> Apache Hive <variant> PostgreSQL

<question> Формат Parquet считается: <variant> полуструктурированным. <variant> колоночным (столбцовым) <variant> строковым <variant> неструктурированным <variant> сетевым

<question> Для реализации микросервисной архитектуры и интеграции разрозненных систем подходит: <variant> Apache AirFlow. <variant> Apache Spark <variant> Apache Hadoop <variant> Apache Kafka <variant> Microsoft Excel

<question> Выберите технологию потоковой обработки событий в режиме реального времени: <variant> Spark Streaming. <variant> Apache Hadoop <variant> MapReduce <variant> Apache Hive <variant> Oracle Database

<question> Apache NiFi используется для: <variant> маршрутизации потоков Big Data и построения ETL-конвейеров. <variant> визуализации результатов аналитики <variant> эффективного хранения больших данных <variant> оптимизации SQL-запросов к DWH <variant> реализации чат-ботов

<question> Для распределенного глубокого машинного обучения (Deep Learning) больше подходит фреймворк: <variant> TensorFlow. <variant> Scikit-learn <variant> Flask <variant> PyTorch <variant> WordPress

<question> Для машинного обучения подходят данные: <variant> Предварительно подготовленные, очищенные от ошибок, пропусков и выбросов, а также нормализованные и представленные в виде числовых векторов. <variant> Бинарные <variant> Любых форматов в цифровом виде <variant> Числовые типа int <variant> Только текстовые

<question> Для полнотекстового интеллектуального поиска и аналитики по полуcтруктурированным данным в формате JSON отлично подходит СУБД: <variant> Elasticsearch. <variant> Cassandra <variant> Hive <variant> HBase <variant> SQLite

<question> Повысить производительность Apache Kafka можно с помощью: <variant> Повышения коэффициента репликации. <variant> Замены HDD-дисков на SSD <variant> Увеличения плотности разделов на каждом брокере <variant> Увеличения размера сообщений <variant> Снижения коэффициента репликации до нуля

<question> Анализировать данные, хранящиеся в Apache Hadoop, с помощью стандартного инструментария SQL-запросов: <variant> Можно. <variant> Может быть <variant> Иногда <variant> Нельзя <variant> Обязательно

<question> Укажите фактор, способствовавший появлению тренда больших данных: <variant> снижение издержек на хранение данных. <variant> маркетинговые кампании крупных корпораций <variant> появление новых технологий обработки потоковых данных <variant> выпуск баз данных с обработкой данных в памяти <variant> Отсутствие новых технологий хранения

<question> Выберите верный ответ: <variant> проблема больших данных – это такая проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна. <variant> большие данные – это обработка или хранение более 1 Тб информации <variant> большие данные – это огромная PR-акция крупных вендоров и не более того <variant> большие данные – это явление, когда цифровые данные наиболее полно представляют изучаемый объект <variant> Большие данные – это просто удобный способ управления файлами на компьютере

<question> Что такое анализ данных? <variant> Преобразование данных в полезную информацию. <variant> Сбор сырых данных <variant> Построение графиков <variant> Описание сложных алгоритмов <variant> Хранение информации

<question> Для чего нужен описательный анализ? <variant> Чтобы понять основные характеристики данных. <variant> Чтобы построить прогноз <variant> Чтобы найти ошибки в данных <variant> Чтобы создать модель <variant> Чтобы провести эксперимент

<question> Что такое медиана? <variant> Срединное значение в наборе данных. <variant> Самое большое значение <variant> Самое частое значение <variant> Среднее арифметическое <variant> Минимальное значение

<question> Какую цель имеет визуализация данных? <variant> Показывать данные на графиках для лучшего понимания. <variant> Сохранять данные в таблицах <variant> Собирать данные из разных источников <variant> Строить прогнозы <variant> Анализировать прошлые результаты

<question> Какая цель разведочного анализа? <variant> Найти закономерности в данных. <variant> Создать отчет <variant> Построить прогноз <variant> Разработать алгоритм <variant> Сохранить данные

<question> Какие данные называются сырыми? <variant> Те, которые не обработаны. <variant> Те, которые хранятся в базе данных <variant> Данные, которые уже визуализированы <variant> Данные, которые описывают средние значения <variant> Данные, которые используют в анализе

<question> Что такое переменная? <variant> Показатель, который может изменяться. <variant> Постоянная величина <variant> Итоговый показатель <variant> Срединное значение <variant> Информация, записанная в текстовом виде

<question> Какой пример количественных данных? <variant> Температура воздуха. <variant> Пол человека <variant> Город проживания <variant> Вид автомобиля <variant> Название компании

<question> Что такое мода в анализе данных? <variant> Самое частое значение. <variant> Среднее значение <variant> Минимальное значение <variant> Максимальное значение <variant> Срединное значение

<question> Что используется для наглядного представления данных? <variant> Графики и диаграммы. <variant> Таблицы с текстами <variant> Статистические отчеты <variant> Алгоритмы анализа <variant> Сырые данные

<question> Что описывает стандартное отклонение? <variant> Разброс данных вокруг среднего. <variant> Самое большое значение <variant> Разницу между минимумом и максимумом <variant> Частоту появления значений <variant> Связь между переменными

<question> Что такое временные ряды? <variant> Данные, упорядоченные по времени. <variant> Графики распределения <variant> Показатели среднего значения <variant> Данные, записанные в таблице <variant> Набор категориальных переменных

<question> Что представляет собой круговая диаграмма? <variant> График в виде круга, разделенного на части. <variant> Таблицу с данными <variant> Прямую линию на графике <variant> График в виде столбцов <variant> Текстовое описание данных

<question> Для чего используется описательный анализ? <variant> Для понимания основных характеристик данных. <variant> Для создания прогнозов <variant> Для экспериментов <variant> Для тестирования гипотез <variant> Для визуализации

<question> Что показывают гистограммы? <variant> Распределение данных. <variant> Связь между переменными <variant> Минимальные значения <variant> Максимальные значения <variant> Математические модели

<question> Что такое дерево решений? <variant> Графическая структура для принятия решений на основе условий. <variant> Модель, основанная на нейронных сетях <variant> Метод анализа временных рядов <variant> Программа для визуализации данных <variant> Алгоритм кластеризации

<question> Какие основные элементы включает дерево решений? <variant> Узлы, ветви, листья. <variant> Кластеры, центры, выбросы <variant> Столбцы, строки, ячейки <variant> Параметры, метрики, функции <variant> Наборы данных, графики, диаграммы

<question> Как называется вершина дерева решений? <variant> Корень. <variant> Лист <variant> Узел <variant> Ветвь <variant> Результат

<question> Что такое лист в дереве решений? <variant> Узел, который содержит итоговое решение. <variant> Начало дерева <variant> Промежуточное состояние между узлом и ветвью <variant> Условие разделения данных <variant> Метод построения дерева

<question> Для каких задач используют деревья решений? <variant> Для задач классификации и прогнозирования. <variant> Только для прогнозирования <variant> Только для кластеризации <variant> Для создания временных моделей <variant> Для оптимизации сетевых маршрутов

<question> Чем отличается задача классификации от задачи прогнозирования? <variant> Классификация определяет категорию, прогнозирование – числовое значение. <variant> Классификация предсказывает числовое значение, прогнозирование – категорию <variant> Классификация работает только с текстовыми данными <variant> Прогнозирование подходит только для временных рядов <variant> Разницы между ними нет

<question> Что такое глубина дерева? <variant> Максимальная длина пути от корня до листа. <variant> Количество данных в корне <variant> Количество узлов дерева <variant> Объем данных, обработанных деревом <variant> Количество ветвей на одном уровне

<question> Какой принцип лежит в основе разбиения данных на узлах? <variant> Оптимизация критериев разделения. <variant> Случайное распределение данных <variant> Упорядочивание данных по возрастанию <variant> Минимизация размера дерева <variant> Выбор максимальной дисперсии данных

<question> Какие критерии разбиения используются в деревьях решений? <variant> Gini index, энтропия. <variant> Среднее арифметическое, медиана <variant> Линейная регрессия <variant> Пороговые значения времени <variant> Алгоритмы кластеризации

<question> Что означает термин "ветвь" в дереве решений? <variant> Связь между двумя узлами. <variant> Условие, применяемое в корневом узле <variant> Итоговый результат модели <variant> Уровень дерева <variant> Место хранения данных

<question> Что происходит, если дерево решений становится слишком глубоким? <variant> Возникает проблема переобучения. <variant> Модель становится устойчивой к шуму <variant> Модель лучше предсказывает на тестовых данных <variant> Увеличивается точность модели <variant> Происходит улучшение интерпретируемости

<question> Какую роль играет корневой узел в дереве решений? <variant> Разделяет данные на основе первого условия. <variant> Описывает итоговый результат <variant> Определяет глубину дерева <variant> Содержит итоговые категории <variant> Не имеет особого значения

<question> Какое преимущество имеют деревья решений перед другими моделями? <variant> Простота интерпретации и визуализации. <variant> Всегда достигают 100% точности <variant> Подходят только для небольших наборов данных <variant> Не требуют настройки параметров <variant> Работают только с категориальными данными

<question> Почему важно ограничивать глубину дерева? <variant> Для уменьшения переобучения. <variant> Для увеличения объема данных <variant> Для повышения скорости работы модели <variant> Для увеличения количества листьев <variant> Для улучшения визуализации

<question> В чем заключается процесс обучения дерева решений? <variant> В поиске оптимального критерия разделения данных. <variant> В случайном распределении данных по листьям <variant> В построении глубокой структуры дерева без ограничений <variant> В использовании предобученных моделей <variant> В оптимизации данных перед их разделением

<question> Какую гипотезу использует алгоритм K-ближайших соседей (KNN) для классификации объектов? <variant> Гипотезу компактности, предполагающую схожесть близко расположенных объектов. <variant> Гипотезу независимости признаков объектов <variant> Гипотезу нормального распределения признаков <variant> Гипотезу отсутствия выбросов в данных <variant> Гипотезу равномерного распределения объектов по пространству признаков

<question> Какой из следующих шагов является первым в алгоритме K-ближайших соседей (KNN)? <variant> Вычисление расстояния между тестовым и обучающими образцами. <variant> Выбор параметра k <variant> Определение среднего арифметического среди соседей <variant> Повторение процесса для всех тестовых образцов <variant> Нормализация данных перед классификацией

<question> Какая из следующих метрик используется для вычисления длины отрезка между двумя объектами в пространстве признаков? <variant> Евклидово расстояние. <variant> Манхэттенское расстояние <variant> Косинусное расстояние <variant> Хэммингово расстояние <variant> Чебышёвское расстояние

<question> Какая из следующих метрик наиболее простая и общепринятая? <variant> Евклидово расстояние. <variant> Манхэттенское расстояние <variant> Косинусное расстояние <variant> Хэммингово расстояние <variant> Чебышёвское расстояние

<question> Как расшифровывается аббревиатура KNN? <variant> K-Nearest Neighbors. <variant> Kernel Neural Network <variant> Key Node Network <variant> Knowledge Neural Net <variant> Kinetic Nearest Nodes

<question> Что представляет собой древовидная структура, в основе которой лежит разбиение исходного пространства данных на вложенные гиперсферы? <variant> BallTree. <variant> Decision Tree <variant> B-дерево <variant> R-дерево <variant> Tree

<question> Древовидная структура, отдалённо напоминающая BallTree, при которой гиперплоскости используются для разбиения точек вместо гиперсфер? <variant> KD-Tree (k-dimensional tree). <variant> Decision Tree <variant> BallTree <variant> R-дерево <variant> Tree

<question> На какие две фазы можно разделить работу алгоритма K-ближайших соседей (KNN)? <variant> Фаза обучения и фаза классификации. <variant> Фаза предобработки и нормализации <variant> Настройка гиперпараметров и оптимизация <variant> Фаза тестирования и валидации <variant> Регрессия и прогнозирование

<question> Что происходит при обучении алгоритма K-ближайших соседей (KNN)? <variant> Алгоритм запоминает векторы признаков и метки классов наблюдений. <variant> Алгоритм строит дерево для классификации <variant> Алгоритм определяет центры кластеров <variant> Алгоритм уменьшает размерность данных с помощью PCA <variant> Алгоритм создает модель для прогнозирования

<question> Какую проблему испытывает алгоритм KNN при наличии дисбаланса классов в обучающих данных? <variant> Смещение решения в сторону доминирующего класса. <variant> Увеличение количества соседей <variant> Пониженная точность для категориальных признаков <variant> Невозможность обработки непрерывных признаков <variant> Сложности в определении числа соседей (k)

<question> Какую роль играет параметр k в алгоритме K-ближайших соседей (KNN)? <variant> Определяет количество ближайших соседей, учитываемых при классификации. <variant> Определяет метод нормализации данных <variant> Определяет размерность пространства признаков <variant> Определяет количество обучающих данных <variant> Определяет максимальную глубину дерева решений

<question> Что происходит, если параметр k в алгоритме KNN слишком мал? <variant> Модель может быть чувствительна к шуму и переобучению. <variant> Модель будет слишком простой и иметь высокую ошибку <variant> Модель будет работать с меньшим количеством данных <variant> Модель будет менее подвержена переобучению <variant> Модель будет игнорировать все ближайшие объекты

<question> Какое расстояние чаще всего используется для вычисления расстояния между объектами с непрерывными признаками в алгоритме KNN? <variant> Евклидово расстояние. <variant> Манхэттенское расстояние <variant> Косинусное расстояние <variant> Расстояние Махаланобиса <variant> Хэммингово расстояние

<question> Какую метрику для вычисления расстояния между объектами с категориальными признаками использует алгоритм KNN? <variant> Расстояние Хэмминга. <variant> Евклидово расстояние <variant> Манхэттенское расстояние <variant> Косинусное расстояние <variant> Расстояние Махаланобиса

<question> Что из следующего является способом борьбы с проблемой дисбаланса классов в алгоритме KNN? <variant> Применение взвешивания соседей при голосовании. <variant> Уменьшение размера выборки данных <variant> Использование линейной регрессии вместо KNN <variant> Применение метода опорных векторов <variant> Игнорирование редких классов в обучающих данных

<question> Что не относится к кластерному анализу? <variant> Явное предсказание значений переменных. <variant> Разработка типологии или классификации <variant> Исследование полезных концептуальных схем группирования объектов <variant> Порождение гипотез на основе исследования данных <variant> Проверка гипотез для определения, действительно ли типы (группы), присутствуют в имеющихся данных

<question> Иерархическая кластеризация это <variant> Совокупность алгоритмов упорядочивания данных, направленных на создание иерархии (дерева) вложенных кластеров. <variant> Метод оптимизации для настройки параметров модели <variant> Модели глубокого обучения, предназначенные для распознавания сложных паттернов <variant> Структура, встречающаяся в рекуррентных нейронных сетях <variant> Метод ансамблевого обучения, используемый для улучшения устойчивости классификаторов

<question> Для построения матрицы сходства (различия) необходимо задать ... <variant> Меру расстояния между двумя кластерами. <variant> Обучающие данные <variant> Неверные или неполные данные <variant> Шумные или избыточные данные <variant> Личные предпочтения и субъективные мнения

<question> Метод одиночной связи, так же известен как <variant> Метод ближайшего соседа. <variant> Метод полного связывания <variant> Метод срединного связывания <variant> Метод центроидного связывания <variant> Метод Уорда

<question> Метод полной связи, так же известен как <variant> Метод дальнего соседа <variant> Метод одиночной связи <variant> Метод среднего квадратичного отклонения <variant> Метод "K-средних" <variant> Метод с использованием метрической кластеризации

<question> Методы какого анализа используются в методе Уорда <variant> Дисперсионного. <variant> Многомерного <variant> Визуального <variant> Динамического <variant> Статического

<question> Кластерный анализ это <variant> Многомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы. <variant> Метод анализа зависимостей между переменными <variant> Метод оценки параметров модели, который минимизирует сумму квадратов отклонений между наблюдаемыми и предсказанными значениями <variant> Процесс упорядочивания объектов по некоторому критерию <variant> Математический метод, используемый для анализа сигналов и преобразования их в частотную область

<question> Задача кластеризации относится к … <variant> Статистической обработке, а также к широкому классу задач обучения без учителя. <variant> Прогнозированию <variant> Классификации <variant> Регрессии <variant> Понижению размерности

<question> Какую из задач не выполняет Кластерный анализ <variant> Предсказания. <variant> Разработка типологии или классификации <variant> Исследование полезных концептуальных схем группирования объектов <variant> Порождение гипотез на основе исследования данных <variant> Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных

<question> Признаковое описание объектов это <variant> Каждый объект описывается набором своих характеристик, называемых признаками. <variant> Процесс оптимизации параметров модели на основе входных данных <variant> Разработка алгоритмов для поиска аномалий в данных <variant> Процесс визуализации данных для лучшего их восприятия <variant> Построение статистических моделей для проверки гипотез

Соседние файлы в предмете Базы данных