
BigData тесты
.docx<question> Матрица расстояний между объектами это <variant> Каждый объект описывается расстояниями до всех остальных объектов метрического пространства. <variant> Список всех признаков объектов <variant> Метод кластеризации объектов на основе их схожести <variant> Алгоритм классификации объектов на основе их характеристик <variant> Набор данных, который содержит только числовые значения, а не текстовую информацию
<question> Матрица сходства между объектами это <variant> Учитывается степень сходства объекта с другими объектами выборки в метрическом пространстве. <variant> Процесс вычисления расстояний между объектами <variant> Метод уменьшения размерности данных для упрощения анализа. <variant> Метод классификации объектов по заранее определенным категориям <variant> Алгоритм кластеризации объектов на основе их признаков
<question> Когда крупные кластеры дробятся на более мелкие, те в свою очередь дробятся ещё мельче, и т. д. Такие задачи называются <variant> Задачами таксономии. <variant> Метод k-средних <variant> Метод динамического программирования <variant> Метод Монте-Карло <variant> Метод главных компонентов
<question> Результатом таксономии является <variant> Древообразная иерархическая структура. <variant> Решение задачи классификации объектов <variant> Определение сходства между объектами <variant> Группировка объектов в кластеры на основе их признаков <variant> Алгоритм оптимизации для поиска минимальных значений
<question> Центроидный метод это <variant> Расстояние между кластерами полагается равным расстоянию между их центроидами (центрами массы). <variant> Метод кластеризации, основанный на фиксированном количестве кластеров <variant> Метод, который используется для уменьшения размерности данных <variant> Метод, который использует только расстояние между объектами для их классификации <variant> Метод, в котором кластеры создаются на основе заранее заданных меток классов
<question> Что такое кластерный анализ? <variant> Метод анализа, позволяющий группировать объекты для выявления скрытых структур и закономерностей в данных. <variant> Метод, применяемый только для построения временных рядов и прогнозирования <variant> Процесс создания отчетов и диаграмм для визуализации данных <variant> Статистическая методика, используемая исключительно для вычисления средних значений <variant> Подход к обработке данных, ограничивающийся анализом текстовых данных
<question> Какие классовые методы используются в кластерном анализе для оптимизации распределения объектов по кластерам? <variant> Итеративный метод. <variant> Корреляционный метод <variant> Регрессионный метод <variant> Комбинаторный метод <variant> Детерминированный метод
<question> Что такое итеративный метод? <variant> Это подход в кластерном анализе, при котором решение задачи достигается через последовательные повторяющиеся шаги(итерации). <variant> Это метод классификации данных на основе предварительно заданных категорий <variant> Это процесс однократного распределения данных по кластерам без дальнейших изменений <variant> Это статистический метод для определения линейных зависимостей между переменными <variant> Это способ визуализации данных для обнаружения аномалий
<question> Какой из методов является итеративным методом кластерного анализа? <variant> Метод k-средних. <variant> Метод линейной регрессии <variant> Метод главных компонент <variant> Метод временных рядов <variant> Метод корреляционного анализа
<question> Какой метод кластерного анализа делит данные на k кластеров на основе схожести объектов? <variant> Метод k-средних. <variant> Метод линейной регрессии <variant> Метод главных компонент <variant> Метод временных рядов <variant> Метод ближайших соседей
<question> Что такое метод k-средних? <variant> Метод кластерного анализа, который делит данные на k кластеров на основе схожести объектов. <variant> Метод статистического анализа для оценки корреляций между переменными <variant> Алгоритм сортировки данных по убыванию значений <variant> Метод анализа временных рядов для прогнозирования будущих значений <variant> Процесс нахождения линейной зависимости между переменными
<question> Что такое EM-алгоритм? <variant> Алгоритм кластерного анализа, основанный на вероятностной модели, включающий фазы ожидания и максимизации. <variant> Метод классификации данных, который использует линейные зависимости между переменными <variant> Способ нахождения корреляций между различными переменными в наборе данных <variant> Алгоритм для сортировки данных по заданному критерию <variant> Метод для визуализации временных рядов и прогнозирования будущих значений
<question> В какой области применяются итеративные методы? <variant> Кластерный анализ. <variant> Генетика <variant> Астрономия <variant> Психология <variant> Квантовая механика
<question> Для какой цели чаще всего используются итеративные методы в анализе данных? <variant> Для группировки объектов по схожим характеристикам. <variant> Для визуализации временных рядов <variant> Для изучения причинно-следственных связей <variant> Для прогнозирования будущих значений переменных <variant> Для анализа текстовых данных на наличие ошибок
<question> Что такое Fuzzy C-means? <variant> Алгоритм кластерного анализа, который позволяет объектам принадлежать сразу нескольким кластерам с разными степенями принадлежности. <variant> Метод регрессии, применяемый для предсказания значений в непрерывных данных <variant> Способ уменьшения размерности данных для их упрощенного анализа <variant> Алгоритм сортировки данных по числовым значениям для дальнейшего анализа <variant> Метод корреляционного анализа для выявления зависимостей между переменными
<question> Какой алгоритм позволяет объектам принадлежать нескольким кластерам с разными степенями принадлежности? <variant> Fuzzy C-means. <variant> Алгоритм ближайших соседей <variant> DBSCAN <variant> Метод главных компонент <variant> Метод линейной регрессии
<question> Что такое ISODATA? <variant> Алгоритм кластерного анализа, который объединяет и разделяет кластеры на основе определённых критериев для улучшения результатов. <variant> Метод уменьшения размерности данных для визуализации <variant> Способ нахождения корреляций между переменными <variant> Алгоритм сортировки данных по возрастанию значений <variant> Метод линейной регрессии для прогнозирования временных рядов
<question> Какие еще классификации методов кластерного анализа существуют? <variant> Иерархический. <variant> Регрессионный <variant> Линейный <variant> Корреляционный <variant> Дисперсионный
<question> Что такое иерархический метод кластерного анализа? <variant> Метод, который создает иерархическую структуру кластеров, объединяя или разделяя объекты на каждом шаге. <variant> Метод, который классифицирует данные по линейным зависимостям между переменными <variant> Подход, основанный на случайном распределении объектов по кластерам <variant> Метод, предназначенный для прогнозирования временных рядов <variant> Алгоритм, использующий только плотность объектов для формирования кластеров
<question> Какова особенность итеративных методов кластерного анализа? <variant> Они многократно пересчитывают центры кластеров и перераспределяют объекты для оптимизации кластеров. <variant> Они создают фиксированное количество кластеров без повторных вычислений <variant> Они используют вероятностные модели для формирования кластеров <variant> Они требуют предварительного уменьшения размерности данных <variant> Они применяются только для анализа временных рядов
<question>Что из нижепечеченного описывает задачу, которую решает метод опорных векторов? <variant>Поиск разделяющей гиперплоскости между двумя классами в многомерном пространстве. <variant>Построение модели для прогнозирования числовых значений <variant>Классификация данных с явными пропусками <variant>Построение кластеров данных <variant>Определение оптимального числа кластеров для кластеризации
<question>Как метод опорных векторов (SVM) обрабатывает линейно неразделимые данные? <variant>Использует ядровые функции для отображения данных в пространство более высокой размерности. <variant>Применяет методы случайного леса для разделения классов <variant>Применяет многослойные нейронные сети для обучения <variant>Использует метод k-ближайших соседей для классификации <variant>Применяет линейные регрессии для нахождения гиперплоскости
<question>Что происходит при увеличении параметра C в методе опорных векторов? <variant>Модель стремится минимизировать ошибку классификации, возможно, переобучая данные. <variant>Модель становится менее чувствительной к шуму в данных <variant>Модель начинает игнорировать малые отклонения данных <variant>Модель становится более универсальной для всех типов данных <variant>Модель увеличивает размер тестовой выборки
<question>Как называется метод, который используется в SVM для разделения данных с помощью функции ядра? <variant>Ядерный метод (Kernel trick). <variant>Метод градиентного спуска <variant>Метод главных компонент <variant>Метод случайного леса <variant>Метод максимального правдоподобия
<question>Что означает параметр "отступ" (margin) в контексте метода опорных векторов? <variant>Расстояние между разделяющей гиперплоскостью и ближайшими к ней точками разных классов. <variant>Общее количество правильно классифицированных точек в выборке <variant>Количество итераций, выполненных для обучения модели <variant>Общее количество признаков, использованных для обучения модели <variant>Максимальная ошибка классификации
<question>Что происходит, если использовать слишком сложное ядро в SVM? <variant>Модель может переобучиться (overfitting). <variant>Модель не сможет разделить данные <variant>Модель не будет учитывать все признаки данных <variant>Модель будет слишком простой и не сможет решить задачу <variant>Модель будет слишком чувствительна к шуму в данных
<question>Что такое "поддерживающая векторная машина" (SVM)? <variant>Модель, которая находит разделяющую гиперплоскость, максимально удаленную от ближайших точек классов. <variant>Модель, которая минимизирует количество классификационных ошибок <variant>Алгоритм, который работает только с линейными данными <variant>Алгоритм, который использует случайные примеры для обучения <variant>Модель, которая классифицирует данные на основе сходства точек
<question>Какая из характеристик является преимуществом метода опорных векторов? <variant>Способность эффективно работать с высокоразмерными данными. <variant>Высокая интерпретируемость модели <variant>Простота в настройке гиперпараметров <variant>Требуется минимальное количество обучающих данных <variant>Малое количество вычислительных ресурсов
<question>Какой из параметров в SVM отвечает за выбор сложности модели? <variant>Параметр C. <variant>Количество обучающих примеров <variant>Глубина дерева решений <variant>Количество итераций <variant>Тип ядра
<question>Что будет происходить, если в SVM использовать линейное ядро для нелинейно разделимых данных? <variant>Модель может не справиться с задачей и дать плохие результаты. <variant>Модель будет классифицировать данные с высокой точностью <variant>Модель будет переобучена и не будет адекватно работать с новыми данными <variant>Модель автоматически выберет подходящее ядро <variant>Модель проигнорирует данные, не относящиеся к классам
<question>Что такое "опорные векторы" в методе опорных векторов (SVM)? <variant>Точки, которые лежат на границе между классами и определяют оптимальную разделяющую гиперплоскость. <variant>Все точки обучающей выборки, которые используются для обучения модели <variant>Точки, которые используются для проверки точности модели <variant>Случайные точки, выбранные из обучающей выборки <variant>Точки, находящиеся далеко от гиперплоскости классификации
<question>Какой тип данных метод опорных векторов (SVM) чаще всего используется для классификации? <variant>Линейно разделяемые данные. <variant>Нелинейно разделяемые данные <variant>Только категориальные данные <variant>Только числовые данные <variant>Данные с явными пропусками
<question>Какой из следующих ядерных методов используется в методе опорных векторов для работы с нелинейно разделяемыми данными? <variant>Ядро Радала. <variant>Ядро Сигмоида <variant>Ядро линейное <variant>Ядро Полиномиальное <variant>Ядро Логистическая регрессия
<question>Что означает "гиперплоскость" в контексте метода опорных векторов? <variant>Граница, разделяющая два класса в многомерном пространстве. <variant>Пересечение между обучающей выборкой и тестовой выборкой <variant>Плоскость, на которой строится модель регрессии <variant>Линия, проходящая через середину классов <variant>Область, в которой находятся все данные
<question>Какая роль имеет параметр C в методе опорных векторов (SVM)? <variant>Контролирует баланс между ошибкой классификации и максимизацией отступа. <variant>Определяет количество обучающих примеров, используемых для обучения модели <variant>Устанавливает максимальную глубину дерева для классификации <variant>Управляет количеством итераций для тренировки модели <variant>Определяет размер тестовой выборки
<question>Что из перечисленного является основной задачей Data Mining? <variant>Прогнозирование будущих данных на основе существующих. <variant>Хранение данных в базах данных <variant>Упрощение пользовательского интерфейса <variant>Защита данных от утечки <variant>Сжатие данных
<question>Какой метод Data Mining чаще всего используется для прогнозирования? <variant>Регрессия. <variant>Кластеризация <variant>Ассоциативные правила <variant>Отбор признаков <variant>Агрегация данных
<question>Что из ниже перечисленного является примером задачи визуализации данных? <variant>Построение диаграмм и графиков для анализа данных. <variant>Написание SQL-запросов <variant>Разработка модели машинного обучения <variant>Оптимизация параметров алгоритма <variant>Сжатие больших данных
<question>Какой из перечисленных инструментов наиболее часто используется для визуализации данных? <variant>Tableau. <variant>TensorFlow <variant>MySQL <variant>Apache Kafka <variant>Hadoop
<question>Что означает термин "кластеры" в Data Mining? <variant>Группы схожих данных. <variant>Столбцы в базе данных <variant>Объединение баз данных <variant>Форматы хранения данных <variant>Алгоритмы шифрования
<question>Какой из следующих методов используется для классификации данных? <variant>Дерево решений. <variant>Метод главных компонент <variant>К-средние <variant>Аппроксимация данных <variant>Генетический алгоритм
<question>Какой метод используется для нахождения скрытых паттернов в данных? <variant>Ассоциативные правила. <variant>Регрессия <variant>Временные ряды <variant>Стандартизация данных <variant>Фильтрация шума
<question>Какой тип алгоритмов используется для обработки временных рядов? <variant>ARIMA. <variant>К-средние <variant>Дерево решений <variant>Метод ближайших соседей <variant>Линейная регрессия
<question>Что из перечисленного является преимуществом визуализации данных? <variant>Упрощение понимания сложных данных. <variant>Увеличение скорости вычислений <variant>Уменьшение объема данных <variant>Повышение безопасности данных <variant>Оптимизация хранения данных
<question>Какой язык программирования чаще всего используется для визуализации данных? <variant>Python. <variant>C++ <variant>Java <variant>PHP <variant>Perl
<question>Какой из следующих алгоритмов относится к методам кластеризации? <variant>K-Means. <variant>Линейная регрессия <variant>Логистическая регрессия <variant>Дерево решений <variant>Градиентный бустинг
<question>Что из перечисленного является примером предобработки данных? <variant>Удаление пропущенных значений. <variant>Прогнозирование результатов <variant>Построение моделей <variant>Сравнение алгоритмов <variant>Оптимизация скорости работы алгоритма
<question>Какой инструмент позволяет создавать интерактивные визуализации данных? <variant>Power BI. <variant>Apache Spark <variant>MySQL <variant>Redis <variant>Git
<question>Что означает термин "оверфиттинг" в контексте машинного обучения? <variant>Модель слишком точно подстраивается под обучающие данные. <variant>Модель не может найти паттерны в данных <variant>Данные имеют слишком много шума <variant>Модель слишком медленно обучается <variant>Алгоритм использует все доступные данные
<question>Какой график лучше всего подходит для визуализации изменения данных во времени? <variant>Линейный график. <variant>Круговая диаграмма <variant>Гистограмма <variant>Точечный график <variant>График плотности