592_voprosa_ответы_на_экз_ситиод
.docx____ — делает копию таблицы и размещает ее в другом месте, чтобы сократить время доступа.
Правильный ответ: Репликация(Replication)
____ — разбивает таблицу на подмножества строк или столбцов и размещает подмножества рядом с клиентским компьютером, чтобы сократить время доступа к данным.
Правильный ответ: Секционирование(Paritioning)
____ моделирование используется для проектирования хранилищ данных
Правильный ответ: пространственное
____ предоставляет информацию о временном интервале данных, хранящихся в таблице.
Правильный ответ: Переодичность(Periodicity)
____ предоставляют легко реализуемую модель для многомерного анализа данных, сохраняя при этом реляционные структуры, на которых строится операционная база данных.
Правильный ответ: Схемы «звезды»(star schemas)
____ распределенных систем баз данных отслеживает распределение и дублирование данных между сайтами (местоположениями).
Правильный ответ: словарь распределенных данных
______ — это технология расширенного анализа данных, которая поддерживает принятие решений, бизнес-моделирование и исследовательскую деятельность.
Правильный ответ: OLAP
_______ — предоставляет нисходящее представление данных, которое используется для двух основных целей: агрегирование и уточненный (drill-down)/ обобщеный (roll-up) анализ данных.
Правильный ответ: Иерархия Атрибутов
_______ — это квалифицирующие характеристики, которые обеспечивают дополнительные перспективы для данного факта
Правильный ответ: Размерность
________ - это инструмент управления эффективностью, который представляет результаты деятельности организации с нескольких точек зрения на одной странице.
Правильный ответ: Сбалансированная система показателей (Balanced Scorecard).
_________ - категория приложений и технологий для представления и анализа корпоративных и внешних данных
Правильный ответ: EIS
_________ - это категория приложений и технологий для представления и анализа корпоративных и внешних данных
Правильный ответ: EIS
_________ - это категория приложений и технологий для представления и анализа корпоративных и внешних данных.
Правильный ответ: EIS.
__________ - это система, в которой выполняются такие операции, как извлечение данных, преобразование и загрузка.
Правильный ответ: ETL
__________ - это система, в которой выполняются такие операции, как извлечение данных, преобразование и загрузка.
Правильный ответ: ETL
__________ имеет самый большой в мире кластер Hadoop.
Правильный ответ: Facebook
__________ лучше всего можно описать как модель программирования, используемую для разработки приложений на основе Hadoop, которые могут обрабатывать большие объемы данных.
Правильный ответ: MapReduce
____________ - это процесс сбора оперативных данных из одного или нескольких источников и их отображения, поле за полем, в новую структуру данных, в хранилище данных. (
Правильный ответ: Интеграция
_______________ - это процесс сбора оперативных данных из одного или нескольких источников и их отображения, поле за полем, в новую структуру данных в хранилище данных.
Правильный ответ: Интеграция
_______________ это политика хранения, используемая как для хранения, так и для вычислений.
Правильный ответ: Hot
________________ - «Аналитическая возможность» больших данных.
Правильный ответ: Запросы и создание отчётов
4 важнейших характеристики в big data
Правильный ответ: объем, разнообразие, скорость роста, достоверность
Apache Hadoop обеспечивает надежность путем репликации данных на несколько хостов и, следовательно, не требует ________ хранилища на хостах.
Правильный ответ: RAID
Apache Sqoop импортирует данные из реляционных баз данных в
Правильный ответ: HDFS
Application layer of client/server architecture
Правильный ответ: программирует логику приложения
BI может стимулировать успех бизнеса с помощью:
Правильный ответ: Все из вышеперечисленного
BI может стимулировать успех бизнеса с точки зрения ____
Правильный ответ: Все из упомянутых
BI может стимулировать успех бизнеса с точки зрения …
Правильный ответ: Все вышеперечисленное.
BI&A это
Правильный ответ: методы, технологии, системы, практики, методологии и приложения, которые анализируют важные бизнес-данные, чтобы помочь предприятию лучше понять свой бизнес и рынок и принимать своевременные бизнес-решения
Business intelligence (BI) - это широкая категория прикладных программ, которая включает
Правильный ответ: Всё вышеперечисленное
Data Mining...
Правильный ответ: Второй и третий вариант верны
Datamart это подмножество DWM
Правильный ответ: Верно
DDBMS компоненты
Правильный ответ: включают в себя компьютерные рабочие станции, сетевое аппаратное и программное обеспечение, средства связи, процессор транзакций, процессор данных
DW предоставляет лучшее решение для управления данными для всех предприятий
Правильный ответ: Нет
DW предоставляет лучшие интегрированные данные, чем операционные базы данных
Правильный ответ: Да
ER моделирование - это форма проектирования, в которой мы храним данные в денормализованной форме, в то время как моделирование измерений предназначено для хранения данных в сильно нормализованной форме
Правильный ответ: Не верно
ETL используется для преобразования (преобразования) больших баз данных из одного формата или типа в другой
Правильный ответ: Правда
ETL - это ИТ-процесс, из которого данные из разных системных источников могут быть размещены в одном месте для программного анализа и выявления бизнес-идей.
Правильный ответ: Правда
ETL используется для переноса данных из одной базы данных в другую
Правильный ответ: Правда
ETL предполагает извлечение данных из скольких источников?
Правильный ответ: Неопределенное количество
ETL сокращается как
Правильный ответ: Extract,Transform,Load
ETL стоит использовать для
Правильный ответ: Извлечь, преобразовать, загрузить
ETL-Преобразование - это
Правильный ответ: Преобразование извлеченных данных из их предыдущей формы в форму, в которой они должны быть, чтобы их можно было поместить в другую базу данных
Facebook занимается большими данными с _______ на основе Hadoop.
Правильный ответ: «Проект Призма»
Hadoop - это фреймворк, который работает с различными связанными инструментами. Общие когорты включают в себя:
Правильный ответ: MapReduce, Hive и HBase
Hadoop - это фреймворк, который работает с различными связанными инструментами. Общие когорты включают ____________
Правильный ответ: MapReduce, Hive и HBase
HTTP-доступ по NameNode по умолчанию осуществляется по номеру порта
Правильный ответ: 50070
Memtables and SStables создаются в соответствии с…
Правильный ответ: Column family
MOLAP относится _________ OLAP.
Правильный ответ: к многмерной
MOLAP расширяет функциональность OLAP для многомерных ____.
Правильный ответ: систем управления базами данных
NoSQL был разработан с учётом требований безопасности, поэтому разработчикам не нужно беспокоиться о реализации этого требования.
Правильный ответ: Нет.
ODS используется для повседневных решений
Правильный ответ: Верно
OLAP — это
Правильный ответ: онлайновая аналитическая обработка данных (Online analytical processing)
OLAP — это
Правильный ответ: онлайновая аналитическая обработка данных (Online analytical processing)
OLAP означает:
Правильный ответ: Аналитическая обработка онлайн.
OLTP системы есть
Правильный ответ: Операционные системы
ROLAP относится к _______ OLAP.
Правильный ответ: реляционному
SELECT item name, color, clothes SIZE, SUM(quantity)
FROM sales
GROUP BY rollup(item name, color, clothes SIZE);
Сколько группировок возможно в данном примере?
Правильный ответ: 4.
Slice and Dice - термин, который лучше всего описывает
Правильный ответ: Разделение некоторого количества информации на более мелкие части, непосредственно для более тщательного анализа или для других целей.
Агрегации строятся из _________________ путем изменения степени детализации для определенных измерений.
Правильный ответ: Таблиц фактов.
Аналитические системы
Правильный ответ: Всё вышеперечисленное
Архитектура клиент-серверной базы данных это когда
Правильный ответ: клиенты запускают клиентское программное обеспечение, набор серверов, которые обеспечивают все функции базы данных, и надежную инфраструктуру связи
Атрибут _______ - это атрибут, который идентифицирует столбцы в основной таблице и может использоваться как внешний ключ в другой таблице.
Правильный ответ: KEY
Базы данных NoSQL запрещают использование SQL?
Правильный ответ: Нет.
Бизнес-аналитика – это комплексная информация о клиентах, конкурентах и собственных внутренних операциях, которая дает возможность принимать эффективные, ответственные и стратегические бизнес-решения.
Правильный ответ: Да.
Бизнес-аналитика (BI) - это широкая категория прикладных программ, которая включает
Правильный ответ: Все из упомянутых
Бизнес-аналитика (BI) - это широкая категория прикладных программ, которая включает в себя
Правильный ответ: Все вышеперечисленное.
Бизнес-аналитика (BI) - это широкая категория прикладных программ, которая включает в себя:
Правильный ответ: Все из вышеперечисленного
Бизнес-аналитика повышает эффективность маркетинга, позволяя маркетологам
Правильный ответ: Все вышеперечисленное.
Бизнес-аналитика позволяет в реальном времени просматривать финансовую картину компании. К чему из нижеперечисленного может получить доступ финансовый менеджер через BI?
Правильный ответ: Прибыль и убытки, общая бухгалтерская книга и балансовые показатели.
Благодаря какой модели, созданной Google, становится доступным для использования Hadoop?
Правильный ответ: MapReduce.
Более изысканная выборка требует
Правильный ответ: большее хранилище данных
Более изысканная выборка это
Правильный ответ: более детальная выборка
В NoSQL запрещено использование SQL?
Правильный ответ: Нет.
В NoSQL запрещено использование SQL.
Правильный ответ: Нет.
В OLAP нас интересуют ________.
Правильный ответ: Меры и размеры
В SQL кросс-таблицы создаются с использованием _______.
Правильный ответ: Slice
В SQL матричные отчеты (Сross-tab) создаются с использованием операции:
Правильный ответ: Поворот (Pivot).
В интеллектуальном анализе данных этот метод используется для прогнозирования будущего поведения и прогнозирования последствий изменений.
Правильный ответ: прогнозное моделирование
В интеллектуальном анализе данных этот метод используется для прогнозирования будущего поведения и прогнозирования изменений.
Правильный ответ: Прогнозирующее моделирование
В какой компании начала своё развитие СУБД Cassandra?
Правильный ответ: Facebook.
В какой ситуации наиболее актуально использование базы данных NoSQL?
Правильный ответ: Когда требуется извлечение больших объёмов данных.
В каком архитектурном стиле работает Hadoop?
Правильный ответ: master-slave
В каком виде Redis реализует NoSQL?
Правильный ответ: Хранилище в оперативной памяти (с опциональной стойкостью).
В каком моде не может быть запущен Hadoop
Правильный ответ: Отделённый (Separate)
В контексте Интернета это практика адаптации веб-страниц к характеристикам или предпочтениям отдельных пользователей.
Правильный ответ: персонализация
В любой аналитической системе время является критическим измерением.
Правильный ответ: Верно
В организации какое отношение между проектами и сотрудниками
Правильный ответ: Многие-ко-многим
В примере прогнозирования количества детей на основе численности аистов, количество детей составляют ...
Правильный ответ: Результат
В схеме «звезда» окружающие связанные таблицы вокруг центральных таблиц фактических измерений есть
Правильный ответ: Таблицы измерений
В схеме «звезда» таблицы измерений обычно не в нормальной форме Бойса — Кодда
Правильный ответ: Верно
В схеме «снежинка» нет никакой снежинки
Правильный ответ: Не верно
В чем заключается важнейшее преимущество использования ERP
Правильный ответ: Все вышеперечисленное
В чем заключается важнейшее преимущество использования ERP?
Правильный ответ: Все вышеперечисленное.
В чем заключается польза метода анализа временных и последовательных паттернов BI?
Правильный ответ: Построение тренда и отклонений и реализация последовательных паттернов.
В чем преимущество ERP систем
Правильный ответ: Все из вышеперечисленного
В чем преимущество хранения атрибутов в виде метаданных
Правильный ответ: Позволяет разделять загрузку данных между несколькими инструментами
В чем преимущество хранения определений атрибутов в виде метаданных
Правильный ответ: Позволяет разделять правила загрузки данных между несколькими инструментами
В чем преимущество хранения определений атрибутов в виде метаданных?
Правильный ответ: Позволяет разделять правила загрузки данных между несколькими инструментами
В честь чего был назван Hadoop?
Правильный ответ: Игрушечный слон сына Каттинга
В честь чего назван Hadoop
Правильный ответ: Игрушка слона сына Каттинга
Вам был предоставлен доступ к оперативным данным компании, и вас попросили подготовить отчет. Вы обнаруживаете, что некоторые из данных, которые вам нужны, находятся в базе данных сервера SQL, а другие необходимые данные находятся в отдельной базе данных Oracle. Это пример______ .
Правильный ответ: Неинтегрированных данных
Вам даны данные о сейсмической активности в Японии, и вы хотите предсказать величину следующего землетрясения, это пример...
Правильный ответ: Контролируемого обучения
Верно ли, что базы данных MOLAP обычно дают лучшую производительность?
Правильный ответ: Верно.
Визуальным представлением обобщённой кросс-таблицы, является ____________, который также называется кубом данных.
Правильный ответ: двухмерный куб
Витрина данных это
Правильный ответ: специальное подмножество более крупного хранилища данных, в котором данные выбираются и организуются для определенного набора требований использования
Все из нижеперчисленного это концепции Cassandra data models кроме...
Правильный ответ: Row
Все приложения бизнес-аналитики требуют наличия хранилища данных.
Правильный ответ: Нет.
Все следующее точно описывает Hadoop, кроме ____________
Правильный ответ: Работает в режиме реального времени
Вы провели RFM-анализ вашего клиента. Мэри Джонс имеет оценку «1 1 5». Эта серия означает, что Мария ________.
Правильный ответ: Заказывала недавно, заказывает часто, но не делает большой заказ, когда заказывает
Выберите верное утверждение
Правильный ответ: BI дает предприятиям возможность извлекать выгоду из данных
Выберите верный подход Data Mining
Правильный ответ: Инфраструктура, разведка, анализ, интерпретация, эксплуатация
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: группировка участников в тренинге по снижению веса
Правильный ответ: Кластеризация
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: определение стоимости акций определенной компании
Правильный ответ: Прогнозирование
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: идентифицировать предметы, которые куплены одновременно большей частью покупателей, чтобы их можно было положить на полку
Правильный ответ: Ассоциативные правила
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: разделить рынок на отдельное подмножество клиентов, где каждое подмножеству может быть предложен определенный набор товаров
Правильный ответ: Кластеризация
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: найти группы документов, которые похожи друг на друга на основе важных терминов, содержащихся в них
Правильный ответ: Кластеризация
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: сократить стоимость рассылки, ориентируясь на группу потребителей, которые могут купить новый продукт для мобильных телефонов
Правильный ответ: Классификация
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: предсказать мошеннические случаи в транзакциях по кредитным картам (несколько ответов)
Правильные ответы: %50%Классификация, %50%Обнаружение аномалий
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: угадать скорости ветра на основе температуры, влажности, давления воздуха и т.д.
Правильный ответ: Прогнозирование
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: при заданном наборе из n точек или объектов, и k ожидаемого количества посторонних, найдите верхние k объектов, которые значительно отличаются, исключают или не соответствуют оставшимся данным
Правильный ответ: Обнаружение аномалий
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: основываясь на использовании предыдущих моделей, разработайте новую модель для авторизованных транзакций по кредитным картам
Правильный ответ: Обнаружение аномалий
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: дан набор объектов, с каждым объектом, связанным с его собственным временем событий, найти правила, которые предсказывают сильные последовательные зависимости между различными событиями
Правильный ответ: Последовательный анализ паттернов
Выберите задачу сбора данных, наиболее подходящую для следующего сценария: с данными записями книг, которые прочитала группа людей, найдите взаимосвязь жанров
Правильный ответ: Ассоциативные правила
Выберите неверное утверждение
Правильный ответ: BI - это категория программного обеспечения для баз данных, которая предоставляет интерфейс, который помогает пользователям быстро и в интерактивном режиме анализировать результаты в различных измерениях данных
Выберите преимущество метода K-ближайшего соседа в машинном обучении
Правильный ответ: Не требует предварительной подготовки
Выберите применение деревьев решений в машинном обучении
Правильный ответ: Классификация
Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение неожиданного / необычного объема расходов
Правильный ответ: Обнаружение аномалий
Выберите, какая задача сбора данных наиболее подходит для следующего сценария: диагностика уровня серьезности наводнения
Правильный ответ: Классификация
Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение рейтинга, когда местоположение рекомендовано члену туристического клуба
Правильный ответ: Прогнозирование
Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение группы туров, подходящей для нового участника, на основе ее прошлых рейтингов местоположения
Правильный ответ: Кластеризация
Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение большого пальца вверх или вниз на посте в социальной сети
Правильный ответ: Классификация
Выберите, какая задача сбора данных не является наиболее подходящей для следующего сценария: определение наилучшего местоположения, которое следует рекомендовать туристическому клубу (несколько ответов)
Правильный ответ: Прогнозирование
Выберите, какая задача сбора данных подходит для следующего сценария: сначала купите цифровую камеру, затем купите большие карты памяти SD
Правильный ответ: Последовательный анализ паттернов
Выберите, какая задача сбора данных является наиболее подходящей для следующего сценария: определение дозировки лекарства для определенного лечения
Правильный ответ: Прогнозирование
Высота, ширина это ______ тип данных
Правильный ответ: Непрерывный
Где Hadoop использовать нельзя?
Правильный ответ: Всё вышеперечисленное
Где Hadoop нельзя использовать?
Правильный ответ: Всё из вышеперечисленного
Где исполняется ETL как процесс?
Правильный ответ: Хранилище данных
Главное преимущество Yarn?
Правильный ответ: Механизм множественной обработки данных
Главный узел, который содержит информацию метаданных для всех блоков данных в HDFS
Правильный ответ: NameNode
Данные OLTP представляют собой комбинацию основных данных и …
Правильный ответ: Данных измерений
Данные в хранилище данных извлекаются и загружаются из операционных систем
Правильный ответ: Верно
Данные хранятся, извлекаются и обновляются в ____________?
Правильный ответ: OLTP.
Данные, которые могут быть смоделированы как измерения атрибутов, называются ____.
Правильный ответ: многомерными данными.
Дерево решений - это дерево, в котором каждый узел является либо ________________, либо узлом решения.
Правильный ответ: Листовым узлом
Для какого типа наборов данных подходит ли разделение k-средних
Правильный ответ: Отдельные кластеры
Для какого типа наборов данных подходит метод k-средних
Правильный ответ: Отдельные кластеры
Для концепции «момент времени» в DWH подготовка истории обязательна
Правильный ответ: Верно
Для обработки каких данных (в основном) больших объёмов используются базы данных NoSQL?
Правильный ответ: Неструктурированные.
Для чего используется древовидная диаграмма?
Правильный ответ: Выявить истинный уровень сложности проблемы
Для чего используется Наивный Байесовский классификатор? (
Правильный ответ: Генерация майнинговых моделей и оценка вероятности значения класса во время классификации и прогнозирования
Если для свойства mapred.job.tracker установлено значение по умолчанию, то jobtracker запускается как
Правильный ответ: «В процессе»
Загрузка данных - это процесс
Правильный ответ: запись данных в целевую базу данных
Задачи в MapReduce имеют
Правильный ответ: Ничего общего
Записи Cassandra сначала записываются в журнал фиксации на диске для...
Правильный ответ: Долговечности
Запись Cassandra успешна только когда...
Правильный ответ: Оба коммита успешно завершены
Зачем нужен Hadoop в аналитике больших данных?
Правильный ответ: Всё вышеперечисленное