Добавил:
rushevamar@mail.ru Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

592_voprosa_ответы_на_экз_ситиод

.docx
Скачиваний:
14
Добавлен:
22.05.2022
Размер:
167.01 Кб
Скачать

____ — делает копию таблицы и размещает ее в другом месте, чтобы сократить время доступа.

Правильный ответ: Репликация(Replication)

____ — разбивает таблицу на подмножества строк или столбцов и размещает подмножества рядом с клиентским компьютером, чтобы сократить время доступа к данным.

Правильный ответ: Секционирование(Paritioning)

____ моделирование используется для проектирования хранилищ данных

Правильный ответ: пространственное

____ предоставляет информацию о временном интервале данных, хранящихся в таблице.

Правильный ответ: Переодичность(Periodicity)

____ предоставляют легко реализуемую модель для многомерного анализа данных, сохраняя при этом реляционные структуры, на которых строится операционная база данных.

Правильный ответ: Схемы «звезды»(star schemas)

____ распределенных систем баз данных отслеживает распределение и дублирование данных между сайтами (местоположениями).

Правильный ответ: словарь распределенных данных

______ — это технология расширенного анализа данных, которая поддерживает принятие решений, бизнес-моделирование и исследовательскую деятельность.

Правильный ответ: OLAP

_______ — предоставляет нисходящее представление данных, которое используется для двух основных целей: агрегирование и уточненный (drill-down)/ обобщеный (roll-up) анализ данных.

Правильный ответ: Иерархия Атрибутов

_______ — это квалифицирующие характеристики, которые обеспечивают дополнительные перспективы для данного факта

Правильный ответ: Размерность

________ - это инструмент управления эффективностью, который представляет результаты деятельности организации с нескольких точек зрения на одной странице.

Правильный ответ: Сбалансированная система показателей (Balanced Scorecard).

_________ - категория приложений и технологий для представления и анализа корпоративных и внешних данных

Правильный ответ: EIS

_________ - это категория приложений и технологий для представления и анализа корпоративных и внешних данных

Правильный ответ: EIS

_________ - это категория приложений и технологий для представления и анализа корпоративных и внешних данных.

Правильный ответ: EIS.

__________ - это система, в которой выполняются такие операции, как извлечение данных, преобразование и загрузка.

Правильный ответ: ETL

__________ - это система, в которой выполняются такие операции, как извлечение данных, преобразование и загрузка.

Правильный ответ: ETL

__________ имеет самый большой в мире кластер Hadoop.

Правильный ответ: Facebook

__________ лучше всего можно описать как модель программирования, используемую для разработки приложений на основе Hadoop, которые могут обрабатывать большие объемы данных.

Правильный ответ: MapReduce

____________ - это процесс сбора оперативных данных из одного или нескольких источников и их отображения, поле за полем, в новую структуру данных, в хранилище данных. (

Правильный ответ: Интеграция

_______________ - это процесс сбора оперативных данных из одного или нескольких источников и их отображения, поле за полем, в новую структуру данных в хранилище данных.

Правильный ответ: Интеграция

_______________ это политика хранения, используемая как для хранения, так и для вычислений.

Правильный ответ: Hot

________________ - «Аналитическая возможность» больших данных.

Правильный ответ: Запросы и создание отчётов

4 важнейших характеристики в big data

Правильный ответ: объем, разнообразие, скорость роста, достоверность

Apache Hadoop обеспечивает надежность путем репликации данных на несколько хостов и, следовательно, не требует ________ хранилища на хостах.

Правильный ответ: RAID

Apache Sqoop импортирует данные из реляционных баз данных в

Правильный ответ: HDFS

Application layer of client/server architecture

Правильный ответ: программирует логику приложения

BI может стимулировать успех бизнеса с помощью:

Правильный ответ: Все из вышеперечисленного

BI может стимулировать успех бизнеса с точки зрения ____

Правильный ответ: Все из упомянутых

BI может стимулировать успех бизнеса с точки зрения …

Правильный ответ: Все вышеперечисленное.

BI&A это

Правильный ответ: методы, технологии, системы, практики, методологии и приложения, которые анализируют важные бизнес-данные, чтобы помочь предприятию лучше понять свой бизнес и рынок и принимать своевременные бизнес-решения

Business intelligence (BI) - это широкая категория прикладных программ, которая включает

Правильный ответ: Всё вышеперечисленное

Data Mining...

Правильный ответ: Второй и третий вариант верны

Datamart это подмножество DWM

Правильный ответ: Верно

DDBMS компоненты

Правильный ответ: включают в себя компьютерные рабочие станции, сетевое аппаратное и программное обеспечение, средства связи, процессор транзакций, процессор данных

DW предоставляет лучшее решение для управления данными для всех предприятий

Правильный ответ: Нет

DW предоставляет лучшие интегрированные данные, чем операционные базы данных

Правильный ответ: Да

ER моделирование - это форма проектирования, в которой мы храним данные в денормализованной форме, в то время как моделирование измерений предназначено для хранения данных в сильно нормализованной форме

Правильный ответ: Не верно

ETL используется для преобразования (преобразования) больших баз данных из одного формата или типа в другой

Правильный ответ: Правда

ETL - это ИТ-процесс, из которого данные из разных системных источников могут быть размещены в одном месте для программного анализа и выявления бизнес-идей.

Правильный ответ: Правда

ETL используется для переноса данных из одной базы данных в другую

Правильный ответ: Правда

ETL предполагает извлечение данных из скольких источников?

Правильный ответ: Неопределенное количество

ETL сокращается как

Правильный ответ: Extract,Transform,Load

ETL стоит использовать для

Правильный ответ: Извлечь, преобразовать, загрузить

ETL-Преобразование - это

Правильный ответ: Преобразование извлеченных данных из их предыдущей формы в форму, в которой они должны быть, чтобы их можно было поместить в другую базу данных

Facebook занимается большими данными с _______ на основе Hadoop.

Правильный ответ: «Проект Призма»

Hadoop - это фреймворк, который работает с различными связанными инструментами. Общие когорты включают в себя:

Правильный ответ: MapReduce, Hive и HBase

Hadoop - это фреймворк, который работает с различными связанными инструментами. Общие когорты включают ____________

Правильный ответ: MapReduce, Hive и HBase

HTTP-доступ по NameNode по умолчанию осуществляется по номеру порта

Правильный ответ: 50070

Memtables and SStables создаются в соответствии с…

Правильный ответ: Column family

MOLAP относится _________ OLAP.

Правильный ответ: к многмерной

MOLAP расширяет функциональность OLAP для многомерных ____.

Правильный ответ: систем управления базами данных

NoSQL был разработан с учётом требований безопасности, поэтому разработчикам не нужно беспокоиться о реализации этого требования.

Правильный ответ: Нет.

ODS используется для повседневных решений

Правильный ответ: Верно

OLAP — это

Правильный ответ: онлайновая аналитическая обработка данных (Online analytical processing)

OLAP — это

Правильный ответ: онлайновая аналитическая обработка данных (Online analytical processing)

OLAP означает:

Правильный ответ: Аналитическая обработка онлайн.

OLTP системы есть

Правильный ответ: Операционные системы

ROLAP относится к _______ OLAP.

Правильный ответ: реляционному

SELECT item name, color, clothes SIZE, SUM(quantity)

FROM sales

GROUP BY rollup(item name, color, clothes SIZE);

Сколько группировок возможно в данном примере?

Правильный ответ: 4.

Slice and Dice - термин, который лучше всего описывает

Правильный ответ: Разделение некоторого количества информации на более мелкие части, непосредственно для более тщательного анализа или для других целей.

Агрегации строятся из _________________ путем изменения степени детализации для определенных измерений.

Правильный ответ: Таблиц фактов.

Аналитические системы

Правильный ответ: Всё вышеперечисленное

Архитектура клиент-серверной базы данных это когда

Правильный ответ: клиенты запускают клиентское программное обеспечение, набор серверов, которые обеспечивают все функции базы данных, и надежную инфраструктуру связи

Атрибут _______ - это атрибут, который идентифицирует столбцы в основной таблице и может использоваться как внешний ключ в другой таблице.

Правильный ответ: KEY

Базы данных NoSQL запрещают использование SQL?

Правильный ответ: Нет.

Бизнес-аналитика – это комплексная информация о клиентах, конкурентах и собственных внутренних операциях, которая дает возможность принимать эффективные, ответственные и стратегические бизнес-решения.

Правильный ответ: Да.

Бизнес-аналитика (BI) - это широкая категория прикладных программ, которая включает

Правильный ответ: Все из упомянутых

Бизнес-аналитика (BI) - это широкая категория прикладных программ, которая включает в себя

Правильный ответ: Все вышеперечисленное.

Бизнес-аналитика (BI) - это широкая категория прикладных программ, которая включает в себя:

Правильный ответ: Все из вышеперечисленного

Бизнес-аналитика повышает эффективность маркетинга, позволяя маркетологам

Правильный ответ: Все вышеперечисленное.

Бизнес-аналитика позволяет в реальном времени просматривать финансовую картину компании. К чему из нижеперечисленного может получить доступ финансовый менеджер через BI?

Правильный ответ: Прибыль и убытки, общая бухгалтерская книга и балансовые показатели.

Благодаря какой модели, созданной Google, становится доступным для использования Hadoop?

Правильный ответ: MapReduce.

Более изысканная выборка требует

Правильный ответ: большее хранилище данных

Более изысканная выборка это

Правильный ответ: более детальная выборка

В NoSQL запрещено использование SQL?

Правильный ответ: Нет.

В NoSQL запрещено использование SQL.

Правильный ответ: Нет.

В OLAP нас интересуют ________.

Правильный ответ: Меры и размеры

В SQL кросс-таблицы создаются с использованием _______.

Правильный ответ: Slice

В SQL матричные отчеты (Сross-tab) создаются с использованием операции:

Правильный ответ: Поворот (Pivot).

В интеллектуальном анализе данных этот метод используется для прогнозирования будущего поведения и прогнозирования последствий изменений.

Правильный ответ: прогнозное моделирование

В интеллектуальном анализе данных этот метод используется для прогнозирования будущего поведения и прогнозирования изменений.

Правильный ответ: Прогнозирующее моделирование

В какой компании начала своё развитие СУБД Cassandra?

Правильный ответ: Facebook.

В какой ситуации наиболее актуально использование базы данных NoSQL?

Правильный ответ: Когда требуется извлечение больших объёмов данных.

В каком архитектурном стиле работает Hadoop?

Правильный ответ: master-slave

В каком виде Redis реализует NoSQL?

Правильный ответ: Хранилище в оперативной памяти (с опциональной стойкостью).

В каком моде не может быть запущен Hadoop

Правильный ответ: Отделённый (Separate)

В контексте Интернета это практика адаптации веб-страниц к характеристикам или предпочтениям отдельных пользователей.

Правильный ответ: персонализация

В любой аналитической системе время является критическим измерением.

Правильный ответ: Верно

В организации какое отношение между проектами и сотрудниками

Правильный ответ: Многие-ко-многим

В примере прогнозирования количества детей на основе численности аистов, количество детей составляют ...

Правильный ответ: Результат

В схеме «звезда» окружающие связанные таблицы вокруг центральных таблиц фактических измерений есть

Правильный ответ: Таблицы измерений

В схеме «звезда» таблицы измерений обычно не в нормальной форме Бойса — Кодда

Правильный ответ: Верно

В схеме «снежинка» нет никакой снежинки

Правильный ответ: Не верно

В чем заключается важнейшее преимущество использования ERP

Правильный ответ: Все вышеперечисленное

В чем заключается важнейшее преимущество использования ERP?

Правильный ответ: Все вышеперечисленное.

В чем заключается польза метода анализа временных и последовательных паттернов BI?

Правильный ответ: Построение тренда и отклонений и реализация последовательных паттернов.

В чем преимущество ERP систем

Правильный ответ: Все из вышеперечисленного

В чем преимущество хранения атрибутов в виде метаданных

Правильный ответ: Позволяет разделять загрузку данных между несколькими инструментами

В чем преимущество хранения определений атрибутов в виде метаданных

Правильный ответ: Позволяет разделять правила загрузки данных между несколькими инструментами

В чем преимущество хранения определений атрибутов в виде метаданных?

Правильный ответ: Позволяет разделять правила загрузки данных между несколькими инструментами

В честь чего был назван Hadoop?

Правильный ответ: Игрушечный слон сына Каттинга

В честь чего назван Hadoop

Правильный ответ: Игрушка слона сына Каттинга

Вам был предоставлен доступ к оперативным данным компании, и вас попросили подготовить отчет. Вы обнаруживаете, что некоторые из данных, которые вам нужны, находятся в базе данных сервера SQL, а другие необходимые данные находятся в отдельной базе данных Oracle. Это пример______ .

Правильный ответ: Неинтегрированных данных

Вам даны данные о сейсмической активности в Японии, и вы хотите предсказать величину следующего землетрясения, это пример...

Правильный ответ: Контролируемого обучения

Верно ли, что базы данных MOLAP обычно дают лучшую производительность?

Правильный ответ: Верно.

Визуальным представлением обобщённой кросс-таблицы, является ____________, который также называется кубом данных.

Правильный ответ: двухмерный куб

Витрина данных это

Правильный ответ: специальное подмножество более крупного хранилища данных, в котором данные выбираются и организуются для определенного набора требований использования

Все из нижеперчисленного это концепции Cassandra data models кроме...

Правильный ответ: Row

Все приложения бизнес-аналитики требуют наличия хранилища данных.

Правильный ответ: Нет.

Все следующее точно описывает Hadoop, кроме ____________

Правильный ответ: Работает в режиме реального времени

Вы провели RFM-анализ вашего клиента. Мэри Джонс имеет оценку «1 1 5». Эта серия означает, что Мария ________.

Правильный ответ: Заказывала недавно, заказывает часто, но не делает большой заказ, когда заказывает

Выберите верное утверждение

Правильный ответ: BI дает предприятиям возможность извлекать выгоду из данных

Выберите верный подход Data Mining

Правильный ответ: Инфраструктура, разведка, анализ, интерпретация, эксплуатация

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: группировка участников в тренинге по снижению веса

Правильный ответ: Кластеризация

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: определение стоимости акций определенной компании

Правильный ответ: Прогнозирование

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: идентифицировать предметы, которые куплены одновременно большей частью покупателей, чтобы их можно было положить на полку

Правильный ответ: Ассоциативные правила

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: разделить рынок на отдельное подмножество клиентов, где каждое подмножеству может быть предложен определенный набор товаров

Правильный ответ: Кластеризация

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: найти группы документов, которые похожи друг на друга на основе важных терминов, содержащихся в них

Правильный ответ: Кластеризация

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: сократить стоимость рассылки, ориентируясь на группу потребителей, которые могут купить новый продукт для мобильных телефонов

Правильный ответ: Классификация

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: предсказать мошеннические случаи в транзакциях по кредитным картам (несколько ответов)

Правильные ответы: %50%Классификация, %50%Обнаружение аномалий

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: угадать скорости ветра на основе температуры, влажности, давления воздуха и т.д.

Правильный ответ: Прогнозирование

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: при заданном наборе из n точек или объектов, и k ожидаемого количества посторонних, найдите верхние k объектов, которые значительно отличаются, исключают или не соответствуют оставшимся данным

Правильный ответ: Обнаружение аномалий

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: основываясь на использовании предыдущих моделей, разработайте новую модель для авторизованных транзакций по кредитным картам

Правильный ответ: Обнаружение аномалий

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: дан набор объектов, с каждым объектом, связанным с его собственным временем событий, найти правила, которые предсказывают сильные последовательные зависимости между различными событиями

Правильный ответ: Последовательный анализ паттернов

Выберите задачу сбора данных, наиболее подходящую для следующего сценария: с данными записями книг, которые прочитала группа людей, найдите взаимосвязь жанров

Правильный ответ: Ассоциативные правила

Выберите неверное утверждение

Правильный ответ: BI - это категория программного обеспечения для баз данных, которая предоставляет интерфейс, который помогает пользователям быстро и в интерактивном режиме анализировать результаты в различных измерениях данных

Выберите преимущество метода K-ближайшего соседа в машинном обучении

Правильный ответ: Не требует предварительной подготовки

Выберите применение деревьев решений в машинном обучении

Правильный ответ: Классификация

Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение неожиданного / необычного объема расходов

Правильный ответ: Обнаружение аномалий

Выберите, какая задача сбора данных наиболее подходит для следующего сценария: диагностика уровня серьезности наводнения

Правильный ответ: Классификация

Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение рейтинга, когда местоположение рекомендовано члену туристического клуба

Правильный ответ: Прогнозирование

Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение группы туров, подходящей для нового участника, на основе ее прошлых рейтингов местоположения

Правильный ответ: Кластеризация

Выберите, какая задача сбора данных наиболее подходит для следующего сценария: определение большого пальца вверх или вниз на посте в социальной сети

Правильный ответ: Классификация

Выберите, какая задача сбора данных не является наиболее подходящей для следующего сценария: определение наилучшего местоположения, которое следует рекомендовать туристическому клубу (несколько ответов)

Правильный ответ: Прогнозирование

Выберите, какая задача сбора данных подходит для следующего сценария: сначала купите цифровую камеру, затем купите большие карты памяти SD

Правильный ответ: Последовательный анализ паттернов

Выберите, какая задача сбора данных является наиболее подходящей для следующего сценария: определение дозировки лекарства для определенного лечения

Правильный ответ: Прогнозирование

Высота, ширина это ______ тип данных

Правильный ответ: Непрерывный

Где Hadoop использовать нельзя?

Правильный ответ: Всё вышеперечисленное

Где Hadoop нельзя использовать?

Правильный ответ: Всё из вышеперечисленного

Где исполняется ETL как процесс?

Правильный ответ: Хранилище данных

Главное преимущество Yarn?

Правильный ответ: Механизм множественной обработки данных

Главный узел, который содержит информацию метаданных для всех блоков данных в HDFS

Правильный ответ: NameNode

Данные OLTP представляют собой комбинацию основных данных и …

Правильный ответ: Данных измерений

Данные в хранилище данных извлекаются и загружаются из операционных систем

Правильный ответ: Верно

Данные хранятся, извлекаются и обновляются в ____________?

Правильный ответ: OLTP.

Данные, которые могут быть смоделированы как измерения атрибутов, называются ____.

Правильный ответ: многомерными данными.

Дерево решений - это дерево, в котором каждый узел является либо ________________, либо узлом решения.

Правильный ответ: Листовым узлом

Для какого типа наборов данных подходит ли разделение k-средних

Правильный ответ: Отдельные кластеры

Для какого типа наборов данных подходит метод k-средних

Правильный ответ: Отдельные кластеры

Для концепции «момент времени» в DWH подготовка истории обязательна

Правильный ответ: Верно

Для обработки каких данных (в основном) больших объёмов используются базы данных NoSQL?

Правильный ответ: Неструктурированные.

Для чего используется древовидная диаграмма?

Правильный ответ: Выявить истинный уровень сложности проблемы

Для чего используется Наивный Байесовский классификатор? (

Правильный ответ: Генерация майнинговых моделей и оценка вероятности значения класса во время классификации и прогнозирования

Если для свойства mapred.job.tracker установлено значение по умолчанию, то jobtracker запускается как

Правильный ответ: «В процессе»

Загрузка данных - это процесс

Правильный ответ: запись данных в целевую базу данных

Задачи в MapReduce имеют

Правильный ответ: Ничего общего

Записи Cassandra сначала записываются в журнал фиксации на диске для...

Правильный ответ: Долговечности

Запись Cassandra успешна только когда...

Правильный ответ: Оба коммита успешно завершены

Зачем нужен Hadoop в аналитике больших данных?

Правильный ответ: Всё вышеперечисленное