- •Дисциплина: Информатика. 2 курс Тема: Тест по основам баз данных и информационных систем. Часть 1.
- •1. Основные компоненты информационной системы. Состав информационной системы включает:
- •2. (Определение базы данных)
- •3. К недостаткам использования файловых систем для организации баз данных относятся:
- •4. Какие из перечисленных видов данных относятся к слабо- или неструктурированным данным?
- •5. Какие из перечисленных видов данных относятся к структурированным данным?
- •Операция деления отношений
- •1) Объект и идентификатора объекта
Дисциплина: Информатика. 2 курс Тема: Тест по основам баз данных и информационных систем. Часть 1.
* 1 -один правильный ответ
1. Основные компоненты информационной системы. Состав информационной системы включает:
Модель данных
СУБД
приложения
* 2 -несколько правильных ответов
2. (Определение базы данных)
Организованное собрание (коллекция) логически связанных данных и способов доступа к ним, их обработки и обслуживания; СИСТЕМА ДЛЯ ХРАНЕНИЯ И УПРАВЛЕНИЯ ДАННЫМИ, ВКЛЮЧАЮЩАЯ ПЯТЬ основных компонентов: аппаратные средства, проограмное обеспечение, правила, данные специалистов.
* 2 -несколько правильных ответов
3. К недостаткам использования файловых систем для организации баз данных относятся:
(1) Program-Data Dependence. Сильная зависимость между программами и данными. Файловая система не определяет внутренний формат хранения информации в файлах – только размещение блоков данных на диске:
Lengthy Development Times. Длительное время разработки приложений – в них должна учитываться специфика обработки тех или иных данных.
Excessive Program Maintenance. Чрезмерная программная поддержка доступа к данным внутри прикладных программ – разные разработчики создают сходные процедуры доступа, выборки и т.д.
СУБД – узко специализированы, тесно привязаны к определенным данным.
(2) Difficulty in accessing data. Трудности организации доступа к данным
время поиска и скорость выборки – зависят от реализации 1) файловой системы и 2) конкретного приложения.
(3) Data Redundancy (Duplication of data). Избыточность хранения данных (дублирование информации в разных файлах).
(4) Limited Data Sharing. Ограниченность совместного доступа к данным.
Например, нельзя обеспечить одновременный доступ на модификацию к разным записям одного файла.
(5) Data isolation - multiple files and formats. Изолированность данных – много файлов и форматов. Разные типы данных хранятся в разных файлах.
Пример: Windows XP/ 7
(6) Security and integrity problems. Проблемы безопасности –
слабые средства защиты,
видимость для пользователей путей расположения и имен файлов.
(7) Atomicity of updates. Сложность отслеживания и синхронного внесения изменений в данные в разных частях файловой системы.
Нет поддержки информационной целостности данных на уровне файловой системы.
Пример: отдел – сотрудник – анкеты – выплаты – договора и т.д.
* 2 -несколько правильных ответов
4. Какие из перечисленных видов данных относятся к слабо- или неструктурированным данным?
Слабоструктурированные:
данные, для которых определены некоторые правила и форматы, но в самом общем виде
Неструктурированные
данные, произвольные по форме, включающие тексты и графику, мультимедиа (видео, речь, аудио).
(документы, тесты программ, объектные модули, графики, мультимедиа)
* 2 -несколько правильных ответов
5. Какие из перечисленных видов данных относятся к структурированным данным?
Структурированные:
данные, определенным образом упорядоченные и организованные с целью обеспечения возможности применения к ним некоторых действий
* 2 -несколько правильных ответов
6. Укажите основные направления автоматизации обработки неструктурированных данных в информационных системах
использование языка XML
системы управления контентом
Text Mining (набор технологий и методов для извлечения информации из текстов).
* 1 -один правильный ответ
7. (Определение метаданных)
- координированные и структурированные данные, которые описывают характеристики объектов-носителей информации, с целью идентификации, обнаружения, оценки и управления этими объектами.
* 1 -один правильный ответ
8. (Определение модели данных) Модель данных:
Набор правил и определений, которым подчиняются все объекты, находящиеся внутри базы данных.
* 2 -несколько правильных ответов
9. Укажите основные преимущества использования баз данных по сравнению с файловыми системами:
1) Data Independence/Reduced Program Maintenance. Независимость данных – сокращение размеров программной поддержки доступа к данным (внутри прикладных программ)
1-1. Increased Application Development Productivity. Увеличение эффективности разработки приложений
1-2. Enforcement of Standards. Возможность создания и использования стандартов (хранение данных и методы доступа)
2) Minimal Data Redundancy. Минимальная избыточность хранения данных.
2-1) Improved Data Consistency and Sharing. Увеличение плотности данных и возможностей совместного доступа к данным.
2-2) Better Data Accessibility/ Responsiveness. Улучшенный доступ к данным и их соответствие конкретным решаемым задачам.
2-3) Improved Data Quality (Constraints - стеснение). Рост качества данных.
3) Security. Безопасность (защита).
4) Backup/Recovery. Сохранение и восстановление.
* 5 -последовательность
10. Расставьте в порядке исторического развития ОСНОВНЫЕ МЕТОДЫ ОБРАБОТКИ И АНАЛИЗА ДАННЫХ в информационных системах:
60-80 гг. Простые запросы и отчеты: быстрое отыскание фактов, имевших место в прошлом.
80-е: стандарты организации производства (автоматическое формирование отчетности)
Середина 90-х: QLAP: упростить работу с многоцелевыми данными (визуализация – многомерный анализ) и не погрязнуть в океане, а умела превратить их в набор количественных показателей и в качественные показатели
Конец 90-х: Data Mining: обнаружение в «скрытых» данных предварительно неизвестных, практически полезных и доступных интерпретации знаний
Появление ХД и витрин данных как основы для методов аналитической обработки, прежде всего, Data Mining
Современный этап: Business Intelligence: - выбирать данные из традиционных приложений и превращать (агрегировать) их в информацию, которая может быть использована для эффективного управления бизнесом.
* 3 -текстовый ответ
11. (Определение информации)
Информация – это результат взаимодействия данных и адекватных им методов обработки.
* 1 -один правильный ответ
12. Структуры данных, индексы, процедуры, первичные и внешние ключи, представления – это … метаданные
* 1 -один правильный ответ
13. (Определение индекса)
(2) Индекс – специальная таблица, содержащая записи из двух полей: значение ключа и номера записей в основной таблице. Записи упорядочены по возрастанию и убыванию значения ключа. Ключ – одно или несколько полей таблицы данных, по которым выполняется поиск.
для каждой таблицы произвольное число индексов (инвертированных списков), хранимых в отдельных файлах. Индексы автоматически поддерживаются системой.
Индекс (англ. index) — объект базы данных, создаваемый с целью повышения производительности выполнения запросов.
Таблицы в базе данных могут иметь большое количество строк, которые хранятся в произвольном порядке, и их поиск по заданному значению путем последовательного просмотра таблицы строка за строкой может занимать много времени.
Индекс формируется из значений одного или нескольких столбцов таблицы и указателей на соответствующие строки таблицы и, таким образом, позволяет находить нужную строку по заданному значению.
* 1 -один правильный ответ
14. Индексы в базе данных используются:
Для повышения производительности запросов.
* 5 -последовательность
15. Эволюция современных баз данных (в порядке появления с конца 1960-х годов): Первое поколение - ранние БД. Их основу составляют иерархические и сетевые модели данных
(–) Системы первого поколения были в основном закрытыми: стандарта на модели данных и внешние интерфейсы не существовало, и поэтому приложения невозможно было переносить с одной платформы на другую. Имелись и другие недостатки, но главное — стоимость программного обеспечения БД была очень высокой.
(+) Тем не менее, первые СУБД оказались весьма надежными — многие созданные на их основе прикладные системы эксплуатируются до сих пор. Проблема – 2000
Основные типы ранних БД:
1) Инвертированные списки – простейшие БД (1966-1969)
2) Иерархические БД (1969-1973)
3) Сетевые БД (1973-1976)
Поддерживаемые виды моделей БД:
картотеки;
иерархические;
сетевые.
Второе поколение – реляционные БД
Отец второго поколения СУБД — американский ученый Эдгар Кодд, создавший в 1970 г. принципиально новую модель данных — реляционную. Кодд предложил для хранения и обработки больших объемов данных использовать оригинальный метод, основанный на использовании множества связанных между собой таблиц, содержащих записи фиксированной длины. Для «обкатки» этой идеи IBM в середине 70-х годов разработала СУБД System R и язык обработки запросов Structured Query Language (SQL). Успех реляционной модели превзошел все ожидания. Она не только доказала свою работоспособность, но и значительно превзошла своих предшественниц по многим параметрам.
Реляционные БД (1976-1990) ………………… (2012)
Поддерживаемые виды моделей БД:
Реляционная модель;
Так начался новый этап эволюции СУБД, который продолжается по сей день. Реляционная модель оказалась простой и эффективной для широкого класса задач — финансовых, управленческих и организационных. Именно она лежит в основе многих продуктов, которые стали флагманами современного рынка СУБД. Идеи Эдгара Кодда подхватили сотрудники Калифорнийского университета в Беркли при реализации одной из первых реляционных систем Ingres (ее впоследствии купила Computer Associates).
Пост-второе поколение БД
Несмотря на многочисленные достоинства реляционных СУБД, они не лишены недостатков. С некоторыми заданиями, например поиском в огромном множестве таблиц (сотни тысяч и миллионы таблиц), эти системы справляются не очень эффективно.
Для решения данной проблемы были разработаны многомерные или постреляционные СУБД, в которых данные представлены в виде не плоских таблиц, а разреженных многомерных массивов. При выполнении задач, требующих обработки огромных объемов данных, такие базы значительно превосходят по быстродействию реляционные. Однако большого коммерческого успеха эта концепция не имела, так как их потенциальные пользователи предпочли не универсальные, а специализированные решения.
Постреляционные БД (1990-1993)
Поддерживаемые виды моделей БД:
многомерные.
Пост-пост-второе поколение БД
Идея многомерности не пропала бесследно, а дала толчок появлению еще одного класса систем — объектно-ориентированных СУБД, в которых данные представлены не в виде таблиц, а в виде целых объектов. Это позволяет программистам разрабатывать для них приложения непосредственно на объектно-ориентированных языках, не используя промежуточный формат. В некоторых случаях, когда приходится иметь дело с большим объемом и сложной структурой данных, объектные БД работают гораздо быстрее реляционных. К этому классу относится немало продуктов, например Jasmine фирмы Computer Associates и Poet фирмы Poet Software. И хотя объектным СУБД не удалось завоевать ведущее положение на рынке, они пользуются спросом в таких областях, как телекоммуникации, наука, промышленность.
Возможно, скромный успех этой перспективной технологии отчасти объясняется тем, что производители реляционных продуктов не остались в стороне от новых веяний и соорудили над ядром своих СУБД объектно-ориентированную надстройку, создав так называемые объектно-реляционные системы, которые позволяют воспользоваться преимуществами обоих подходов.
Именно к такому типу БД сейчас относятся Informix, Oracle и IBM DB2.
Компании Microsoft SQL Server и Sybase остались верны чисто реляционной модели.
Объектно-ориентированные БД (1994-2000)
Поддерживаемые виды моделей БД:
Объектно-ориентированные.
Третье (?) поколение БД
Хранилища данных (конец 1990-х годов - 2010…)
Единого мнения о том, стоит ли выделять хранилища данных в самостоятельное поколение, нет.
С одной стороны, БД данного поколения строятся на основе вышеназванных реляционной, постреляционной и объектно-ориентированной моделях данных.
С другой стороны, они имеют существенные отличия в организации загрузки, хранения и обработки данных.
Причины появления:
применение инструментов аналитической обработки OLAP и Data Mining;
появление на их основе комплексов бизнес-аналитики (business intelligence).
* 2 -несколько правильных ответов
16. Какие три ключевые инновации связаны с появлением первого поколения дореляционных баз данных:
Таблицы
Индексы
Целостность
* 2 -несколько правильных ответов
17. Реляционная модель данных включает следующие компоненты:
Реляционная модель данных – это модель данных, включающая три основных компонента (правила): структурный, манипуляционный и целостный.
К элементам структурной составляющей реляционных БД относятся:
Тип данных
Домен
Отношение, атрибут, кортеж, схема отношения и схема БД.
* 3 -текстовый ответ
18. Что представляют собой все объекты (двумерные таблицы), хранимые внутри реляционной БД - Все объекты, хранимые внутри реляционной БД (исходные таблицы, представления, отчеты, формы, запросы, индексы и т.д.) сводятся к совокупности двумерных таблиц особого вида, известных в математике как N-арное нормальное отношение (relation).
Такая таблица представляет собой простое множество. Что это? (атомарность, нет дубликатов)
* 1 -один правильный ответ
19. Для обработки данных в реляционной БД используется …
Стандартный аппарат теории множеств (объединение, перечисление, разность, декартово произведение) – реляционная алгебра и реляционное исчисление. (SQL)
* 3 -текстовый ответ
20. Реляционная модель. (Определение домена)
Домен - это подмножество значений некоторого типа данных имеющих определенный смысл.
Домен характеризуется следующими свойствами:
1) Домен имеет уникальное имя (в пределах базы данных).
2) Домен определен на некотором простом типе данных или на другом домене.
3) Домен может иметь некоторое логическое условие, позволяющее описать подмножество данных, допустимых для данного домена.
4) Домен несет определенную смысловую нагрузку - данные считаются сравнимыми только в том случае, когда они относятся к одному домену.
Если тип данных можно считать множеством всех возможных значений данного типа, то домен определяет подмножество в этом множестве.
Таким образом, домен определяется заданием:
базового типа данных, к которому относятся элементы домена,
произвольного логического выражения, применяемого к элементу типа данных. Если вычисление этого логического выражения дает результат "истина", то элемент данных является элементом домена.
* 2 -несколько правильных ответов
21. Укажите, какие из ниже перечисленных элементов входят в состав реляционной таблицы:
тип данных
домен
отношение
атрибут
Кортеж
Схема отношььений
Схема бд
* 5 -последовательность
22. Расставьте основные элементы, используемые для построения описания РЕЛЯЦИОННОЙ ТАБЛИЦЫ (от простого к сложному):
Тип данных
Домен
Атрибут
Кортеж
(?) Отношение
* 4 -соответствие
23. Основные понятия реляционной модели. Укажите соответствие:
Обычное наименование (слева). Элементы реляционной модели (справа):
Таблица - отношение
Записи таблицы - кортежи
Названия столбцов таблицы - атрибуты;
Заголовок таблицы – схема отношения
Набор заголовков таблиц – схема БД.
* 2 -несколько правильных ответов
24. К обязательным (фундаментальным) свойствам реляционной таблицы (отношения) относятся:
Отсутствие кортежей-дубликатов
Отсутствие упорядоченности кортежей
Отсутствие упорядоченности атрибутов
Атомарность значений атрибутов
* 1 -один правильный ответ
25. Какое из свойств реляционной таблицы определяет наличие в ней первичного ключа – (отсутствие кортежей-дубликатов)
Отношения не могут содержать кортежей-дубликатов - это следует из определения отношения как множества кортежей:
В классической теории множеств по определению каждое множество состоит из различных элементов.
Из этого свойства вытекает наличие у каждого отношения, так называемого первичного ключа.
Первичный ключ - это набор атрибутов, значения которых однозначно определяют кортеж отношения.
* 1 -один правильный ответ
26. Для построения первичного ключа может использоваться:
Один из атрибутов отношения бд.
* 1 -один правильный ответ
27. Свойство атомарности реляционной таблицы означает:
«Атомарность» – первичность (от определения слова «атом» - неделимый, греческое слово).
Значения всех атрибутов являются атомарными. Это следует из определения домена как потенциального множества значений простого типа данных, т.е. среди значений домена не могут содержаться множества значений.
Принято говорить, что в реляционных базах данных допускаются только нормализованные отношения или отношения, представленные в первой нормальной форме. Потенциальным примером ненормализованного отношения является следующее (рис. 03P2 – пример ненормализованного отношения). Т.е. значениями атрибута отдел – являются отношения.
Нормализованные отношения составляют основу классического реляционного подхода к организации баз данных. Они обладают некоторыми ограничениями (не любую информацию удобно представлять в виде плоских таблиц), но существенно упрощают манипулирование данными.
* 2 -несколько правильных ответов
28. Правило целостности реляционной модели включает две составляющих - целостность таблиц (сущностей) и целостность по ссылкам. Реляционная таблица целостна, если:
Любой кортеж любого отношения отличим от любого другого кортежа этого отношения, т.е. другими словами, любое отношение должно обладать первичным ключом.
* 1 -один правильный ответ
29. Что означает целостность по ссылкам реляционной таблицы:
Второе требование называется требованием целостности по ссылкам и является несколько более сложным.
Очевидно, что при соблюдении нормализованности отношений сложные сущности реального мира представляются в реляционной БД в виде нескольких кортежей нескольких отношений.
Требование целостности по ссылкам, или требование внешнего ключа состоит в том, что:
для каждого значения внешнего ключа, появляющегося в ссылающемся отношении, в отношении, на которое ведет ссылка, должен найтись кортеж с таким же значением первичного ключа, либо значение внешнего ключа должно быть неопределенным (т.е. ни на что не указывать – NULL).
* 3 -текстовый ответ
30. (Дано описание таблиц А и B). При выполнении операции объединения мы получим таблицу С, содержащую __ записей (введите число)
* 3 -текстовый ответ
31. (Дано описание таблиц А и B). При выполнении операции пересечения мы получим таблицу С, содержащую __ записей (введите число)
* 3 -текстовый ответ
32. (Дано описание таблиц А и B). При выполнении операции вычитания (А-B) мы получим таблицу С, содержащую __ записей (введите число)
* 1 -один правильный ответ
33. Таблица A ("Деталь") содержит список всех изготавливаемых изделий, а в таблице B ("Цех") - дан перечень цехов. Таблица С ("Деталь","Цех") показывает какие детали изготавливаются в каком цехе. Какая из формул определяет таблицу, показывающую, какие детали в каких цехах не выпускаются?
* 1 -один правильный ответ
34. Таблица A (количество, название детали, цех) содержит список деталей, изготавливаемых по цехам. Что будет содержать таблица - результат выполнения двух следующих операций:
1) ОГРАНИЧЕНИЕ таблицы А по условию (Название детали = «Узел Т1»)
2) ПРОЕКЦИЯ результата предыдущей операции на список цехов ("Цех")
* 4 -соответствие
35. Укажите соответствие названий специальных реляционных операций и их назначения:
Операция ограничения по условию (фильтрация)
(2-1) Результатом ограничения отношения по некоторому условию (WHERE) является отношение, включающее кортежи отношения-операнда, удовлетворяющее этому условию. Вырезка таблицы по горизонтали.
При выполнении операции производится отношение, заголовок которого совпадает с заголовком отношения-операнда, а в тело входят те кортежи отношения-операнда, для которых значением условия ограничения является TRUE.
На интуитивном уровне операцию ограничения лучше всего представлять как взятие некоторой "горизонтальной" вырезки из отношения-операнда
Операция ограничения требует наличия двух операндов: ограничиваемого отношения и простого условия ограничения.
Для обозначения операции ограничения будем использовать конструкцию A WHERE comp, где A - ограничиваемое отношение, а comp - простое условие сравнения
Операция взятия проекции
(2-2) При выполнении операции проекции отношения на заданный набор его атрибутов производится отношение, кортежи которого производятся путем взятия соответствующих значений из кортежей отношения-операнда, при этом часть атрибутов (отсутствующих в заданном наборе) исключается из отношения-результата. Вырезка таблицы по вертикали.
Операция взятия проекции также требует наличия двух операндов - проецируемого отношения A и списка имен атрибутов, входящих в заголовок отношения A.
Результатом проекции отношения A по списку атрибутов a1, a2, ..., an является отношение
с заголовком, определяемым множеством атрибутов a1, a2, ..., an,
с телом, состоящим из кортежей вида <a1:v1, a2:v2, ..., an:vn> таких,
что в отношении A имеется кортеж, атрибут a1 которого имеет значение v1, атрибут a2 имеет значение v2, ..., атрибут an имеет значение vn.
При выполнении операции проекции выделяется "вертикальная" вырезка отношения-операнда с естественным (важно!) уничтожением потенциально возникающих кортежей-дубликатов.
Операция соединения отношений по условию
(2-3) При соединении двух отношений по некоторому условию образуется результирующее отношение, кортежи которого являются конкатенацией кортежей первого и второго отношений и удовлетворяют этому условию. Фактически – это сумма операции прямого произведения и операция фильтрации.
Общая операция соединения (называемая также соединением по условию) требует наличия двух операндов - соединяемых отношений и третьего операнда - простого условия.
Пусть соединяются отношения A и B. Как и в случае операции ограничения, условие соединения comp имеет вид
либо (a comp-op b),
либо (a comp-op const),
где a и b - имена атрибутов отношений A и B, const - заданная константа, а comp-op - допустимая в данном контексте операция сравнения.
Тогда по определению результатом операции сравнения является отношение, получаемое путем выполнения операции ограничения по условию comp прямого произведения отношений A и B.
Операция соединение в нашей интерпретации не является примитивной (определяется с использованием 2-х операций: прямого произведения и ограничения)