Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вопросы теста - 2012- Часть 1+ответы).doc
Скачиваний:
21
Добавлен:
23.11.2019
Размер:
248.32 Кб
Скачать

19

Дисциплина: Информатика. 2 курс Тема: Тест по основам баз данных и информационных систем. Часть 1.

* 1 -один правильный ответ

1. Основные компоненты информационной системы. Состав информационной системы включает:

  • Модель данных

  • СУБД

  • приложения

* 2 -несколько правильных ответов

2. (Определение базы данных)

Организованное собрание (коллекция) логически связанных данных и способов доступа к ним, их обработки и обслуживания; СИСТЕМА ДЛЯ ХРАНЕНИЯ И УПРАВЛЕНИЯ ДАННЫМИ, ВКЛЮЧАЮЩАЯ ПЯТЬ основных компонентов: аппаратные средства, проограмное обеспечение, правила, данные специалистов.

* 2 -несколько правильных ответов

3. К недостаткам использования файловых систем для организации баз данных относятся:

(1) Program-Data Dependence. Сильная зависимость между программами и данными. Файловая система не определяет внутренний формат хранения информации в файлах – только размещение блоков данных на диске:

    • Lengthy Development Times. Длительное время разработки приложений – в них должна учитываться специфика обработки тех или иных данных.

    • Excessive Program Maintenance. Чрезмерная программная поддержка доступа к данным внутри прикладных программ – разные разработчики создают сходные процедуры доступа, выборки и т.д.

    • СУБД – узко специализированы, тесно привязаны к опре­деленным данным.

(2) Difficulty in accessing data. Трудности организации доступа к данным

    • время поиска и скорость выборки – зависят от реализации 1) файловой системы и 2) конкретного приложения.

(3) Data Redundancy (Duplication of data). Избыточность хранения данных (дублирование информации в разных файлах).

(4) Limited Data Sharing. Ограниченность совместного доступа к данным.

    • Например, нельзя обеспечить одновременный доступ на модификацию к разным записям одного файла.

(5) Data isolation - multiple files and formats. Изолированность данных – много файлов и форматов. Разные типы данных хранятся в разных файлах.

    • Пример: Windows XP/ 7

(6) Security and integrity problems. Проблемы безопасности –

    • слабые средства защиты,

    • видимость для пользователей путей расположения и имен файлов.

(7) Atomicity of updates. Сложность отслеживания и синхронного внесения изменений в данные в разных частях файловой системы.

    • Нет поддержки информационной целостности данных на уровне файловой системы.

    • Пример: отдел – сотрудник – анкеты – выплаты – договора и т.д.

* 2 -несколько правильных ответов

4. Какие из перечисленных видов данных относятся к слабо- или неструктурированным данным?

  • Слабоструктурированные:

    • данные, для которых определены некоторые правила и форматы, но в самом общем виде

  • Неструктурированные

    • данные, произвольные по форме, включающие тексты и графику, мультимедиа (видео, речь, аудио).

(документы, тесты программ, объектные модули, графики, мультимедиа)

* 2 -несколько правильных ответов

5. Какие из перечисленных видов данных относятся к структурированным данным?

  • Структурированные:

    • данные, определенным образом упорядоченные и организованные с целью обеспечения возможности применения к ним некоторых действий

* 2 -несколько правильных ответов

6. Укажите основные направления автоматизации обработки неструктурированных данных в информационных системах

  • использование языка XML

  • системы управления контентом

  • Text Mining (набор технологий и методов для извлечения информации из текстов).

* 1 -один правильный ответ

7. (Определение метаданных)

- координированные и структурированные данные, которые описывают характеристики объектов-носителей информации, с целью идентификации, обнаружения, оценки и управления этими объектами.

* 1 -один правильный ответ

8. (Определение модели данных) Модель данных:

  • Набор правил и определений, которым подчиняются все объекты, находящиеся внутри базы данных.

* 2 -несколько правильных ответов

9. Укажите основные преимущества использования баз данных по сравнению с файловыми системами:

  • 1) Data Independence/Reduced Program Maintenance. Независимость данных – сокращение размеров программной поддержки доступа к данным (внутри прикладных программ)

    • 1-1. Increased Application Development Productivity. Увеличение эффективности разработки приложений

    • 1-2. Enforcement of Standards. Возможность создания и использования стандартов (хранение данных и методы доступа)

  • 2) Minimal Data Redundancy. Минимальная избыточность хранения данных.

    • 2-1) Improved Data Consistency and Sharing. Увеличение плотности данных и возможностей совместного доступа к данным.

    • 2-2) Better Data Accessibility/ Responsiveness. Улучшенный доступ к данным и их соответствие конкретным решаемым задачам.

    • 2-3) Improved Data Quality (Constraints - стеснение). Рост качества данных.

  • 3) Security. Безопасность (защита).

  • 4) Backup/Recovery. Сохранение и восстановление.

* 5 -последовательность

10. Расставьте в порядке исторического развития ОСНОВНЫЕ МЕТОДЫ ОБРАБОТКИ И АНАЛИЗА ДАННЫХ в информационных системах:

  • 60-80 гг. Простые запросы и отчеты: быстрое отыскание фактов, имевших место в прошлом.

  • 80-е: стандарты организации производства (автоматическое формирование отчетности)

  • Середина 90-х: QLAP: упростить работу с многоцелевыми данными (визуализация – многомерный анализ) и не погрязнуть в океане, а умела превратить их в набор количественных показателей и в качественные показатели

  • Конец 90-х: Data Mining: обнаружение в «скрытых» данных предварительно неизвестных, практически полезных и доступных интерпретации знаний

  • Появление ХД и витрин данных как основы для методов аналитической обработки, прежде всего, Data Mining

  • Современный этап: Business Intelligence: - выбирать данные из традиционных приложений и превращать (агрегировать) их в информацию, которая может быть использована для эффективного управления бизнесом.

* 3 -текстовый ответ

11. (Определение информации)

Информация – это результат взаимодействия данных и адекватных им методов обработки.

* 1 -один правильный ответ

12. Структуры данных, индексы, процедуры, первичные и внешние ключи, представления – это … метаданные

* 1 -один правильный ответ

    • 13. (Определение индекса)

    • (2) Индекс – специальная таблица, содержащая записи из двух полей: значение ключа и номера записей в основной таблице. Записи упорядочены по возрастанию и убыванию значения ключа. Ключ – одно или несколько полей таблицы данных, по которым выполняется поиск.

    • для каждой таблицы произвольное число индексов (инвертированных списков), хранимых в отдельных файлах. Индексы автоматически поддерживаются системой.

Индекс (англ. index) — объект базы данных, создаваемый с целью повышения производительности выполнения запросов.

    • Таблицы в базе данных могут иметь большое количество строк, которые хранятся в произвольном порядке, и их поиск по заданному значению путем последовательного просмотра таблицы строка за строкой может занимать много времени.

    • Индекс формируется из значений одного или нескольких столбцов таблицы и указателей на соответствующие строки таблицы и, таким образом, позволяет находить нужную строку по заданному значению.

* 1 -один правильный ответ

14. Индексы в базе данных используются:

Для повышения производительности запросов.

* 5 -последовательность

15. Эволюция современных баз данных (в порядке появления с конца 1960-х годов): Первое поколение - ранние БД. Их основу составляют иерархические и сетевые модели данных

(–) Системы первого поколения были в основном закрытыми: стандарта на модели данных и внешние интерфей­сы не существовало, и поэтому приложения невозможно было переносить с одной платформы на другую. Имелись и другие недостатки, но главное — стои­мость программного обеспечения БД была очень высокой.

(+) Тем не менее, первые СУБД оказались весьма надежными — многие созданные на их основе прикладные системы эксплуати­руются до сих пор. Проблема – 2000

Основные типы ранних БД:

    • 1) Инвертированные списки – простейшие БД (1966-1969) 

    • 2) Иерархические БД (1969-1973) 

    • 3) Сетевые БД (1973-1976) 

Поддерживаемые виды моделей БД:

    • картотеки;

    • иерархические;

    • сетевые.

Второе поколение – реляционные БД

Отец второго поколения СУБД — американский ученый Эдгар Кодд, создавший в 1970 г. принципиально новую модель данных — реляционную. Кодд предложил для хранения и обра­ботки больших объемов данных использовать оригинальный метод, основанный на использовании множества связанных между собой таблиц, содержащих записи фиксирован­ной длины. Для «обкатки» этой идеи IBM в середине 70-х годов разработала СУБД System R и язык обработки запросов Structured Query Language (SQL). Успех реляционной модели превзошел все ожидания. Она не только доказала свою работоспособность, но и значительно превзошла своих предшественниц по многим параметрам.

    • Реляционные БД (1976-1990) ………………… (2012)

Поддерживаемые виды моделей БД:

    • Реляционная модель;

Так начался новый этап эво­люции СУБД, который продол­жается по сей день. Реляцион­ная модель оказалась простой и эффективной для широкого класса задач — финансовых, управленческих и организацион­ных. Именно она лежит в основе многих продуктов, которые стали флагманами современного рынка СУБД. Идеи Эдгара Кодда подхватили сотрудники Калифорнийского университета в Беркли при реализации одной из первых реляционных систем Ingres (ее впоследствии купила Computer Associates).

Пост-второе поколение БД

Несмотря на многочисленные достоинства реляционных СУБД, они не лишены недостатков. С не­которыми заданиями, например поиском в огромном множестве таблиц (сотни тысяч и миллионы таблиц), эти системы справляются не очень эффективно.

Для решения данной проблемы были разработаны мно­гомерные или постреляционные СУБД, в которых данные пред­ставлены в виде не плоских таб­лиц, а разреженных многомерных массивов. При выполнении задач, требующих обработки огромных объемов данных, такие базы зна­чительно превосходят по быстро­действию реляционные. Однако большого коммерческого успеха эта концепция не имела, так как их потенциальные пользователи предпочли не универсальные, а специализированные решения.

    • Постреляционные БД (1990-1993)

Поддерживаемые виды моделей БД:

    • многомерные.

Пост-пост-второе поколение БД

Идея многомерности не пропа­ла бесследно, а дала толчок появ­лению еще одного класса систем — объектно-ориентиро­ванных СУБД, в которых данные представлены не в виде таблиц, а в виде целых объектов. Это поз­воляет программистам разрабаты­вать для них приложения непо­средственно на объектно-ориенти­рованных языках, не используя промежуточный формат. В неко­торых случаях, когда приходится иметь дело с большим объемом и сложной структурой данных, объектные БД работают гораздо быстрее реляционных. К этому классу относится немало продук­тов, например Jasmine фирмы Computer Associates и Poet фир­мы Poet Software. И хотя объект­ным СУБД не удалось завоевать ведущее положение на рынке, они пользуются спросом в таких областях, как телекоммуникации, наука, промышленность.

Возможно, скромный успех этой перспективной технологии отчасти объясняется тем, что про­изводители реляционных продук­тов не остались в стороне от новых веяний и соорудили над ядром своих СУБД объектно-ори­ентированную надстройку, создав так называемые объектно-реля­ционные системы, которые позво­ляют воспользоваться преимуще­ствами обоих подходов.

Именно к такому типу БД сейчас отно­сятся Informix, Oracle и IBM DB2.

Компании Microsoft SQL Server и Sybase остались верны чисто реляционной модели.

    • Объектно-ориентированные БД (1994-2000)

Поддерживаемые виды моделей БД:

    • Объектно-ориентированные.

Третье (?) поколение БД

    • Хранилища данных (конец 1990-х годов - 2010…) 

Единого мнения о том, стоит ли выделять хранилища данных в самостоятельное поколение, нет.

С одной стороны, БД данного поколения строятся на основе вышеназванных реляционной, постреляционной и объектно-ориентированной моделях данных.

С другой стороны, они имеют существенные отличия в организации загрузки, хранения и обработки данных.

Причины появления:

  • применение инструментов аналитической обработки OLAP и Data Mining;

  • появление на их основе комплексов бизнес-аналитики (business intelligence).

* 2 -несколько правильных ответов

16. Какие три ключевые инновации связаны с появлением первого поколения дореляционных баз данных:

  • Таблицы

  • Индексы

  • Целостность

* 2 -несколько правильных ответов

17. Реляционная модель данных включает следующие компоненты:

Реляционная модель данных – это модель данных, включающая три основных компонента (правила): структурный, манипуляционный и целостный.

К элементам структурной составляющей реляционных БД относятся:

  • Тип данных

  • Домен

  • Отношение, атрибут, кортеж, схема отношения и схема БД.

* 3 -текстовый ответ

  • 18. Что представляют собой все объекты (двумерные таблицы), хранимые внутри реляционной БД - Все объекты, хранимые внутри реляционной БД (исходные таблицы, представления, отчеты, формы, запросы, индексы и т.д.) сводятся к совокупности двумерных таблиц особого вида, известных в математике как N-арное нормальное отношение (relation).

Такая таблица представляет собой простое множество. Что это? (атомарность, нет дубликатов)

* 1 -один правильный ответ

19. Для обработки данных в реляционной БД используется …

Стандартный аппарат теории множеств (объединение, перечисление, разность, декартово произведение) – реляционная алгебра и реляционное исчисление. (SQL)

* 3 -текстовый ответ

20. Реляционная модель. (Определение домена)

Домен - это подмножество значений некоторого типа данных имеющих определенный смысл.

Домен характеризуется следующими свойствами:

  • 1) Домен имеет уникальное имя (в пределах базы данных).

  • 2) Домен определен на некотором простом типе данных или на другом домене.

  • 3) Домен может иметь некоторое логическое условие, позволяющее описать подмножество данных, допустимых для данного домена.

  • 4) Домен несет определенную смысловую нагрузку - данные считаются сравнимыми только в том случае, когда они относятся к одному домену.

Если тип данных можно считать множеством всех возможных значений данного типа, то домен определяет подмножество в этом множестве.

Таким образом, домен определяется заданием:

    • базового типа данных, к которому относятся элементы домена,

    • произвольного логического выражения, применяемого к элементу типа данных. Если вычисление этого логического выражения дает результат "истина", то элемент данных является элементом домена.

* 2 -несколько правильных ответов

21. Укажите, какие из ниже перечисленных элементов входят в состав реляционной таблицы:

  • тип данных

  • домен

  • отношение

  • атрибут

  • Кортеж

  • Схема отношььений

  • Схема бд

* 5 -последовательность

22. Расставьте основные элементы, используемые для построения описания РЕЛЯЦИОННОЙ ТАБЛИЦЫ (от простого к сложному):

  • Тип данных

  • Домен

  • Атрибут

  • Кортеж

  • (?) Отношение

* 4 -соответствие

23. Основные понятия реляционной модели. Укажите соответствие:

Обычное наименование (слева). Элементы реляционной модели (справа):

    • Таблица - отношение

      • Записи таблицы - кортежи

      • Названия столбцов таблицы - атрибуты;

      • Заголовок таблицы – схема отношения

    • Набор заголовков таблиц – схема БД.

* 2 -несколько правильных ответов

24. К обязательным (фундаментальным) свойствам реляционной таблицы (отношения) относятся:

  • Отсутствие кортежей-дубликатов

  • Отсутствие упорядоченности кортежей

  • Отсутствие упорядоченности атрибутов

  • Атомарность значений атрибутов

* 1 -один правильный ответ

25. Какое из свойств реляционной таблицы определяет наличие в ней первичного ключа – (отсутствие кортежей-дубликатов)

Отношения не могут содержать кортежей-дубликатов - это следует из определения отношения как множества кортежей:

    • В классической теории множеств по определению каждое множество состоит из различных элементов.

Из этого свойства вытекает наличие у каждого отношения, так называемого первичного ключа.

Первичный ключ - это набор атрибутов, значения которых однозначно определяют кортеж отношения.

* 1 -один правильный ответ

26. Для построения первичного ключа может использоваться:

Один из атрибутов отношения бд.

* 1 -один правильный ответ

27. Свойство атомарности реляционной таблицы означает:

«Атомарность» – первичность (от определения слова «атом» - неделимый, греческое слово).

Значения всех атрибутов являются атомарными. Это следует из определения домена как потенциального множества значений простого типа данных, т.е. среди значений домена не могут содержаться множества значений.

    • Принято говорить, что в реляционных базах данных допускаются только нормализованные отношения или отношения, представленные в первой нормальной форме. Потенциальным примером ненормализованного отношения является следующее (рис. 03P2 – пример ненормализованного отношения). Т.е. значениями атрибута отдел – являются отношения.

    • Нормализованные отношения составляют основу классического реляционного подхода к организации баз данных. Они обладают некоторыми ограничениями (не любую информацию удобно представлять в виде плоских таблиц), но существенно упрощают манипулирование данными.

* 2 -несколько правильных ответов

28. Правило целостности реляционной модели включает две составляющих - целостность таблиц (сущностей) и целостность по ссылкам. Реляционная таблица целостна, если:

Любой кортеж любого отношения отличим от любого другого кортежа этого отношения, т.е. другими словами, любое отношение должно обладать первичным ключом.

* 1 -один правильный ответ

29. Что означает целостность по ссылкам реляционной таблицы:

Второе требование называется требованием целостности по ссылкам и является несколько более сложным.

    • Очевидно, что при соблюдении нормализованности отношений сложные сущности реального мира представляются в реляционной БД в виде нескольких кортежей нескольких отношений.

Требование целостности по ссылкам, или требование внешнего ключа состоит в том, что:

  • для каждого значения внешнего ключа, появляющегося в ссылающемся отношении, в отношении, на которое ведет ссылка, должен найтись кортеж с таким же значением первичного ключа, либо значение внешнего ключа должно быть неопределенным (т.е. ни на что не указывать – NULL).

* 3 -текстовый ответ

30. (Дано описание таблиц А и B). При выполнении операции объединения мы получим таблицу С, содержащую __ записей (введите число)

* 3 -текстовый ответ

31. (Дано описание таблиц А и B). При выполнении операции пересечения мы получим таблицу С, содержащую __ записей (введите число)

* 3 -текстовый ответ

32. (Дано описание таблиц А и B). При выполнении операции вычитания (А-B) мы получим таблицу С, содержащую __ записей (введите число)

* 1 -один правильный ответ

33. Таблица A ("Деталь") содержит список всех изготавливаемых изделий, а в таблице B ("Цех") - дан перечень цехов. Таблица С ("Деталь","Цех") показывает какие детали изготавливаются в каком цехе. Какая из формул определяет таблицу, показывающую, какие детали в каких цехах не выпускаются?

* 1 -один правильный ответ

34. Таблица A (количество, название детали, цех) содержит список деталей, изготавливаемых по цехам. Что будет содержать таблица - результат выполнения двух следующих операций:

1) ОГРАНИЧЕНИЕ таблицы А по условию (Название детали = «Узел Т1»)

2) ПРОЕКЦИЯ результата предыдущей операции на список цехов ("Цех")

* 4 -соответствие

35. Укажите соответствие названий специальных реляционных операций и их назначения:

Операция ограничения по условию (фильтрация)

(2-1) Результатом ограничения отношения по некоторому условию (WHERE) является отношение, включающее кортежи отношения-операнда, удовлетворяющее этому условию. Вырезка таблицы по горизонтали.

  • При выполнении операции производится отношение, заголовок которого совпадает с заголовком отношения-операнда, а в тело входят те кортежи отношения-операнда, для которых значением условия ограничения является TRUE.

На интуитивном уровне операцию ограничения лучше всего представлять как взятие некоторой "горизонтальной" вырезки из отношения-операнда

Операция ограничения требует наличия двух операндов: ограничиваемого отношения и простого условия ограничения.

  • Для обозначения операции ограничения будем использовать конструкцию A WHERE comp, где A - ограничиваемое отношение, а comp - простое условие сравнения

Операция взятия проекции

(2-2) При выполнении операции проекции отношения на заданный набор его атрибутов производится отношение, кортежи которого производятся путем взятия соответствующих значений из кортежей отношения-операнда, при этом часть атрибутов (отсутствующих в заданном наборе) исключается из отношения-результата. Вырезка таблицы по вертикали.

Операция взятия проекции также требует наличия двух операндов - проецируемого отношения A и списка имен атрибутов, входящих в заголовок отношения A.

Результатом проекции отношения A по списку атрибутов a1, a2, ..., an является отношение

  • с заголовком, определяемым множеством атрибутов a1, a2, ..., an,

  • с телом, состоящим из кортежей вида <a1:v1, a2:v2, ..., an:vn> таких,

      • что в отношении A имеется кортеж, атрибут a1 которого имеет значение v1, атрибут a2 имеет значение v2, ..., атрибут an имеет значение vn.

При выполнении операции проекции выделяется "вертикальная" вырезка отношения-операнда с естественным (важно!) уничтожением потенциально возникающих кортежей-дубликатов.

Операция соединения отношений по условию

(2-3) При соединении двух отношений по некоторому условию образуется результирующее отношение, кортежи которого являются конкатенацией кортежей первого и второго отношений и удовлетворяют этому условию. Фактически – это сумма операции прямого произведения и операция фильтрации.

Общая операция соединения (называемая также соединением по условию) требует наличия двух операндов - соединяемых отношений и третьего операнда - простого условия.

  • Пусть соединяются отношения A и B. Как и в случае операции ограничения, условие соединения comp имеет вид

      • либо (a comp-op b),

      • либо (a comp-op const),

      • где a и b - имена атрибутов отношений A и B, const - заданная константа, а comp-op - допустимая в данном контексте операция сравнения.

  • Тогда по определению результатом операции сравнения является отношение, получаемое путем выполнения операции ограничения по условию comp прямого произведения отношений A и B.

Операция соединение в нашей интерпретации не является примитивной (определяется с использованием 2-х операций: прямого произведения и ограничения)