Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Информационное обеспечение(лекции)

.pdf
Скачиваний:
77
Добавлен:
27.03.2016
Размер:
2.19 Mб
Скачать

Рисунок 2.17 - Семантическая сеть ER-модели с ловушкой разрыва

Рисунок 2.18 - Семантическая сеть преобразованной ER-модели

61

2.4 Логическое проектирование

2.4.1 Выбор СУБД

Важным этапом жизненного цикла информационной системы и, в частности, проектирования базы данных, является выбор целевой СУБД.

Предлагаемые в разделе методы пригодны и к оценке новых продуктов, поступающих на рынок.

Основная цель при подборе СУБД – выбор системы, удовлетворяющей текущим и прогнозируемым требованиям организации при оптимальном уровне затрат. Затраты могут включать расходы на приобретение СУБД и дополнительного аппаратного и программного обеспечения, а также расходы, связанные с переходом к новой системе и необходимостью переобучения персонала.

Сложность и комплексность проблем, возникающих при проектировании сложных систем, в том числе и информационных систем, основанных на базах данных, привели к тому, что вопросы формирования критериев для анализа и синтеза систем перестали быть только искусством, основанным на инженерной интуиции, а превратились в серьезное научное направление, важность которого возрастает с каждым днем.

Если раньше выбор инструментальных средств (в том числе СУБД) производился исходя из предпочтений разработчика вне зависимости от специфики предметной области и перспектив использования базы данных, то на современном этапе развития программного обеспечения, когда на рынке предлагается необозримое количество СУБД, выбор средства реализации БД становится сложной задачей. Принятие строго оптимального решения в таких условиях желательно, но затруднено.

В общем виде процесс выбора СУБД включает следующие этапы:

1)определение списка показателей; по которым будут оцениваться

СУБД;

2)определение списка сравниваемых СУБД;

3)оценка продуктов по выбранным показателям;

4)принятие обоснованного решения, подготовка отчета. Современные СУБД имеют множество основных и дополнительных

функций, предоставляющих разработчику мощный инструментарий для реализации, поддержки и ведения баз данных. Какую из них выбрать в каждом конкретном случае?

Известны математические методы для решения задач оптимизации. В частности при выборе СУБД по множеству показателей очевидно применение методов линейного или целочисленного программирования. К числу сходных задач относится, например, задача о наименьшем покрытии, а универсальный метод для решения таких задач – метод ветвей и границ. Но эти задачи относятся к классу NР-полных, а значит, сложность их решения может сравниться (или превзойти) сложную многоэтапную задачу проектирования информационной системы.

62

В таких условиях при выборе СУБД целесообразно использовать методы построения обобщенных критериев.

Общая постановка задачи принятия решений выглядит следующим образом.

А. Имеется некоторое множество альтернатив (в рассматриваемом случае

– СУБД) А, причем каждая альтернатива а характеризуется определенной совокупностью свойств a1, а2, ..., аn.

Б. Имеется совокупность критериев q = (q1, q2, ..., qi, ..., qп), отражающих количественно множество свойств системы, т.е. каждая альтернатива характеризуется вектором q(а) = [q1(а), q2(а), ..., qi(а), ..., qn(а)].

В. Необходимо принять решение о выборе одной из альтернатив (СУБД), причем решение называется простым, если выбор производится по одному критерию, и сложным, если выбранная альтернатива не является наилучшей по какому-то одному критерию, но может оказаться наиболее приемлемой для всей их совокупности.

Г. Задача принятия решения по выбору альтернативы на множестве критериев формально сводится к отысканию отображения ϕ, которое каждому вектору q ставит в соответствие действительное число

E=ϕ(q)=ϕ(q1,q2,…,q n),

определяющее степень предпочтительности данного решения.

Оператор ϕ называют интегральным (обобщенным) критерием. Интегральный критерий присваивает каждому решению по выбору альтернативы соответствующее значение эффективности Е. Это позволяет упорядочить множество решений по степени предпочтительности.

В данном разделе предлагается использовать аддитивное преобразование при построении обобщенного показателя эффективности, известное из теории полезности:

n

E= ϕ (q1, q2 ,..., qn ) = bi qi .

i=1

Однако в этом случае значения коэффициентов bi отражают полезность (ценность) критерия qi при принятии сложного решения о выборе альтернативы. Определение их значений производится в результате предварительного опроса группы из т экспертов (специалистов в данной области). Один из возможных путей получения этих значений заключается в следующем. Каждый j-й эксперт вначале определяет набор чисел Сij, отражающих его мнение об относительной ценности i-го критерия, причем числа Сij, записаны в произвольном масштабе. Затем они масштабируются, в результате получают

bij =

Cij

 

 

n

n

 

 

Cij ;

bij

= 1.

 

i=1

i=1

 

Окончательные значения коэффициентов bi, вычисляются в результате осреднения значений bij (j =1, 2, ..., m), получаемых от всех экспертов. Если компетентность экспертов в группе считается одинаковой, то

63

 

 

1

m

 

bi

=

bij

 

 

 

 

 

m j =1

 

 

 

 

m

 

Если же компетентность j-го эксперта оценивается числом gi , g j

= 1 ,то

 

 

 

j =1

 

 

 

m

 

bi

= gibij

 

 

 

j =1

 

Ниже рассматриваются основные методы формирования коэффициентов Сij, отражающих мнение j-го эксперта о ценности i-го критерия. В дальнейшем предполагается, что вначале каждый эксперт провел ранжировку всех критериев, т.е. упорядочил их в соответствии с относительной ценностью так, что на первом месте находится самый главный критерий.

2.4.1.1 Метод ранжировки В соответствии с данным методом производится нумерация всех

критериев полученного ряда, причем все неразличимые критерии, которые оказались на одном месте, нумеруются в произвольном порядке. В результате данной процедуры каждый критерий получает свой номер. Ранг критерия определяется его номером, если на его месте в ряду отсутствуют какие-либо другие. Если на одном месте находится несколько неразличимых критериев, то ранг каждого из них равен среднему арифметическому их новых номеров.

Пример 2.2. Пусть имеется следующий ряд упорядоченных критериев q1, q2, ..., q8 для j-го эксперта:

 

 

 

 

q ;

q5

;

q2

; q , q

 

, q .

 

 

 

 

 

 

 

 

3

q6

 

q4

8

 

7

1

 

 

 

 

Ранги критериев, вычисленные в соответствии с вышеуказанной

процедурой, сведены в таблицу 2.2.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 2.2 – Ранги критериев

 

 

 

i

1

2

3

 

4

 

5

 

 

6

7

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rij

8,0

4,5

1,0

4,5

 

2,5

 

2,5

7,0

 

6,0

 

Переход от рангов к коэффициентам Сij. производится на основе гипотезы о линейной зависимости между рангом и относительной ценностью критерия. Чем ниже ранг, тем более важным является соответствующий критерий. Определение коэффициентов Сij для произвольного rij(1 < rij п) производится в соответствии со следующей формулой:

Cij = 1− rij −1 .

n

Для рассмотренного примера коэффициенты Сij сведены в таблицу 2.3. Следует отметить, что гипотеза о линейной зависимости между рангом и

относительной ценностью критерия делает оценки Сij весьма грубыми, но определяет их сравнительно высокую достоверность.

64

 

 

 

Таблица 2.3 –

Коэффициенты Сij

 

 

i

q1

q2

qз

q4

 

q5

q6

 

q7

q8

Cij

0,125

0,433

1,000

0,433

 

0,812

0,812

 

0,250

0,375

2.4.1.2 Метод непосредственных оценок

В основу этого метода положена менее жесткая гипотеза об убывающей (но необязательно линейной) зависимости между рангом и относительной ценностью критерия. Вначале каждый j-й эксперт производит упорядочение всех критериев в соответствии с вышерассмотренной процедурой. После этого он эвристическим путем дает численную оценку относительной полезности каждого критерия по сравнению с самым главным, которому присваивается значение, равное единице. Всем неразличимым критериям присваиваются одинаковые значения Сij. В результате каждому критерию в упорядоченном ряду вместо рангов сразу присваиваются числа Сij, совокупность которых должна образовать невозрастающую последовательность. При использовании метода непосредственных оценок возникает возможность более дифференцированно подходить к оценке важности отдельных критериев, но при этом понижается достоверность полученной информации.

2.4.1.3 Метод последовательных предпочтений

Алгоритм последовательных предпочтений предназначен для повышения достоверности информации, полученной от экспертов методом непосредственных оценок. Он позволяет каждому эксперту провести самоконтроль суждений на основе сопоставления трех подходов: ранжирования критериев, числовой оценки их ценности и сравнения п–2 пар специально подобранных абстрактных объектов.

Последняя процедура, отражающая сущность метода последовательных предпочтений, основана на следующей гипотезе. Если ценность i-го критерия объекта некоторого класса для j-го эксперта есть Сij, то ценность объекта по

n

всем критериям определяется Cij .

i=1

Впроцессе коррекции оценок эксперт должен ответить на ряд вопросов:

для i=1, 2, .... (п–2) какой из двух объектов лучше – обладающий только i-м критерием или совокупностью из (i±1, i±2, ..., п) критериев? В зависимости от ответа на i-й вопрос составляется одно из трех соотношений:

n

Cij R Ckj , где R [>,<,=].

k=i +1

Врезультате будут получены (n– 2) условия:

n

n

+ Cn, j ).

C1 j R Ckj ; C2 j R Ckj ,..., Cn − 2, j R(Cn −1, j

k = 2

k =3

 

65

Далее производится последовательная проверка каждого из этих условий, начиная с последнего, на соответствие ранее выбранным оценкам Сij и их ранжировке. При выявлении противоречий в i-м условии эксперт должен либо изменить знак отношения R, либо откорректировать значение величины Сij. В последнем случае он обязан убедиться в том, что не оказалась нарушенной первоначальная ранжировка критериев. При нарушении ее необходимо либо изменить порядок критериев, либо откорректировать значение Сij. После исправления последней оценки Сij ее значение может отличаться от единицы. Следует отметить, что в этом случае психологические ограничения не дают использовать метод последовательных предпочтений, когда число рассматриваемых критериев превышает семь. Рассмотрим пример.

Пример 2.3. Пусть некоторый эксперт выставил следующий ряд коэффициентов Сi, отражающих его мнение об относительной ценности шести частных критериев некоторого объекта (таблица 2.4).

Таблица 2.4 – Коэффициенты Сi

i

1

2

3

4

5

6

 

 

 

 

 

 

 

Сij

1,0

0,9

0,7

0,6

0,3

0,1

Для уточнения оценок коэффициентов Сi, эксперту предлагается сравнивать четыре пары абстрактных объектов. Каждому объекту соответствует вектор х=(x1, x2, ..., хi, ..., x6), где xi=(0; 1): 1 – учитывается полезность i-го критерия, 0 – не учитывается; тогда:

1)(100000) хуже (011111);

2)(010000) лучше (001111);

3)(001000) хуже (000111);

4)(000100) лучше (000011).

Эксперт вынес систему решений. Соотношение x(1) лучше x(2) соответствует большей предпочтительности для эксперта объекта х(1) по сравнению с объектом х(2).

Непротиворечивость принятых решений должна подтверждаться выполнением системы неравенств:

6

6

6

1) C1 < Ck ; 2) C2 < Ck , 3) C4 < Ck , 4) C4 > C5 + C6 .

k = 2

k =3

k = 4

Проверка неравенств начинается с последнего (четвертого). Третье и

четвертое неравенства

выполняются, второе

– нет; значит, необходимо

скорректировать значения коэффициента С2. Примем значение С2=2. Однако одновременно необходимо изменить значение С1 таким образом, чтобы, вопервых, сохранился первоначальный порядок критериев, определенный экспертом, т. е. С12, и, во-вторых, выполнялось первое неравенство. Принимаем, например, значение C1=2,5.

В результате применения метода последовательных предпочтений получили непротиворечивый ряд оценок (таблица 2.5), которые в дальнейшем необходимо масштабировать.

66

Таблица 2.5 – Полученный ряд оценок

i

1

2

3

4

5

6

 

 

 

 

 

 

 

Ci

2,5

2,0

0,7

0,6

0,3

1,0

2.4.1.4 Оценка результатов экспертного анализа

При использовании всех рассмотренных выше методов возникает естественный вопрос: насколько можно доверять результатам оценки коэффициентов Сij, полученным из субъективных мнений экспертов? Достоверность результатов экспертного анализа чаще всего характеризуется степенью согласованности данных ими оценок.

Для количественной оценки степени согласованности часто используется

коэффициент конкордации:

W =

 

12s

,

m2 (n3 n)

 

 

 

где

 

 

 

 

n

m

− 0,5m(n

2

s =

rij

+ 1) ;

i =1

j =1

 

 

rij – место, которое заняло i свойство в ранжировке j-м экспертом.

Коэффициент W позволяет оценить, насколько согласованы между собой ряды предпочтительности, построенные каждым экспертом. Его значение находится в пределах 0≤W≤1, причем W=0 означает полную противоположность, а W=1 - полное совпадение ранжировок. Практически достоверность считается хорошей, если W=0,7÷0,8.

На основе рассмотренных методов могут быть определены значения коэффициентов Сij (j=1, 2, ..., m; i=1, 2, ..., п), по которым будут вычислены коэффициенты b., линейной формы интегрального критерия.

При использовании такого подхода к формированию интегрального критерия в дальнейшем считается, что единица измерения каждого свойства системы, отраженного в соответствующем частном критерии, выбрана по принципу «чем больше, тем лучше».

Отсюда следует, что качество решения по выбору альтернативы тем лучше, чем больше значение показателя эффективности.

Так как критерии qi могут иметь различную размерность, то при использовании их в качестве аргументов функции Е необходимо провести нормирование, т. е. привести их к общей размерности, и в частности к безразмерному виду.

Для придания равномерности влияния каждого из критериев на значение интегрального критерия необходимо выровнять диапазоны изменения значений критериев путем масштабирования и сведения их к диапазону [0; 1].

Проведение преобразований типов нормирования и масштабирования требует, чтобы для каждого из критериев были определены понятия

67

«негодного» и «идеального» объектов, а это означает, что должны быть заданы допустимые области изменений значений критериев qi, q<qi<q.

В этом случае самым простым масштабирующим и нормирующим преобразованием является линейное преобразование следующего вида:

 

 

 

 

 

 

при qi

qiн

 

 

0,

 

 

 

qотн =

 

qi qiн

,

при q

q q

;

 

i

 

q

 

q

 

i

iв

 

 

 

 

 

 

 

 

 

 

iн

 

 

 

> qiв

 

 

 

 

 

 

 

при qi

 

 

1,

 

 

 

где qiотн, q, q- относительное, нижнее и верхнее значения критерия qi соответственно.

В случае такого преобразования чувствительность шкалы изменения qi во всем диапазоне изменений qi постоянна. Если же разработчика особенно интересуют альтернативы в окрестности некоторой точки qi*, то можно повысить разрешающую способность частного критерия в окрестности этой точки за счет использования соответствующих нелинейных преобразований.

После проведения операций нормирования и масштабирования область годных альтернатив окажется заданной в виде n-мерного единичного куба, причем

0< qiотн ≤ 1, i=1, 2, ..., п.

Врезультате проведенных преобразований для каждой рассматриваемой

альтернативы будет определен вектор qотн(а), причем а А, где А – множество возможных альтернатив. Оценка интегрального показателя решения по выбору альтернативы производится в соответствии со следующим соотношением:

E = ϕ[qотн (a)]= n

bi qiотн (a).

i =1

 

Заканчивая рассмотрение вопросов,

связанных с построением

обобщенного критерия эффективности сложных систем на основе метода экспертных оценок, следует еще раз обратить внимание на то, что на многих этапах его построения приходится опираться на субъективные мнения специалистов при выборе:

наиболее существенных частных критериев;

процедуры и единицы измерения для критериев;

«идеального» значения критерия;

значения, дающего наибольшую разрешающую способность

критерия;

нормирующего и масштабирующего преобразований;

структуры функции обобщенного критерия;

значений весовых коэффициентов.

Поэтому решения на каждом из перечисленных этапов должны приниматься на основе усредненного мнения многих специалистов, что повышает объективное содержание критерия. Однако это не исключает таких ситуаций, когда оценки некоторых реальных объектов, полученные с помощью обобщенного критерия, противоречат мнению специалистов.

68

В подобных случаях следует не отказываться от дальнейшего использования данного подхода, а тщательна проанализировать и выявить конкретные причины расхождения, после чего внести соответствующие изменения в критерий.

Как указывалось выше, для оценки СУБД могут использоваться самые разнообразные параметры, которые могут быть сгруппированы следующим образом:

параметры определения данных;

физические параметры;

параметры доступности;

параметры обработки транзакций;

утилиты;

средства разработки... и т.д.

Рекомендуемые параметры (показатели) для оценки СУБД приведены в таблице 2.6.

Таблица 2.6 –

Рекомендуемые параметры СУБД

Наименование группы

Наименование параметра

 

 

Определение данных

Расширенная поддержка первичных ключей

 

 

 

Определение внешних ключей

 

Предусмотренные типы данных

 

Расширяемость типов данных

 

Определение доменов

 

Простота реструктуризации

 

Средства поддержки целостности данных

 

Реализация механизма представлений

 

Поддержка словаря данных

 

Независимость данных

 

Тип базовой модели организации данных

 

Поддержка эволюции схемы

Физические параметры

Предусмотренные файловые структуры

 

Поддержка определения файловых структур

 

 

 

Простота реорганизации

 

Средства индексирования

 

Поля/записи с переменной длиной

 

Сжатие данных

 

Возможности шифрования

 

Требования к памяти

 

Требования к устройствам хранения данных

 

 

Продолжение таблицы 2.6

 

 

Наименование группы

Наименование параметра

 

 

69

Доступность

Язык запросов: совместимость со

 

стандартами SQL

 

 

 

Интерфейс для других систем

 

 

 

Интерфейс для языков третьего поколения

 

 

 

Многопользовательский доступ

 

 

 

Защита базы данных: управление

 

доступом к данным, поддержка механизма

 

авторизации

 

 

Обработка транзакций

Процедуры резервного копирования и

 

восстановления

 

 

 

Поддержка контрольных точек

 

 

 

Средства ведения системного журнала

 

 

 

Поддерживаемый уровень детализации

 

параллельности

 

 

 

Возможные стратегии разрешения

 

тупиковых ситуаций

 

Поддержка усовершенствованных

 

моделей управления транзакциями

 

Параллельная обработка запросов

 

 

Утилиты

Измерение производительности

 

Настройка производительности базы

 

данных

 

Инструменты загрузки/выгрузки данных

 

Контроль активности пользователей

 

Поддержка процедур администрирования

 

базы данных

Средства разработки

Инструменты, использующие языки

 

четвертого и пятого поколений

 

Case-инструменты

 

Инструменты для работы с оконным

 

инструментом

 

Поддержка хранимых процедур, триггеров

 

и правил

Продолжение таблицы 2.6

 

 

Наименование группы

Наименование параметра

Другие параметры

Способность к модернизации

 

 

70