- •37.Контроль очистки данных
- •38.Концептуальные и эмпирические основания оценки информационных источников
- •39.Критерии оценки достоверности информации
- •40.Критерии оценки информационных источников
- •41.Критерии оценки качества информационных систем
- •42.Методы интеграции данных
- •43.Методы формализации и обработки экспертной информации
42.Методы интеграции данных
Интеграция данных включает объединение данных, находящихся в различных источниках, и предоставление данных пользователям в унифицированном виде. Этот процесс становится существенным как в коммерческих задачах (когда двум похожим компаниям необходимо объединить их базы данных), так и в научных (комбинирование результатов исследований).
Системы интеграции данных могут обеспечивать интеграцию данных на физическом, логическом и семантическом уровне.
Архитектуры систем интеграции
Консолидация — однонаправленный процесс, то есть данные из нескольких источников сливаются в Хранилище, но не распространяются из него обратно в распределенную систему. Часто консолидированные данные служат основой для приложений бизнес-аналитики (Business Intelligence, BI), OLAP-приложений.
Федерализация – перемещения данных не происходит: данные остаются у владельцев, доступ к ним осуществляется при необходимости (при выполнении запроса).
Распространение данных – приложения распространения данных осуществляют копирование данных из одного места в другое. Эти приложения обычно работают в оперативном режиме и производят перемещение данных к местам назначения, то есть зависят от определенных событий. Обновления в первичной системе могут передаваться в конечную систему синхронно или асинхронно.
Сервисный подход – Сервисно-ориентированная архитектура SOA (Service Oriented Architecture), успешно применяемая при интеграции приложений, применима и при интеграции данных. Данные также остаются у владельцев и даже местонахождение данных неизвестно. При запросе происходит обращение к определённым сервисам, которые связаны с источниками, где находится информация и её конкретный адрес.
Также существует гибридный подход.
43.Методы формализации и обработки экспертной информации
Цель формализации — упростить, стандартизировать и ускорить использование «свободной», но важной информации. В идеале формализации подлежит вся используемая информация, попадающая в «зазор» между бесполезной и полезной, но уже формализованной информацией.
Существует шесть принципов, лежащих в основе формализации информации:
1. Простота.
2. Удобство в использовании, целесообразность.
3. Краткость.
4. Структурированность.
5. Обязательность.
6. Наглядность.
Методы:
Экспертное ранжирование. Ранг – степень отличия по какому-либо признаку, а ранжирование – процесс определения рангов, относительных количественных оценок степеней отличий по качественным признакам.
Ранжирование применяется в случаях, когда невозможна или нецелесообразна непосредственная оценка. При этом «ранжирование объектов содержит лишь информацию о том, какой из них более предпочтителен, и не содержит информации о том, насколько или во сколько раз один объект предпочтительнее другого. Объект, расположенный в ранжировании эксперта, скажем, на третьем месте, может превосходить объект, расположенный на четвертом месте, в 1,01 раза, а может превосходить и в 101 раз».
Метод простой ранжировки. Заключается в том, что эксперты располагают объекты ранжирования (например, критерии) в порядке убывания их значимости (скажем, для альтернатив это убывание предпочтительности). Ранги обозначаются цифрами от 1 до n, где n – количество рангов.
Метод непосредственной оценки заключается в отнесении объекта оценки к определенному значению по оценочной шкале (т. е. в присвоении объекту оценки балла в определенном интервале), например, от 0 до 10 – в соответствии с предпочтением по какому-либо признаку или их группе.
Метод парных сравнений заключается в определении предпочтений элементов, расположенных в левом столбце, над элементами, расположенными в верхней строке. При этом составляется матрица, по строкам и столбцам которой располагают сравниваемые объекты.
В ячейке A12 вписана единица, это означает, что элемент A1 получает большую оценку, чем элемент A2. Соответственно в ячейке A21 пишут 0 и затем, суммируя значения по строкам, получают ранги объектов.
