Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
БД_1 / Мет пособие БД / Лекция 4_классификация.doc
Скачиваний:
36
Добавлен:
11.06.2015
Размер:
102.91 Кб
Скачать

IV. Классификация данных План

Обоснование необходимости использования классификаторов.

Основная классификация.

Дополнительные основания классификации.

Заключение.

Обоснование необходимости использования классификаторов

Быстрый рост объемов данных, сложность задач сбора, хранения, поиска, обработки и распространения информации, с одной стороны, и появление современных информационных технологий, с другой стороны, требуют классификации данных.

Наиболее полное и эффективное использование информации для научной и производственной деятельности возможно при правильной и четкой организации данных и наличии хорошо проработанных и умело используемых средств поиска информации. Одним из самых полезных методов организации БД и поиска в них является классификация – традиционный метод познания, в результате применения которого знания представляются в виде некоторой схемы. Правильное использование метода классификации обеспечивает информационную совместимость и повышает эффективность поиска данных. Классификация определяет возможность сведения неупорядоченного набора атрибутов к совокупности взаимосвязанных данных. Использование классификации позволяет проектировать и вводить в действие БД последовательно, по очереди, особенно это важно при ограниченных ресурсах. Это упрощает распределение заданий между исполнителями и учреждениями в зависимости от их специализации. Классификация дает возможность получить представление о необходимых информационных ресурсах, программных средствах создания БД и установить связи между ними и таблицами внутри БД. Минимизация числа связей между таблицами данных, скорость поиска данных служат критериями такой классификации.

Отсутствие единой классификации ощущается как при самом общем рассмотрении проблемы создания БД, так и при поиске данных. Для взаимодействия систем, разработанных в различных учреждениях, необходима унификация как используемых имен атрибутов, так и классификаторов, и кодификаторов.

Основная классификация

Наиболее общими характеристиками любого атрибута являются место и время их регистрации. Местом регистрации может быть точка, заданная своими координатами, географическая область, например, населенный пункт, сведения о котором могут быть представлены с разной точностью. Допустимо представление данных в любом пространственном масштабе (точка, полигон, район и т.п.). Регистрация данных отличается своей продолжительностью и рядом других временных характеристик, время их выполнения фиксируется практически всегда (год, дата, часы, минуты, секунды в зависимости от масштаба процесса).

Используя такую модель представления данных, можно выбирать данные по критериям, формулируемым по местоположению, времени, имени и значению атрибута. Например, выбрать данные для всех атрибутов по географическому району за конкретный период времени; выбрать значение атрибута за период времени по всему географическому пространству, присутствующему в БД.

Данные в зависимости от их способа представления в ЭВМ разделяются на пространственные, фактографические, графические и звуковые.

Пространственные данные представляются на карте в виде значений атрибутов, отнесенных к определенным координатам или изолиниям значений атрибутов. Пространственные данные всегда имеют географические координаты (географическая привязка).

Фактографические данные определяются местом и временем, отражают факты различных ситуаций для одной или нескольких точек, в исходном или агрегированном (осредненном для точки или района). Эти данные могут быть представлены в виде временных рядов, комплектов данных, организованных в зависимости от системы сбора данных и/или платформы, методов обработки и т.п. Фактографические данные в виде значений в узлах регулярной сетки различного пространственно – временного масштаба после их представления в виде изолиний кратных значений атрибутов среды (например, для температуры воды 00 ,50, 150, 250) становятся пространственными.

Текстовые данные – это документы, характеризующиеся библиографической информацией, представляются в текстовых редакторах.

Графические данные – это пространственная или фактографическая информация, представленная с помощью графических средств на экране (карты, графики, диаграммы, изображения). Фактически это результаты обработки исходных и модельных данных, представленные в виде графиков, диаграмм, сканированных документов. К этому типу данных относятся также фотографии, рисунки и т.п.

Звуковые данные – это звук, записанный в цифровом виде, например, записи песен или данных, введенных в ЭВМ с голоса.

Мультимедийные данные – содержат несколько типов данных. типичным примером таких данных являются html – страницы.

Некоторые типы данных могут переходить в другие типы. Например, фактографические – в пространственные, пространственные и фактографические в графические или текстовые, мультимедийные. Классифкация данных п редставлена на рис.7.

Основания классфикации данных более детально рассмотрены в табл.14.

БД могут хранить как метаданные, так и данные, отражающие состояние объекта. Данные могут разделяться в зависимости от их сортировки, степени обработки, метода организации регистрации и т.п. Данные в зависимости от их организации (сортировки) разделяются на исходные и инвертированные (представленные в другом порядке по отношению к исходным данным). Методика создания временных рядов обуславливает создание и хранение их в виде инвертированных данных. Это обусловлено влиянием экспертов, которые внесли свои изменения и улучшили качество созданных временных рядов.

Исходные данные хранятся в виде дисциплинарных массивов или БД, их упорядоченность определяется регламентом работы используемых систем сбора данных. Создание дисциплинарных БД для различных сфер, в различных науках (предметных областях) обусловлено технологическими причинами, связанными с системами измерений.

Таблица 14

Соседние файлы в папке Мет пособие БД