Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции / Лекция 4_классификация.doc
Скачиваний:
29
Добавлен:
11.06.2015
Размер:
394.75 Кб
Скачать

66

IV КЛАССИФИКАЦИЯ ДАННЫХ

Основания классификации

Классификация информационных технологий

Расчетные данные

Основания классификации

Быстрый рост объемов данных, сложность задач сбора, хранения, поиска, обработки и распространения информации, с одной стороны, и появление современных информационных технологий, с другой стороны, требуют классификации данных.

Наиболее полное и эффективное использование информации возможно при правильной и четкой организации данных и наличии хорошо проработанных и умело используемых средств поиска информации. Одним из самых полезных методов организации БД и поиска в них является классификация – традиционный метод познания, в результате применения которого данные представляются в виде некоторой схемы. Правильное использование классификации обеспечивает информационную совместимость и повышает эффективность поиска данных. Классификация определяет возможность сведения неупорядоченного набора параметров к совокупности взаимосвязанных данных. Использование отдельных комплектов данных на первом этапе позволяет проектировать и вводить в действие БД последовательно, особенно, это важно при ограниченных ресурсах. Это упрощает распределение заданий между исполнителями и учреждениями в зависимости от их специализации. Классификация дает возможность получить представление о необходимых информационных ресурсах, программных средствах для создания БД и установить связи между различными БД и таблицами внутри БД. Минимизация числа связей между таблицами данных, скорость поиска данных могут служить критериями такой классификации [1].

Отсутствие единой классификации ощущается как при самом общем рассмотрении проблемы создания БД, так и при поиске данных. Для взаимодействия систем, разработанных в различных учреждениях, необходима унификация используемых имен атрибутов (параметров), классификаторов и кодификаторов.

Классификацию данных необходимо начать с типизации возможностей получения данных, которыми являются:

  • непосредственное измерение (наблюдение) по району (площади), фиксированной (постоянная точка наблюдений) или случайной (движущуюся платформа) точке, траектории. При этом логическими единицами хранения являются значение отдельного параметра, проба (комплекс параметров), профиль (несколько проб по вертикали), разрез (несколько профилей в пространстве), набор данных (множество профилей, отсортированных во времени – временной ряд и, или пространстве (рейс судна);

  • результаты анализа полученных измерений путем интерполяции, экстраполяции, прогноза, вычисления новых показателей, статистических вычислений (обобщений, агрегации);

  • моделирование.

В результате может получиться комплект данных для проекта, экспедиции, в точке (временной ряд), на профиле, в узлах сетки.

Наиболее общими свойствами любого параметра являются место и время измерения, то есть:

Значение параметра = F (Место, Время)

Местом проведения измерения может быть точка, заданная своими координатами или названием географической области (моря, пляжа, населенного пункта), сведения о которой в зависимости от масштаба проводимых наблюдений могут быть представлены с разной степенью точности. Допустимо представление данных в виде точки, полигона, траектории.

Наблюдения отличаются своей продолжительностью и рядом других временных характеристик (временной масштаб обобщения, частота измерения), время их выполнения фиксируется всегда (год, дата, время – часы, минуты, секунды в зависимости от масштаба процесса).

Используя такую модель представления измерений можно, например, выбирать данные по критериям, формулируемым по местоположению, времени, имени и значениям атрибута. Например, выбрать данные для всех атрибутов по географическому району за конкретный период времени; выбрать значение параметра за период времени по всему географическому пространству, представленному в БД; выбрать все измерения когда-либо проводившиеся в конкретном географическом районе.

Основания классификации данных представлены на рис.1. Данные в зависимости от их способа представления в ЭВМ разделяются на пространственные, фактографические, текстовые, графические и звуковые. Результаты наблюдений представляются в виде таблиц цифровых значений (фактов) для одной или нескольких точек наблюдений, в исходном или осредненном (для точки или района) виде и на карте в виде значений параметров, отнесенных к определенным координатам или изолиний значений параметров.