Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Экзамен / Otvety-k-ekzamenu-po-BD.doc
Скачиваний:
24
Добавлен:
11.06.2015
Размер:
700.93 Кб
Скачать

Основания для классификации данных

Основание

Объекты

Степень подготовленности к обработке

Данные на бумажных носителях (книги, бюллетени, ежемесячники, и т.п.); магнитных лентах, дискетах и др.; в массивах данных; БД

Способ и сроки передачи

Категория А. Оперативные данные, собранные через глобальную сеть телесвязи в пределах времени отсечения (1-24 ч)

Категория В. Данные, отличающиеся от категории А более продолжительным временем отсечения (от нескольких суток до двух месяцев)

Категория С. Исторические данные, собираемые с большими задержками во времени.

Способ измерения

Дистанционный, автоматический, визуальный, ручной

Регулярность наблюдений

Регулярные, регулярные синхронные, асинхронные, нерегулярные, эпизодические

Шкала измерений

Порядковая, количественная, номинальная, балльная

Инвертирование

Полностью инвертированные; выборочно – инвертированные (временные ряды); объединенно инвертированные

Агрегированные (расчетные)

Вычисленные характеристики первого рода –интерполированные, второго – вычисленные и интерполированные значения и третьего – фоновые характеристики района

Прогнозные

Краткосрочные, долгосрочные, сверхдолгосрочные

Статичность

Изменяющиеся, статические, условно–постоянные

Периодичность обработки

Регламентированные (ежедневные, ежедекадные, ежемесячные и др.), нерегламентированные

Регламент доведения до пользователя

Экстренные (сразу после обнаружения); периодические (ежечасно, ежесуточно, ежедекадно, ежемесячно); в установленные сроки

Распространение

По запросу, рассылка по списку, обмен

Использование

Информационные, справочные, информационно– справочные, рекомендации

Результаты расчетов по моделям (вычисленные значения атрибутов, интерполированные значения по пространству и времени и т.п.) также хранятся в соответствующих БД (подсхемах). Так, например, большинство данных для представления в ГИС обрабатывается путем предварительного инвертирования и дальнейшей интерполяции (расчетов) в узлы регулярной сетки различного масштаба. На этом этапе фактографические данные превращаются в пространственные.

Необходимость хранения агрегированных данных определяется также последующей возможностью сравнения результатов, полученных различными методами статистической обработки, например, в зависимости от разной длины временных рядов наблюдений, методов осреднения, интерполяции и т.п. Последний тезис показывает, что и при наличии мощных средств обработки данных в среде СУБД, когда скорость расчетов достаточна велика, необходимость хранения определенной части БД агрегированных характеристик не вызывает сомнений. Их создание позволит увеличить скорость обеспечения пользователей этими данными, исключить дублирование расчетов, уменьшить затраты машинного времени, улучшить качество расчетных характеристик, дать возможность проводить дальнейшую обработку созданных БД для агрегированных атрибутов.

По регулярности (периодичности и частоте) измерений данные бывают регулярные, регулярные синхронные, асинхронные, результаты экспериментов (данные разной регулярности измерений), нерегулярные. Регулярность определяется соответствующими наставлениями и руководствами или специальными программами измерений при экспериментальных исследованиях. Нерегулярные измерения требуют более сложных методов обработки. Космическая система наблюдений является асинхронной, но зато может обеспечить огромный поток информации с высоким разрешением по большим пространствам за короткий период времени.

Данные с точки зрения способа регистрации и кодирования делятся на три типа значения атрибутов, которые можно:

  • фиксировать с помощью систем кодирования;

  • регистрировать с помощью определенных правил, например, номера квадратов, регионов и т.п.;

  • измерять в количественной шкале, которая регистрирует значения атрибутов непосредственно в “натуральном” виде, как характеристики объекта.

Информация хранится на различных носителях: бумажных (таблицы, графики), первичных машинных носителях (дискеты, магнитные ленты), микрокопиях (микрофильмы, микрофиши), компактных дисках и др.

В зависимости от состава документов, отражающих информацию, их можно занести в БД документального, фактографического или документально–фактографического типа. Это определяется объемом неформализованной информации в документах, количеством атрибутов. Например, большинство метаданных относится к документальному типу представления.

Степень постоянства информации характеризуется временем, в течение которого она остается неизменной. По указанному признаку информация подразделяется на постоянную – статическую, условно–постоянную (хранимую и изменяемую редко). К постоянной информации относятся различные словари и кодификаторы, например, названия стран, учреждений – поставщиков и потребителей данных, атрибутов и т.п. Условно–постоянная информация сохраняет свое значение определенный период времени и делится на начальную и скорректированную. К начальной информации можно отнести сведения, первый раз зарегистрированные в БД. Соотношение объемов постоянной, условно–постоянной информации имеет большое значение при выборе организации БД.

Способы распространения информации бывают следующие: высылается по запросу, рассылается по списку, передается и получается в обмен с зарубежными странами и организациями с помощью обычной почты, факса, электронной почты, Интернета.

По функциям использования выходная продукция может быть справочной (метаданные), информационной. К метаданным относятся сведения о БД, источниках данных (измерительных системах, приборах, датчиках, платформах, организациях), сведения о средствах управления данными (программных средствах, форматах хранения данных, кодификаторах, словарях). Информационная продукция – это выборки данных по любому объекту или/и на любой момент времени.

По степени готовности к использованию для принятия решений выходная информация может быть частной, комплексной или используемой только в совокупности с другой информацией. Например, сведения о критических значениях природных явлений напрямую применяя на объектах экономики, а текущая информация о состоянии среды, как правило, используется совместно с экономической информацией о состоянии объектов.

Географическая область использования определяет локальность (используется только в пределах какого-либо географического района) или глобальность информации. Например, результаты регистрации температуры воздуха в конкретных пунктах являются локальными. В то же время среднемесячные и среднегодовые значения уровня на гидрометеорологических станциях, где наблюдения ведутся более 50 лет, необходимы для глобального использования, т.е. для изучения изменений климата.

Методами образования потоков информации являются: регистрация, т.е. получение исходных данных; преобразование их (инвертирование); получение агрегированных характеристик и прогнозных данных, которые также могут подвергаться дальнейшей обработке.

По результатам обработки данных можно получить огромное число расчетных атрибутов, поэтому стоит задача оптимизации их состава. Первым шагом решения этой задачи является создание таких БД в зависимости от стадии обработки (агрегации) данных. По этому основанию можно выделить вычисление характеристики первого, второго и третьего рода. Расчетные данные первого рода – это вычисленные характеристики на основе исходных атрибутов и известных эмпирических и теоретических формул. К расчетным данным второго рода можно отнести интерполированные значения во времени и пространстве. Расчетные данные третьего рода представляют различные уровни агрегации данных в пространстве и времени (обобщение результатов переписи населения, климатические характеристики среды, др.).

Соседние файлы в папке Экзамен