
- •1.1. Архитектура бд
- •2. Тема 2. Системы управления бд (субд). Выбор систем управления бд. Функции субд.
- •3.1. Жизненный цикл бд. Этапы жц бд.
- •3.1.1. Оценка работы и поддержка б.Д. Производится оценка с точки зрения выполнения требований пользователей. В случае необходимости в систему вносятся изменения.
- •3.1.1.1. Документальные системы
- •3.1.1.2.Обобщенная функциональная структура дипс.
- •3.1.1.3. Коммерческие б.Д.
- •3.1.1.4. Коммерческие базы данных.
- •3.1.1.5. Распределенная обработка данных. Распределенные базы данных
- •3.2. Литература
- •4.1. Уровни.
- •4.2. Этапы проектирования.
- •4.3.Трехуровневая архитектура организации бд
- •4.4. Этапы проектирования: исследование проблемы, этап анализа, проектирование, реализация, внедрение, сопровождение.
- •4.5. Проектирование бд.
- •4.5.1. Этапы проектирования.
- •Тема 5. Средства и методы проектирования бд. Методика диаграмм взаимосвязей между объектами erd-диаграммы. Использование case-технологий при проектировании бд.
- •5.1. Базовые понятия.
- •5.2. Case - приложение eRwin
- •5.2.1. Объекты в eRwin
- •5.2.2. Связь в Erwin
- •6.1. Правила отношений между сущностями. Определение ключей
- •6.2. Нормализация бд. Денормализация бд.
- •Тема 7. Реляционная модель бд. Таблицы. Ограничения целостности данных. Реляционная алгебра. Реляционное исчисление.
- •Тема 8. Организация процессов обработки данных в бд. Обработка транзакций
- •Понятие транзакции.
- •9.1.1. Операторы определения данных ddl
- •9.1.2. Операторы манипулирования данными Data Manipulation Language dml
- •9.1.3. Язык запросов Data Query language (dql)
- •9.1.4. Средства администрирования данных
- •9.1.5. Программный sql
- •9.2. Оператор выборки данных select, использование условий поиска, сортировка результатов запроса. Синтаксис оператора select.
- •C.10. Тема 10. Простые запросы и правила их выполнения. Особенности многотабличных запросов. Объединение таблиц. Использование вложенных запросов
- •10.1. Простые запросы и правила их выполнения
- •10.2. Особенности многотабличных запросов
- •10.3. Объединение таблиц
- •10.4. Использование вложенных запросов
- •Тема 11. Внесение изменений в бд. Добавление информации в бд, удаление данных, изменение существующих данных.
- •C.11.1.Внесение изменений в базу данных
- •Удаление данных
- •11.2. Изменение существующих данных
- •12.1. Специальные аспекты работы с бд. Процедура индексирования.
- •12.2. Триггеры
- •12.2.1. Ключевые слова и параметры
- •12.2.2. Компоненты триггера
- •12.2.3.Типы триггеров.
- •12.2.4.Включение и выключение триггеров.
- •C.12.2.5. Удаление триггера
- •C.12.2.6. Корреляционные имена
- •12.3. Процедуры и функции
- •12.4. Функция
- •12.5.Курсоры.
- •Тема 13. Физическая организация бд на примере Oracle9i. Организация табличных пространств, журналов транзакций. Серверные процессы. Структуры памяти и взаимодействие между процессами.
- •13.1. Архитектура бд.
- •14.1. Системы обработки транзакций oltp и olap - технологий
- •14.2. Хранилища данных. Многомерные хранилища данных
- •14.3. Методы аналитической обработки (olap)
- •14.3.1. Хранилища данных
- •14.3.2. Причины внедрения информационных систем на основе хранилищ данных
- •Литература
- •14.5. Olap в России
- •Тема 15. Основы фракталов. Фрактальная математика. Фрактальные методы в архивации. Управления складами данных
- •15.1. Понятие "фрактал"
- •15.2. Классификация фракталов
- •15.2.1. Геометрические фракталы
- •15.2.2. Алгебраические фракталы
- •C.15.2.3. Стохастические фракталы
- •C.15.3. Системы итерируемых функций
- •15.4. Фрактальное сжатие
- •15.5. История фрактального сжатия
- •15.6. Идея фрактальной архивации
- •15.7. Сравнение с jpeg
- •15.8. Литература
- •Темы рефератов
3.1.1.4. Коммерческие базы данных.
Коммерческие базы данных представляют собой базы данных, специально предназначенные для продажи пользователям. Эти БД могут передаваться пользователям на машинных носителях либо к ним может обеспечиваться доступ в режиме «он-лайн». Кроме того, могут предоставляться печатные аналоги базы данных. В качестве машинных носителей используются как магнитные носители, так и оптические диски. Выбор способа предоставления информации определяется многими факторами:
1) характером информации и особенно степенью ее изменчивости («летучести»);
2) характером использования информации в организации-потребителе;
3) состоянием средств телекоммуникации в регионе, а также наличием технических средств у потребителей;
4) стоимостными параметрами (стоимость оплаты телефонных услуг или иных услуг по передаче информации, стоимость технических и программных средств и др.);
5) числом пользователей и интенсивностью их обращений к БД.
6) традициями в форме использования информации.
Развитие технических средств обработки данных и средств связи оказывает большое влияние на структуру индустрии информации. Так, с созданием национальных и глобальных сетей передачи данных (середина 70-х годов) ведущим видом информационных услуг в мире стал диалоговый поиск информации в удаленных от пользователя базах данных. Наблюдается как абсолютный рост числа он-лайновых баз данных, так и увеличение их доли в общем числе коммерческих баз данных. В России из-за недостаточного количества и качества каналов связи число он-лайновых баз данных невелико. Однако следует подчеркнуть, что если интенсивность изменения информации велика, а для пользователя важно иметь актуальную и полную информацию, то речь может идти только об он-лайновом доступе к БД.
Влияние характера использования информации в организации-потребителе на способ получения информации можно проиллюстрировать на следующем примере. Пусть имеется база данных о предприятиях и организациях. Если у потребителя эпизодически появляется потребность в отборе небольшого объема информации из этой базы данных, то лучше получать данные в диалоговом режиме. Если потребность возникает часто, размер выборки большой, а полученная информация используется в дальнейшей обработке (например, для распечатки адресов в письмах), то имеет смысл приобрести базу данных на машинном носителе.
1.1. Классификация коммерческих баз данных. С некоторой степенью условности рынок электронной информации можно разделить на три крупных сектора:
∙- сектор деловой информации;
∙- сектор профессиональной (патентной, научно-технической и т. п.) информации;
∙- сектор массовой потребительской информации.
Каждый из секторов имеет своих потребителей, предъявляет специфические требования к актуальности и точности информации и, как следствие, к языковым, программным и техническим средствам поддержки данных.
Тематический охват коммерческих баз данных практически безграничен, а их пользователем может быть практически каждый: в процессе своей профессиональной деятельности каждый индивид может быть потребителем или поставщиком информации первых двух секторов, а в повседневной жизни ─ пользователем информации третьего сектора.
Несмотря на растущее значение в общественном производстве, индустрия информации не является самостоятельной отраслью: она обеспечивает эффективную работу других отраслей общественного производства, т. е. является инфраструктурной отраслью. В связи с вышесказанным, а также с тем, что базы данных отражают определенную предметную область, состав, значение и потребительская стоимость информации сильно зависят от общего состояния той системы, в которую встраиваются коммерческие БД. Так, в «доперестроечные» времена коммерческие базы данных в стране практически не были распространены. С развитием рыночных отношений стал развиваться и рынок информационных услуг. Но и здесь конъюнктура сильно зависит от состояния экономических процессов, происходящих в стране. Например, изменения в системе распределения жилья привели к необходимости создания баз данных жилого фонда и появления большого интереса к этой информации у многих пользователей. Аналогичная ситуация возникает с землей, нежилым фондом, акциями и ценными бумагами и другой информацией. Такие базы данных практически отсутствовали у нас в стране в связи со спецификой политико-экономического устройства. Здесь есть и обратная зависимость ─ функционирование рынка невозможно без соответствующей информационной инфраструктуры, и переход к рынку у нас в стране с неизбежностью приведет к резкому росту числа коммерческих баз данных и особенно в первом секторе ─ секторе деловой информации.
Анализ использования коммерческих баз данных с точки зрения приносимых доходов показывает, что наибольший доход приносят именно БД деловой информации. По данным [6], - в США доходы по предоставлению услуг доступа к базам данных НТИ не превышали 7%, а в Западной Европе ─ 10%, тогда как информация в сфере бизнеса приносила более 70% доходов, профессиональная информация ─ 16%, а потребительская ─ 6%. Следует обратить внимание, что речь идет о развитых в информационном отношении странах, где число потребительских баз данных и абонентов велико. Приведенное выше соотношение доходов не в последнюю очередь определяется тем, что за деловую информацию, отсутствие или искажение которой может вызвать непоправимые последствия для бизнеса, пользователь вынужден и может платить большие деньги, в то время как при оплате за бытовую информацию он не так щедр. Наибольшая зависимость состава требуемых баз данных от социально-экономического устройства общества наблюдается в секторе деловой информации, однако, такая зависимость присуща и для сектора массовой и научно-технической информации. Так, в некоторых странах библиотечные услуги являются платными, и это, безусловно, сказывается на развитии коммерческих БД в этой области.
В пределах каждого сектора рынка электронной информации могут быть выделены подсекторы.
В секторе деловой информации важную роль играет подсектор биржевой и финансовой информации. В нем информация характеризуется высокой степенью изменчивости, большими объемами. Со стороны пользователей предъявляются требования к абсолютной полноте и точности информации, к ее оперативности. Именно в этом подсекторе информационного рынка особенно бурно развиваются новые информационные технологии. К этому подсектору происходит большое количество обращений, и он приносит большие доходы. Информация о котировках ценных бумаг (акций, облигаций, закладных) и товаров, учетных ставках и обменных курсах выступает основной на данном рынке.
Основными потребителями биржевой информации являются другие биржи и специализированные службы по распространению биржевой и финансовой информации. Для обработки биржевой информации необходимы специальные посреднические фирмы.
Следует обратить внимание на интерес зарубежных фирм к этому сектору информации.
В настоящее время этот сектор информации развивается быстро. Причем здесь наблюдается использование наиболее современных технических средств (как ЭВМ, так и средств связи, в том числе спутниковой). И если в других секторах у нас пока преобладающим является оф-лайновое предоставление информации, то по биржевой информации естественным является он-лайновое обслуживание.
Для финансовой информации важное значение имеет проблема стандартизации. Это касается как представления данных, так и систем коммуникации.
Коммерческая информация по сравнению с биржевой и финансовой имеет более стабильный характер. Рынок коммерческой информации в мире оценивается всего в 10─20% от рынка биржевой и финансовой информации. В этом секторе рынка информационных услуг может быть получена прежде всего справочная информация о предприятиях/организациях, их продукции, финансовом состоянии (в том числе полные отчеты компаний), связях, сделках, адресах и телефонах руководителей и т. п.
В некоторых странах есть понятие «публичное» предприятие. Такое предприятие обязано сообщать сведения о своей деятельности, и за это оно получает некоторые финансовые и налоговые льготы. В других странах четко определено, какие сведения и с какой периодичностью должно сообщать предприятие в статистические органы, и эти отчеты могут служить источником коммерческой информации. Возможно, что это будут и собственные сведения, собираемые организациями, подготавливающими справочную информацию.
БД, в которых хранятся сведения о продукции, как правило, специализированы по видам продукции. Иногда наряду с коммерческой информацией такие базы данных содержат и научно-техническую информацию, особенно если речь идет о сложной промышленной продукции.
Для распространения коммерческой информации широко используются теле- и радиоканалы.
Вообще в мире наблюдается тенденция к сближению и взаимодействию всех видов информации и созданию на этой основе эффективной среды поддержания всей цепочки торгово-платежных операций, начиная с просмотра каталогов торговых предложений, товаров и услуг и кончая контролем за поставкой товара и получением по электронной почте сопроводительных документов.
Сектор профессиональной информации включает в себя информацию, расширяющую профессиональные знания в предметной области профильной специализации ее потребителей:
∙ информацию о методиках экономических исследований ─ для экономистов и бизнесменов;
∙ законы и другие правовые акты ─ для юристов, бизнесменов, управленческого персонала;
∙ информацию о свойствах материалов ─ для технологов, химиков и т. п.
Кроме того, специалисты обращаются и к информации из сектора деловой информации.
В секторе массовой потребительской информации можно выделить следующие блоки:
∙- новости, предоставляемые различными агентствами новостей;
∙- энциклопедии, справочники;
∙- торговая сеть;
∙- искусство;
∙- гидрометеорология;
∙- путешествия;
∙- расписания движения транспорта и т. п.
Следует отметить, что приведенное разбиение рынка информации на секторы условно, как всякая классификация, и зависит от цели исследования.
Кроме деления информации по секторам в зависимости от ее содержания и назначения часто используют деление информации на актуальную и «историческую» (это деление в основном относится к деловой информации). Актуальной считается информация, которая меняется очень быстро (ежеминутно и даже ежесекундно). Это, к примеру, информация о курсах валют, котировках акций и т. п. Информационные компании, связанные с актуальной деловой информацией, имеют большую прибыль, чем те, для кого основной является «историческая» информация.
По оценкам специалистов, услуги диалогового доступа имеют перспективы стать по-настоящему массовыми прежде всего в сфере экономической, биржевой, финансовой информации, а также в области резервирования и заказа (билетов, мест в гостиницах, товаров и т. п.).
Различают БД-указатели и БД-источники. Число баз данных первого типа составляет около трети всех баз данных. БД этого типа указывают пользователю источник, к которому надо обратиться для получения интересующих его сведений. В числе этих баз 20% содержат библиографические описания, а также реферат, а 13% указывают на лицо, организацию, проект или что-то иное, отличное от документа [6]. Такие базы данных в основном относятся к сектору профессиональной информации.
Среди баз данных-источников различают числовые, полнотекстовые, текст-числовые, мультитиповые. В последние годы получают развитие и графические базы данных (в частности, для хранения торговых марок, структурных формул химических элементов, конструкторских элементов и т. п.). Иногда в отдельный тип БД-источников выделяют базы, содержащие тексты программ для ЭВМ.
Во второй половине 80-х годов доля библиографической информации сократилась и резко возросла доля полнотекстовых баз данных. Возросла также и доля справочных баз данных. Согласно данным, приведенным в [6], в 1990 г. библиографические БД составляли 23%, полнотекстовые ─ 45% и справочные─18% общего рынка баз данных.
В России в 1992 г, насчитывалось более 100 негосударственных служб деловой, прежде всего коммерческой информации. Обслуживание довольно небольшого рынка таким большим числом информационных служб свидетельствует о большом спросе на информацию и одновременно о незрелости информационного рынка.
В настоящее время в России наблюдается ситуация, когда многие тематические области не охвачены, а с другой стороны, имеет место сильное дублирование в других предметных областях (например, имеются множество баз данных по законодательству, баз данных предприятий и организаций, дайджесты рекламы и т. п.).
Пользователи коммерческих баз данных
При создании любой коммерческой базы данных необходимо определить сферу ее применения, круг потенциальных пользователей, решаемые им задачи. При этом необходимы классификация пользователей (в том числе и потенциальных) и выявление их информационных потребностей.
Различают пользователей коллективных и индивидуальных. Среди коллективных выделяются: правительственные органы, неправительственные организации, средства массовой информации, учебные заведения, научные организации, предприятия и др.
Существуют коммерческие БД, ориентированные на определенный круг пользователей; могут вводиться и более жесткие ограничения на доступ к информации (такие, как обоснованность запроса). Примером служит база данных по сомнительной клиентуре коммерческих банков, создававшаяся по решению Совета Ассоциации российских банков. Пользователями такой базы данных могут стать коммерческие банки, участвующие в ее создании и подписавшие обязательства использовать полученную информацию, не нанося ущерба друг другу. Основанием для запроса о благонадежности клиента банка являются представленные ими в информационный центр кредитные заявки на выдачу ссуд, превышающих определенный размер, а также сведения о случаях передачи материалов на клиента в правоохранительные или судебные органы.
Коммерческие БД могут быть ориентированы не только на конечных пользователей, но и на промежуточных ─ так называемых информационных посредников. Ориентация на конечного пользователя предъявляет повышенные требования к разработке дружественного интерфейса и обеспечению эффективности доступа вне зависимости от квалификации пользователя. Ориентация на промежуточных пользователей может упростить разработку БД, но при этом возникает лишнее звено со всеми вытекающими отсюда отрицательными последствиями: удорожание услуг, увеличение времени реакции системы на первоначальный запрос пользователя и т. п. В настоящее время наблюдается тенденция к ориентации коммерческих БД на конечного пользователя.
По отношению к стране пользователи разделяются на внутренние и внешние. Тенденция к интеграции, которая наблюдается во всем мире, в наибольшей мере сказывается в информационной сфере. Речь идет не только об эффективном использовании тех огромных накопленных в мире информационных ресурсов, внедрении современных информационных технологий, но и о продаже внутренней информации на внешнем рынке. Внешние пользователи территориально не обязательно должны находиться за пределами государства. К ним относятся, например, работники посольств, торгпредств, корпунктов и т. п. Работа коммерческих БД с внешними пользователями имеет специфические особенности, связанные с расчетами в разных валютах, с многоязычием и т. п. В последнее время наблюдается рост трансграничного обмена информацией.
Последствия коммерциализации информации
Подход к информации как к товару наряду с очевидными преимуществами таит в себе целый ряд существенных опасностей. Так, по экономическим соображениям в коммерческие БД должны вводиться данные, которые нужны большому числу пользователей. Но с точки зрения развития науки этот критерий далеко не всегда правильный. Есть информация, которая «обгоняет» свое время, н поэтому она долгое время остается невостребованной. Такая информация не должна потеряться, так как плохое информирование в науке резко замедляет развитие общества и приводит к большим потерям, вызванным дублированием научно-исследовательских работ. Кроме того, доступ к информации ставится в зависимость от финансового положения пользователей, что снижает эффективность деятельности недостаточно «имущих» пользователей, ограничивает их естественные права на получение информации и, как следствие, снижает эффективность функционирования всей системы в целом. Кроме коммерческих баз данных необходимо создать и некоммерческие БД общего пользования.
Следует отметить, что, несмотря на постоянное увеличение доли коммерческого сектора в области создания баз данных в странах Европейского сообщества, в конце 80-х годов доля бесприбыльных организаций, создающих базы данных, остается значительной и составляет более 50% [6]. Бесприбыльные организации в основном заняты созданием библиографических баз данных и баз статистических данных.