Слово информация происходит от латинского informatio - осведомление, сообщение о положении дел или о чьей-то деятельности, сведения о чем-либо. С появлением и развитием кибернетики, а позже вычислительной техники и информатики это слово хотя и сохранило свой первоначальный смысл, но, кроме того, получило еще ряд новых значений. Говоря об информации, мы подразумеваем совокупность данных, фактов, знаний о некоторой системе, характеризующих организацию, структуру, состояние и поведение этой системы в целом или ее отдельных элементов.
Информация о системе может быть получена либо путем наблюдения, либо в результате экспериментов как натурных, так и модельных, либо при изучении абстрактных гипотетических систем - на основе логического вывода. Информация, имеющаяся до проведения эксперимента, называется априорной, полученная после эксперимента -апостериорной. Она также может быть истинной или ломаной. Так как процесс получения информации зачастую имеет статистический характер, то информация о системе (в особенности о сложной) может быть как детерминированной, так и вероятностной.
Намереваясь использовать информацию о системе для решения определенных задач, наблюдатель (исследователь, инженер-проектировщик, технолог, организатор производства) рассматривает ее с различных точек зрения. Важнейшими выступают аспекты: прагматический (достижение поставленных целей), семантический (смысловое содержание) и синтаксический (способ представления). В настоящее время сложились три основные точки зрения на то, что понимать под информацией.
Информация -потребляемый всеми отраслями народного хозяйства ресурс, имеющий для них такое же значение, как энергетические ресурсы или запасы полезных ископаемых. Причем с развитием общества организация использования информационных ресурсов, в которых обобщаются и концентрируются все имеющиеся сведения (данные, факты, знания) о различных вопросах экономики, науки, техники, технологии, культуры, искусства, медицины и т. д., оказывает все большее влияние на интеллектуальную и экономическую жизнь.
Информация -совокупность научно-технических сведений, фактов, знаний о результатах развития науки и техники. Другими словами, информация, согласно данной трактовке, является продуктом и «сырьем» системы информационного обслуживания научно-технической деятельности.
Информация-сумма продуктов, формируемых в системах информационного обслуживания научно-технической деятельности и подготовки кадров различных профилей, т. е. область производства и потребления информационных ресурсов ограничивается лишь интеллектуальной жизнью общества.
Очевидно, что наиболее полное, охватывающее все многообразие информационных процессов понимание дает первая из этих трактовок. Действительно, информация пронизывает все сферы деятельности человека и общества. Именно этим обстоятельством определяется интенсивное развитие в последние годы науки, получившей название информатики, изучающей свойства информационных ресурсов и разрабатывающей эффективные методы и средства их организации, пополнения, преобразования и использования. Этим же объясняется особое значение, которое сейчас придается новой отрасли народного хозяйства - индустрии обработки информации. На пользовательском уровне, т. е. для конструкторов, технологов, проектировщиков, организаторов производства и т. д., достижения информатики и результаты развития индустрии обработки информации проявляются в создании и развитии систем автоматизации и информационных систем, обеспечивающих хранение и преобразование необходимых пользователю данных.
Рассмотрим укрупненную функциональную схему информационной системы. Как видно из этой схемы, область определения любой информационной системы (предметная область) представляет собой некоторое информационное пространство, содержащее совокупность информационных объектов, каждый из которых может быть описан с точки зрения систем хранения, обработки и поиска информации и взаимосвязей данного объекта с другими объектами рассматриваемой предметной области. В общем случае информационное пространство неоднородно, так как содержит информационные объекты, различающиеся по методам формирования, организации и пополнения информации.
Все преобразования информации, осуществляемые системой, можно свести к пяти основным процедурам: хранение, поиск, обработка, ввод, вывод. Первые три процедуры являются внутренними, а четвертая и пятая обеспечивают связь данной системы с объектами предметной области, т. е. источниками информации, и внешней средой (потребителями информации). Таким образом, любая информационная система и обрабатываемая ею информация образуют сложную неоднородную систему, которая, в свою очередь, является элементом еще более сложной глобальной системы «природа -человек -человеческая деятельность - общество».
Эффективность управления любой динамической системой (технологическим процессом, производством, процессом создания нового изделия в условиях интегральной автоматизации цикла «исследования - проектирование - производство» и т. д.) во многом определяется тем, как организованы хранение, поиск, обработка и пополнение информации. Очевидно, что управление возможно только в той системе, в которой четко определены информационные связи как между отдельными элементами, так и с внешней средой. В этом случае обеспечиваются возможность координации деятельности различных подсистем, сопряжения данной системы управления с системами более высокого и более низкого уровней. Если учесть, что эффективность управления в сложных системах в значительной степени определяется методами сбора, передачи и обработки информации, то очевидно, что информационная система является обязательным элементом управляющей системы.
Важнейшей отличительной чертой процессов управления является непременное наличие в управляющей системе обратной связи. Естественно, что выработка управляющих воздействий требует информации о результате предыдущего воздействия на объект управления, информации о достижении некоторой заданной на предшествующем этапе управления цели.
Разработка систем информационного обеспечения процессов управления производством -весьма трудоемкий и сложный процесс. Здесь уместно обратить внимание на специфику формирования информационных потребностей руководителя, работающего, с одной стороны, в условиях перенасыщения разнообразной по характеру и различной по ценности информацией, с другой - в условиях крайне ограниченного времени, которое он может выделить для восприятия и обработки этой информации. При этом руководитель постоянно нуждается в сведениях о ходе производственного процесса, поставках сырья, полуфабрикатов и комплектующих изделий, сбыте готовой продукции, перспективах развития отрасли,, новой прогрессивной технике и технологии и т.д. Все это обусловливает важнейшее значение методов определения информационных потребностей как руководителей, так и любых других потребителей информации.
Очевидно, что информация выдаваемая информационной системой потребителю является одним из ресурсов, позволяющих повысить производительность труда и эффективность его деятельности. Поэтому важнейшим аспектом взаимоотношений потребителя и информационной системы является по возможности наиболее полное и рациональное удовлетворение информационной потребности пользователя, другими словами, обеспечение эффективного использования информационных ресурсов. Это, в свою очередь, предполагает доведение информации до потребителя в требуемом объеме, в заданные сроки и в удобной для восприятия форме. Именно использование информационных ресурсов таким образом позволяет минимизировать расход всех других видов ресурсов (материальных, трудовых, финансовых, вычислительных ресурсов ЭВМ) при информационном обеспечении потребителей.
Таким образом, информационные ресурсы представляют собой один из обязательных элементов, необходимых для осуществления любого вида человеческой деятельности: производства, управления, научных исследований, проектирования новой техники и технологии, подготовки и переподготовки кадров. Как самостоятельный вид информационные ресурсы были выделены сравнительно недавно, когда в ходе научно-технической революции была в полной мере осознана роль информации, когда стало ясно, что эффективность производства во всех отраслях народного хозяйства, его интенсификация зависят от того, как внедряются достижения научно-технического прогресса.
Под информационной системой (ПС) условимся понимать автоматизированную систему', предназначенную для организации, хранения, пополнения, поддержки и представления пользователям информации в соответствии с их запросами. Термин «информационная система» может быть отнесен к весьма широкому классу автоматизированных систем, поскольку целью любой автоматизированной системы, независимо от области ее применения, используемых методов построения, технической базы, аппарата поддержки принятия решений является предоставление полной, достоверной и своевременной информации. Информационные системы целесообразно прежде всего разделить на две основные группы: системы информационного обеспечения и системы, имеющие самостоятельное целевое назначение и область применения.
Системы (или подсистемы) информационного обеспечения входят в состав любой АСУ. Они являются важнейшими компонентами интенсивно развиваемых в настоящее время систем интегральной автоматизации производственных систем, систем автоматизированного проектирования (САПР), автоматизированных систем научных исследований, АСУП. Хотя работы по созданию систем информационного обеспечения были начаты уже в шестидесятые годы (при проектировании первых АСУП), им в то время не придавалось определяющего значения. Это, на мой взгляд, является одной из причин того, что автоматизированные системы управления производством не дали ожидаемого экономического и социального эффекта.
БИЛЕТ 2
Что такое информация?
Обычно информацию отождествляют со знаниями, сведениями, данными. Пока в силу описанных выше факторов не выросло значение информации и не определились новые проблемы и аспекты ее исследования, такое представление было допустимым. Но вот условия изменились. Стали создаваться мощные и дорогостоящие информационные системы. .Затраты на информацию, прежде растворявшиеся в общей сумме производственных и управленческих расходов и поэтому незаметные, стали исчисляться миллиардами. При этом выяснилось, что собираемые и обрабатываемые данные далеко не равноценны, что одни данные, пусть небольшие по объему, очень важны и для их получения целесообразно создавать самые сложные информационные системы, другие же, несмотря на большой объем, мало что дают для управления. Мы и раньше знали, что короткое сообщение может быть содержательнее пухлых докладов и отчетов. Но какие законы определяют различие между ними - этого мы не знали.
Первый шаг в раскрытии этих законов был сделан с возникновением в 40-х годах XX века так называемой «статистической» теории информации, создателями которой были Клод Шеннон и Норберт Винер. Большой вклад в ее разработку внесли также советские ученые А. Н. Колмогоров и В. А. Котельников. Статистической ее называют потому, что информация в этой теории определяется на основе вероятностей тех или иных событий.
Для этого вводится мера неопределенности некоторого события, имеющего несколько разных исходов. Если все исходы события равновероятны, то его неопределенность принимается равной логарифму числа исходов, причем на каждый исход из общей неопределенности приходятся одинаковые доли, равные их вероятности. В более общем случае, когда вероятности разных исходов не равны, неопределенность одного исхода измеряется логарифмом его вероятности, а неопределенность всего события - средней из неопределенностей отдельных исходов, взвешенных по их вероятностям. Исчисляемая таким образом величина в теории информации называется энтропией.
На основе понятия энтропии строится и количественное определение информации, которая в статистической теории трактуется как мера уменьшения неопределенности при совершении какого-либо события. Информацию об одном из исходов некоторого события можно представить как разность его неопределенностей до и после события. При этом оказывается, что чем больше вероятность исхода до осуществления события, тем меньше количество информации, получаемое при его совершении. "
Чем более неожиданно сообщение, чем менее вероятно оно, тем больше информации оно содержит. Такое определение информации хорошо согласуется с широко распространенным представлением.
Разработав меру количества информации, статистическая теория информации впервые доказала, что данные нельзя отождествлять с информацией. Информация содержит лишь те данные, которые уменьшают неопределенность интересующих нас событий, т. е. вновь получаемые сведения, а количество содержащейся в них информации зависит от того, насколько их нельзя было предвидеть заранее. Статистическая теория информации зародилась на почве анализа передачи сообщении по каналам связи, т. е. в области, прямо не связанной с проблемами управления. Уже позднее обнаружилась возможность обобщения теории информации и приложения ее результатов к решению проблем управления. В частности, было показано, что всякий орган управления (регулятор) может рассматриваться как канал связи. При этом его мощность, т. е. способность к выработке эффективных управляющих воздействий, не может превышать его пропускной способности как канала связи с учетом возникающих в канале помех. Это утверждение получило название закона необходимого разнообразия. Он требует, чтобы при этом принимались во внимание объемы потоков информации и пропускная способность элементов (людей н машин), из которых строится система управления. Если один центральный орган управления не обладает необходимым разнообразием, структура управления становится иерархической, многоуровневой. Применение элементов с более высокой пропускной способностью, например ЭВМ вместо арифмометров, создает предпосылки для сокращения числа уровней, упрощения структуры управления.
Статистическая теория информации оказала большое влияние на глубину познания природы информационных процессов и разработку методов их организации. В то же время, будучи развита прежде всего для решения проблем передачи сообщений, она страдает известной ограниченностью. Основной ее минус в том, что она не принимает во внимание ни содержания сообщений, ни ценности их для конкретных получателей, а неожиданность является единственным критерием информативности.
Разумеется, экономисты легко обнаруживают ограниченность статистической теории. Они знают, что показатели, вовсе не неожиданные, могут быть весьма содержательными и ценными в зависимости от того, что они отображают и для решения каких задач используются. Иначе говоря, неожиданность сообщения - это важный, но не единственный фактор, определяющий его информативность для конкретного получателя.
Другие факторы удается выделить на основе современной теории знаковых систем - семиотики. Предметом семиотики является процесс общения (коммуникации) внутри группы получателей и отправителей сообщений, язык как средство общения. Язык рассматривается при этом как знаковая система, т. е. совокупность знаков и правил их использования для выражения того или иного содержания. Знаком (z) может быть любой материальный объект, если он оказывается элементом так называемой знаковой ситуации. Знаковая ситуация, предполагает наличие следующих элементов: 1) совокупности знаков с заданными способами их различения - языка Z, 2) совокупности различимых объектов реального мира А: каждый объект а е А обозначается определенным знаком, например z, т. е. z является обозначением а, который в этом отношении есть обозначаемое; 3) совокупности понятий S, отражающих реальные объекты в памяти получателей и отправителей информации: каждое понятие s е S является отражением определенного объекта, например а, и образует значение (или смысловое значение) обозначающего его знака z, 4) группы получателей и отправителей сообщений М: каждый член этой группы т е M получает или отправляет сообщения, выраженные в языке Z, причем не только воспринимает, но и оценивает их, соответственно изменяя свое поведение.
Отношения между знаками в языке Z взятые независимо от их содержания (значения) и ценности для тех или иных получателей, изучаются особым аспектом семиотики - синтактикой. Из сказанного выше следует, что статистическая теория информации исследует информацию главным образом в этом аспекте.
Отношения между знаками и обозначаемыми ими объектами (z - а), знаками и их значениями (z - s), а также между объектами и отражающими их понятиями (а - s) образуют предмет другого аспекта семиотики - семантики. Семантика изучает содержание сообщений - то, что упускается из виду теорией информации. Содержанием сообщения является знание - упорядоченное определенным образом отражение в понятиях, суждениях и других построенных из понятий образах объектов и процессов реального мира. Чтобы воспринять содержание сообщения, получатель сам должен располагать определенным запасом знаний. Последний в семиотике и информатике называют тезаурусом. Восприятие содержания знака состоит в том, что из тезауруса должно быть вызвано понятие, являющееся его значением. Если значение знака не будет установлено, знак не доставит получателю никакой информации, каким бы неожиданным он ни был.
Отношения между знаками и их получателями (z - m) в плане оценки и влияния их на поведение последних изучаются еще одним аспектом семиотики - прагматикой. Прагматика занимается ценностью сообщений в связи с теми задачами, которые решает их получатель в процессе своей практической деятельности. Чтобы оценить сообщение, его вначале надо принять (по физическому каналу связи) и понять (с помощью тезауруса). Это означает, что прагматический аспект исследования информации является·наиболее конкретным, учитывающим и синтаксические, и семантические отношения между знаками.
БИЛЕТ 3
Рассмотрим процесс восприятия сообщения в целом. Вначале сообщение, представленное упорядоченной последовательностью знаков передается по физическому каналу связи и принимается. Качество приема зависит от физического шума в канале и приемнике, от пропускной способности последнего. В этом смысле можно говорить, что при восприятии сообщение проходят физический фильтр. То, что прошло через него, можно считать информацией синтаксической или, статистической, т. е. информацией в смысле классической теории.
Далее эта информация должна быть понята, усвоена получателем. Для, этого сообщение должно пройти тезаурус (тезаурус в переводе с латинского языка означает сокровище, сейчас этим термином чаще всего обозначают систематический словарь понятий, в котором фиксируются как сами понятия, так и постоянные, не зависящие от контекста, отношения между ними, например классификационные), играющий роль семантического фильтра, отсеивающего семантический шум. Последний может возникнуть, например, в силу того, что в тезаурусе получателя отсутствуют понятия, являющиеся значениями знаков сообщения. В этом случае говорят, что тезаурус и сообщение не имеют общих точек, не пересекаются. Возможен другой случай, когда все содержание сообщения уже имеется в тезаурусе, включено в него. Тогда получатель опять же не получит никакой информации, не узнает ничего нового, и то, что даже понято им, тоже можно считать семантическим шумом. Советские ученые Ю. Шрейдер и И.Грекова предложили считать информацией ту часть содержания сообщения, которая составляет приращение тезауруса получателя. Оно образуется тогда, когда, с одной стороны, тезаурус получателя и содержание сообщения имеют достаточное количество общих точек, чтобы было возможным понимание, а с другой - в сообщении содержатся сведения, новые для получателя. Их восприятие обеспечивается зафиксированными в тезаурусе ассоциативными связями между понятиями: благодаря им новым понятиям находится в памяти место, они пристраиваются к тезаурусу, увязываются с другими понятиями.
Для данного получателя сообщение содержит только семантический шум и тогда, когда оно не имеет общих точек с тезаурусом, и в случае полного совпадения с ним. При оптимальной степени пересечения сообщения и тезауруса достигается максимальное приращение тезауруса, т. е. из сообщения извлекается максимум информации.
Такую информацию можно назвать семантической. Она не только принята, но и понята получателем. Но это не все. Содержание сообщения может быть принято, понятно, и все же не исключено, что для конкретного получателя оно не доставит информации, если он не найдет в нем нечто полезное для решения стоящих перед ним задач, если он не настроен на восприятие и использование его. Содержание сообщения должно быть еще оценено. Эту функцию выполняет третий, прагматический фильтр. Сведения, которые бесполезны для решения актуальных задач, отсекаются им как прагматический шум. И только те, которые считаются полезными с этой точки зрения, оцениваются как информация. Ее можно было бы назвать прагматической. Однако следует иметь в виду, что в практике управления и в общении между людьми вообще только эту информацию в конечном счете и считают информацией. Статистическая и семантическая информация может считаться информацией только в определенных частных случаях, когда от оценки полезности сообщений можно отвлечься. При изучении передачи сообщений по каналам связи, например, можно отвлечься и от содержания, и от ценности их. В оперативном управлении неожиданность (вероятность) сообщения ценится так высоко, что прочие факторы тоже можно оставить в стороне, хотя они предполагаются. В процессе обучения новые знания, расширяющие тезаурус обучаемого, приобретают самостоятельную ценность независимо- от того, будут или не будут они использоваться в дальнейшем. Это тот случай, когда можно отвлечься от ценности получаемых знаний. Но в практической деятельности чаще всего именно оценка дает окончательное заключение относительно того, какие сведения можно считать информацией.
Таким образом, под информацией условимся понимать новые знания, принятые, понятые и оцененные как полезные для решения тех или иных задач. Информация - это то, что доведено до получателя через тройной фильтр механизма восприятия
БИЛЕТ 6
Информационные системы: типы и этапы создания и развития
Под информационной системой (ПС) условимся понимать автоматизированную систему', предназначенную для организации, хранения, пополнения, поддержки и представления пользователям информации в соответствии с их запросами. Термин «информационная система» может быть отнесен к весьма широкому классу автоматизированных систем, поскольку целью любой автоматизированной системы, независимо от области ее применения, используемых методов построения, технической базы, аппарата поддержки принятия решений является предоставление полной, достоверной и своевременной информации. Информационные системы целесообразно прежде всего разделить на две основные группы: системы информационного обеспечения и системы, имеющие самостоятельное целевое назначение и область применения.
Системы (или подсистемы) информационного обеспечения входят в состав любой АСУ. Они являются важнейшими компонентами интенсивно развиваемых в настоящее время систем интегральной автоматизации производственных систем, систем автоматизированного проектирования (САПР), автоматизированных систем научных исследований, АСУП. Хотя работы по созданию систем информационного обеспечения были начаты уже в шестидесятые годы (при проектировании первых АСУП), им в то время не придавалось определяющего значения. Это, на мой взгляд, является одной из причин того, что автоматизированные системы управления производством не дали ожидаемого экономического и социального эффекта.
К числу ИС, имеющих самостоятельное значение, относятся информационно-поисковые (ИПС), информационно-справочные (ИСС) и информационно-управляющие (ИУС) системы. Информационно-поисковые и информационно-справочные системы предназначены для хранения и представления пользователю информации (данных, фактографических записей, текстов, документов и т. п.) в соответствии с некоторыми формально задаваемыми характеристиками. Для ИПС и ИСС характерны два основных этапа функционирования: сбор и хранение информации; поиск и выдача информации пользователю. Движение информации в таких системах осуществляется по замкнутому контуру от источника к потребителю информации. При этом ИПС или ИСС выступает лишь как средство ускорения поиска необходимых данных. Наиболее сложным процессом с точки зрения его реализации выступает поиск необходимой информации, который осуществляется в соответствии со специально издаваемым поисковым образом документа (ПОД), текста и т. п. При этом важнейшими требованиями, которые должны быть обеспечены в процессе поиска, являются требование соответствия найденного текста или документа фактической информационной потребности потребителя, и требование смысловой и формальной соответствия одного текста .(документа) другому. Для оценки смысловой соответственности вводятся критерии смыслового соответствия, а для оценки соответствия поисковых признаков (формального соответствия) - критерии формального соответствия текстов, по которым осуществляется сравнение ПОД и определение соответствия найденных текстов запросам пользователей.
В зависимости от режима организации поиска ИПС и ИСС могут быть разделены на документальные, библиографические, библиотечные, фактографические. Документальными называют информационно-поисковые системы, в которых реализуется поиск в информационном фонде ИПС документов или текстов в соответствии с полученным запросом с последующим предоставлением пользователю этих документов или их копий. Вся обработка полученной информации в документальных ИПС осуществляется самим пользователем. В зависимости от того, по каким хранимым документам или по их описаниям (вторичным документам) осуществляется поиск, документальные ИПС часто делят на системы с библиотечным или системы с библиографическим поиском. В первом случае поиск ведется в информационном фонде, содержащем первичные документы, во втором - в информационном фонде вторичных документов. Заметим, что наибольшее практическое значение имеют документальные ИПС, поиск в которых организован по двум контурам: библиографическому, с определением основных характеристик первичного документа и предоставлением пользователю возможности оценить, может ли данный документ удовлетворить его информационные потребности, и библиотечному, когда в информационном фонде осуществляется нахождение требуемого документа с последующей его (или копии) выдачей пользователю.
Фактографические информационно-поисковые системы реализуют поиск и выдачу фактов, текстов, документов, содержащих сведения, которые могут удовлетворить поступивший запрос пользователя. В этом случае осуществляется поиск не какого-то конкретного документа, а всей совокупности сведений по данному запросу, хранящихся в информационном фонде ИПС или ИСС. Отметим, что основным отличием фактографических информационно-поисковых систем от документальных является то, что эти системы выдают пользователю не какой-либо ранее введенный документ, а уже в той или иной степени обработанную информацию.
В зависимости от того, как в фактографической ИПС реализована подобная обработка информации, различают три поколения таких систем. ИС первого поколения обеспечивают накопление и поиск информации по одному типу объектов и реализуют один тип запросов при использовании для фактографического описания данных фиксированного формата. В фактографических системах второго поколения возможен уже выбор типа запроса из представленного набора. Отображаемые объекты могут принадлежать к различным классам, формат фактографического описания задается для класса объектов. В фактографических ИПС третьего поколения, которые являются, по сути дела, разновидностью рассматриваемых ниже интеллектуальных диалоговых систем, реализуется поиск информации по нерегламентированному перечню запросов, поисковый образ задается пользователем в произвольной форме, предусматриваются операции синтеза информации для удовлетворения запросов пользователей, имеется специальный аппарат анализа вновь вводимой информации на смысловую и формальную релевантности хранящимся в информационном фонде данным.
Еще одним признаком классификации ИПС и ИСС может выступать реализуемый режим распространения информации. По этому признаку различают: системы с режимом избирательного распространения информации (ИРИ), обеспечивающим организацию периодического (раз в неделю, раз в месяц, раз в квартал и т. п.) поиска информации в соответствии с заданным ПОД в массиве новых поступлений в информационный фонд ИПС и предоставление пользователям сообщений о появлении таких документов; системы с режимом ретроспективного поиска (РП), реализующим поиск информации по заданным ПОД во всем информационном фонде ИПС или ИСС; интегральные системы, в которых реализованы как ИРИ -режим, так и РП -режим. Достигнутые в течение последнего десятилетия результаты развития средств вычислительной техники методов проектирования программного и информационного обеспечения систем автоматизации различного уровня и назначения способствовали существенному пересмотру принятых ранее подходов к созданию информационных систем, и, прежде всего, к созданию новой информационной технологии, основными принципами которой являются:
1. Обеспечение общения конечного пользователя (исследователя, проектировщика, конструктора, технолога, оператора ИПК и ГАП, плановика) с системой автоматизации на профессионально-ограниченном естественном языке, представление входной и результирующей информации в привычной и удобной пользователю форме.
2. Обеспечение возможности решения задач планирования, управления, проектирования, подготовки производства и научных исследований по их постановкам и исходным данным независимо от сложности и наличия формальных математических моделей этих задач.
3. Создание конечному пользователю таких условий работы, при которых он осуществляет процессы управления, планирования, проектирования и поиска новых решений в режиме активного, расширяющегося диалога с ЭВМ, оперируя понятиями своей предметной области, используя профессиональный опыт и навыки и принимая решения одновременно по множеству критериев, часть из которых не описана формально и не имеет количественного выражения.
Системы, построенные на принципах новой информационной технологии, можно разделить на три основных класса: интеллектуальные диалоговые (вопросно-ответные); расчетно-логические или системы поддержки принятия решений; экспертные системы. Необходимо отметить, что в настоящее время построение систем всех перечисленных классов представляет весьма сложный и трудоемкий процесс, реализация которого затруднена недостаточной проработкой ряда вопросов представления и хранения знаний, создания лингвистических процессоров и средств логического вывода. Поэтому на первых этапах создания экспертных систем и систем поддержки принятия решений (для решений различных задач проектирования, организационного управления и т.п.) рациональнее ориентироваться на создание систем информационной поддержки (СИП). В этом случае под СИП понимается информационная система, обеспечивающая эффективную организацию и предоставление пользователям необходимой для принятия решений информации. При таком процесс проектирования системы информационной поддержки целесообразно организовать по схеме, предложенной в работе для проектирования баз данных, расширив и модифицировав ее в соответствии с требованиями эффективного взаимодействия пользователя и системы. При таком подходе процесс проектирования СИП реализуется в две стадии: концептуальное проектирование и проектирование реализации. Проведение работ на стадии концептуального проектирования предшествует выбору вычислительного оборудования и осуществляется практически независимо от его результатов. При этом должна учитываться лишь принятая концепция построения аппаратного обеспечения. Результаты реализации этой стадии определяют важнейшие требования к характеристикам и типам используемого в системе информационной поддержки электронно-вычислительного оборудования.
Стадия проектирования реализации начинается после выбора аппаратного обеспечения, поэтому все работы по проектированию СИП ориентированы здесь на конкретный тип вычислительного оборудования.
БИЛЕТ 11
Структуризация данных базируется на использовании концепций типа «агрегация» и «обобщение». Например, в файловых системах, которые реализуют модель типа «плоский файл» с понятийным базисом из четырех основных типов логических структур данных: а) поле -наименьшая поименованная единица данных; б) запись -поименованная совокупность полей; в) файл -поименованная совокупность экземпляров записей одного типа; г) набор файлов или библиотека -поименованная совокупность файлов обрабатываемых в системе. Агрегация используется для композиции полей в запись, а обобщение -для представления множества экземпляров записей одного типа одной общей структурой более высокого уровня -файлом. В ряде систем допускается объединение в файл экземпляров записей нескольких заданных типов. Обобщение также используется для выборки из файла прикладной программой некоторого подмножества экземпляров записей, удовлетворяющих заданному критерию выборки. Существует большое количество терминов, используемых для значения определенных типов структур данных. Широко распространена терминология, предложенная КОДАСИЛ- Ассоциация по языкам систем обработки данных
Элемент данных - наименьшая поименованная единица данных (аналог поля в файловых системах). Элемент данных -это минимальная единица данных, к которой СУБД может адресоваться непосредственно и с помощью которой выполняется по строение всех остальных структур. Элементы данных обычно не пользуются для представления отдельных элементарных свойств объектов, например ТАБЕЛЬНЫЙ-НОМЕР, ШИФР-ДЕТАЛИ ГОД-РОЖДЕНИЯ и т. п.
Имя элемента данных используется для его идентификации в схеме структуры данного более высокого уровня. Значение элемента данных может быть числового (целый, вещественный) и нечислового (символьный, логический) типа. В некоторых приложениях используется «неопределенное» значение элемента данных, свидетельствующее о том, что значение соответствующего свойства объекта еще не введено в БД, а ряд других свойств, описывающих объект, уже представлены значениями.
Агрегат данных - поименованная совокупность элементов данных внутри записи, которую можно рассматривать как единое целое. Имя агрегата используется для его идентификации в схеме структуры данного более высокого уровня. Агрегат данных может быть простым, если состоит только из элементов данных, и составным, если включает в свой состав другие агрегаты. Пример простого агрегата данных -агрегат данных ДАТА, который состоит из элементов данных ЧИСЛО, МЕСЯЦ, ГОД. Пример составного агрегата данных -агрегат ПРЕДПРИЯТИЕ, который состоит из элементов данных - НАЗВАНИЕ ПРЕДПРИЯТИЯ, АДРЕС ПРЕДПРИЯТИЯ (ПОЧТОВЫЙ ИНДЕКС, ГОРОД, УЛИЦА И № ДОМА).
Различают агрегаты типа «вектор» и типа «повторяющаяся группа» Агрегат, повторяющаяся компонента которого является простым элементом данных, называется вектором.. Например, агрегат ЗАРАБОТНАЯ-ПЛАТА, в котором экземпляр элемента данных может повториться до 12 раз (за каждый месяц года). Агрегат, повторяющаяся компонента которого представлена совокупностью данных, называется повторяющейся группой. В повторяющуюся группу могут входить отдельные элементы данных, векторы, агрегаты или другие повторяющиеся группы. Например, агрегат ЗАКАЗ-НА-ПОКУПКУ имеет в своем составе повторяющуюся группу ПАРТИЯ-ТОВАРА. Максимальное количество экземпляров для вектора и для повторяющейся группы ограничено и задается при спецификации схемы записи.
Запись - поименованная совокупность элементов данных или элементов данных и агрегатов. Имя записи используется для идентификации типа записи в схемах типов структур более высокого уровня. Запись -это агрегат, не входящий в состав никакого другого агрегата. Запись может иметь сложную иерархическую структуру, поскольку допускается многократное применение агрегации.
Процесс, обратный агрегации данных, называется пошаговой детализацией данных и широко применяется при программировании с целью выделения требуемого данного из агрегированного.
Набор- поименованная совокупность записей, образующих двухуровневую иерархическую структуру. Этот термин не является аналогом набора файлов. Каждый тип набора представляет собой отношение (связь) между двумя или несколькими типами записей. Для каждого типа набора один тип записи может быть объявлен «владельцем», тогда остальные типы записей -его «члены», т. е. различают «запись-владелец» и «запись-член» набора. Каждый экземпляр набора должен содержать один экземпляр записи, имеющий тип «запись-владелец», и может содержать любое количество экземпляров записей типа «запись-член».
Основное назначение набора -представление связей между записями. Если запись используется для представления сущности, то набор -для представления связей между рассматриваемыми сущностями, представленными записями, входящими в набор. В схеме набора задаются типы составляющих его записей, определяется тип записи владельца и типы записей членов, присваивается имя набору.
База данных - поименованная совокупность экземпляров записей различного типа, содержащая ссылки между записями, представленные экземплярами наборов. Описание структуры БД задается ее схемой. Однако не во всех СУБД используется Рассмотренная терминология. Многообразие систем управления базами данных и пестрота употребляемых в них терминов для обозначения поддерживаемых системой структур данных создают трудности при сравнении моделей данных конкретных СУБД. Поэтому при рассмотрении МД целесообразно использовать терминологию, включающую следующий понятный базис: элемент данных, группа, групповое отношение, база данных.
Элемент данных соответствует определению, приведенному в терминологии КОДАСИЛ.
Понятие группа одновременно соответствует и понятию «агрегат» и понятию «запись». Группа -это поименованная совокупность элементов данных или элементов и других групп. Различают группы: простую и составную, повторяющуюся и неповторяющуюся. Схема составной группы, в которую входит повторяющаяся группа, предусматривает включение некоторого числа реализации (экземпляров) этой повторяющейся группы.
Групповое отношение используется для задания связей между группами в базе данных. Групповое отношение определяется как поименованное бинарное отношение, заданное на двух множествах экземпляров рассматриваемых групп. Тип группового отношения задается между двумя типами групп. По характеру бинарных связей между экземплярами рассматриваемых групп (например, типа А и типа В) различают групповые отношения вида: 1:1, 1:М; М:1; М:N. Пары чисел 1:1, 1:М; М:1; М:N называют коэффициентами группового отношения. Групповые отношения вида 1:1, 1:М; М:1 иногда еще называют функциональными (во втором случае функцией является обратное отношение). В групповом отношении один тип группы назначается владельцем отношения, а другой -членом отношения. Экземпляр группового отношения представлен одним экземпляром группы типа группа -владелец и совокупностью связанных с ним экземпляров групп- членов.
База данных - поименованная совокупность экземпляров групп и групповых отношений. В схеме БД задаются типы групп и групповых отношений.
Рассмотренные типы структур позволяют использовать различные формы представления схемы данных, включая обычное представление в виде исходного текста на ЯОД. При графовой форме представления агрегаты атрибутов, обычно используемые для представления сущностей, изображаются вершинами графа, а связи между ними -соответствующими дугами. Графовая форма представления схемы БД облегчает пользователям понимание и интерпретацию данных. Для построения графической диаграммы в терминах групп и групповых отношений используются следующие соглашения. Тип группы изображается прямоугольником, над левым верхним углом, которого указывается имя группы. Внутри прямоугольника можно указывать имена элементов данных, агрегированных в группу. Групповые отношения обозначаются стрелками от группы-владельца к группе-члену с указанием имени отношения и коэффициента.
Конкретный экземпляр группы может быть идентифицирован в базе данных независимо либо по его связям с экземплярами других типов групп в групповых отношениях. При независимой идентификации для конкретного экземпляра типа группы определяется неизбыточная совокупность элементов данных, выступающая в качестве первичного ключа -внутреннего индикатора группы. На графической диаграмме эта совокупность элементов обычно подчеркивается, а тип группы с внутренней идентификацией помечается особым знаком.
Другая форма представления схемы данных, удобная для пользователя с точки зрения понимания и интерпретации, - табличная. С таблицами люди привыкли работать давно, поэтому они нашли применение в системах обработки данных.
Рассматривая таблицу как совокупное описание экземпляров сущности некоторого типа или как совокупное описание экземпляров связи некоторого типа между сущностями, при определенных допущениях можно использовать математическое понятие отношения для формального описания таблицы, что и было использовано при разработке реляционной модели данных. Сущность представляется агрегатом атрибутов, а связь -агрегатом идентифицирующих атрибутов сущностей, между которыми она рассматривается.
Используя столбцы таблицы для задания атрибутов и представляя экземпляр сущности агрегатом значений соответствующих атрибутов, а экземпляр связи -агрегатом значений идентифицирующих атрибутов сущностей, между которыми эта связь рассматривается, получим строку соответствующей таблицы. В реляционной модели данных столбец таблицы интерпретируется атрибутом, строка -кортежем, а сама таблица отношением. Шапка таблицы может выступать в качестве наглядного средства представления схемы отношения.
В качестве аналогов таблиц и их элементов при машинной обработке могут выступать файлы, записи и поля.
БИЛЕТ 13
Каждая представляемая информацией сущность (объект, явление) имеет ряд характерных для нее свойств (черт, признаков, параметров, характеристик, моментов). Например, свойствами материала являются его вес, габариты, сорт, цена, номенклатурный номер и др. Свойствами-признаками, характеризующими такую сущность, как организация-покупатель, представляются его наименование, ведомственная принадлежность, адрес, номер расчетного счета и др. Свойства физической сущности отображаются с помощью переменных величин, являющихся элементарными единицами информации - реквизитами.
Реквизит - это логически неделимый элемент любой сложной информационной совокупности, соотносимый с определенным свойством отображаемого информацией объекта или процесса. Из реквизитов компонуются все остальные, более сложные информационные конструкции. Единицы информации любой сложности можно последовательным разложением на составляющие компоненты (декомпозицией) расчленить до таких составляющих - переменных величин, которые не поддаются дальнейшему логическому разбиению, т. е. реквизитов. Дальнейшее членение реквизита на более мелкие составляющие - символы (символы в свою очередь - на биты, биты - на последовательность электронных импульсов и т. д.) разрывает его привязку к определенному свойству объекта (процесса), нарушает информативность.
Реквизит обладает некоторой самостоятельностью и имеет особые характерные для него черты. Так, он может входить в самые разнообразные составные единицы информации, относящиеся к различным сущностям и имеющие различную сложность, так же, как какое-либо слово может входить в состав самых различных предложений.
Это свойство реквизита находит свое отображение в его форме, всесторонне характеризующей реквизит вне зависимости от его конкретного вхождения в ту или иную составную единицу информации.
Форма реквизита включает его наименование, структуру (формат), значение или совокупность значений и некоторые другие свойства.
Наименование реквизита (имя) служит для обращения к нему и обычно представляется словом или группой слов (например, «табельный номер рабочего»), названием определенной графы (строки) входного или выходного документа, номером, условным кодом, адресом на носителе (перфокартах, магнитной ленте, диске) или в памяти ЭВМ. При алгоритмизации и программировании с целью компактного написания чаще используют сокращенные имена - идентификаторы. Идентификаторы обычно имеют ограничения на длину, используемый алфавит и сферу действия. В некоторых случаях допускается также употребление синонимов наименований реквизита.
Целесообразно, чтобы основное имя - идентификатор реквизита - было закреплено за ним вне зависимости от того, используется ли этот реквизит в той или иной составной единице информации, в той или другой подсистеме. В этом случае обеспечивается ряд преимуществ при создании баз данных и совместимости различных информационных систем.
Точность же обращения к конкретному реквизиту достигается применением уточняющих указателей.
Каждому реквизиту присуще некоторое множество значений в зависимости от характеристик того свойства объекта (явления), которое информационно отображает данный реквизит. Это множество будем называть областью определения реквизита, или классом значений. Область определения, например, для параметра «температура больного» одна, для признака «пол больного» - другая, для реквизита «код цеха» - третья.
Таким образом, значение реквизита является одним из элементов множества значений области определения данного реквизита, отображающей соответствующее состояние (из множества состояний) того свойства объекта (явления), которое характеризует реквизит. Так, текущим значением реквизита «температура больного» может быть «37,40», а реквизита «пол больного» - «мужской». Другими словами, значение реквизита используется для представления значения соответствующего свойства сущности.
Выбор формы представления значений некоторого свойства сущности прямо зависит от его природы и по возможности должен в максимальной мере способствовать приближению информационного отображения к естественной характеристике свойства. Так, свойству «вес груза» наиболее соответствует числовое представление определенного реквизита (в установленных единицах измерения и с заданной точностью), свойству «тип упаковки» - словесное описание, а утверждение о предъявлении документов к оплате - логическое значение истинности или ложности.
Структурой реквизита называется способ представления его значений. В структуре различают длину, тип и формат реквизита.
Длина реквизита есть число символов, которые образуют его значение. Длина реквизита может быть постоянной или переменной. Например, значение реквизита «код цеха», как правило, является двузначным, значение реквизита «количество сданных да склад деталей» может занимать от одной до семи позиций, значение реквизита «потребность некоторого материала на годовую программу предприятия» может занимать от одной до шести позиций до запятой, отделяющей дробную часть от целой, и от одной до пяти позиций после запятой, значение реквизита «наименование материала» может занимать до 120 позиций.
Типы реквизитов зависят от видов значений. Наиболее распространены числовой, текстовой и логический типы.
Реквизиты числового типа характеризуют количественные свойства сущностей, полученные в результате подсчета натуральных единиц, измерения, взвешивания, вычисления на основе других количественно-суммовых данными т. п. Значениями таких реквизитов являются числа.
Выделяется несколько типов числовых величин в зависимости от класса чисел, системы счисления, фиксации десятичной запятой, упаковки и других характеристик; накладываются ограничения на диапазон чисел, форматы их представления при вводе-выводе и на различных носителях даже в рамках одной реализации. Реквизиты числового типа активно используются в различных арифметических преобразованиях, а большинство из них создается в результате таких преобразований.
Особую роль играют реквизиты числового типа, принимающие только целочисленные значения. Такие реквизиты могут выступать в качестве реквизитов - признаков.
Реквизиты текстового типа выражают, как правило, качественные свойства сущностей и характеризуют обстоятельства, при которых имел место изучаемый процесс и были получены те или иные числовые значения. Такие реквизиты называются признаками.
Реквизиты текстового типа могут использоваться в качестве операндов в арифметических и логических выражениях. Более того, значения таких реквизитов могут быть получены в результате арифметических или логических преобразований .
Специальными свойствами реквизитов являются признаки редактирования и преобразования, замок защиты, индикация наличия значения или множества значений, даты изменения значений и др.
Реквизиты логического типа принимают только два значения: истинность или ложность. Используются они в логических выражениях.
Будем считать, что над реквизитами определены арифметические и логические операции, понимаемые в обычном математическом смысле, текстовые операции и операции отношения как операции реляционной алгебры.
Значениями реквизитов являются последовательности символов (букв, цифр, различных знаков и специальных обозначений), называемые строками или текстом.
Каждый из наблюдаемых объектов, процессов характеризуется рядом присущих ему свойств. Но точно так же, как взятое в отдельности любое свойство еще не представляет сущность (объект, процесс) в целом, так и изолированно взятый тот или иной реквизит, характеризующий своим значением одно из свойств сущности, не может представлять законченного сообщения о наблюдаемом объекте (процессе). Требуется некоторая взаимосвязанная совокупность реквизитов для того, чтобы воспроизвести некоторое сообщение о сущности, определенную информацию о явлении.
Реквизитом-признаком называется такой реквизит, значение которого определяет некоторое обстоятельство действия (место действия, действующих лиц, предметы и продукты труда, время и др.).
Реквизит-основание - это такой реквизит, значение которого определяет некоторую меру действия (количество или стоимость предметов и продуктов труда, норму выработки или времени и др.).
Чаще реквизит-основание является реквизитом числового типа (иногда его называют количественным).
Каждый реквизит в сообщении имеет лишь одно значение (строку или число). Однако поскольку одна и та же сущность (допустим, факт отпуска изделий покупателям) фиксируется многократно с возникновением каждый раз нового сообщения, значения любого реквизита Rj меняются в зависимости от обстоятельств.
БИЛЕТ 15
Поскольку в экономике документ служит основным средством регистрации отдельных фактов хозяйственной деятельности, основным способом определения характера экономической информации является анализ содержания и структуры документов.
В частности, содержание всех документов предприятия в совокупности фактически отображает всю его деятельность в том виде, в каком она была зафиксирована и зарегистрирована управленческим аппаратом, в каком весь трудовой процесс был представлен в результате определенных экономических обобщений и оперирования первоначальными данными.
Многочисленные факты и операции хозяйственной жизни предприятия отражаются документами. Варианты регистрации могут быть самыми разнообразными в зависимости от объема и характера производства, количества рабочих, производственной структуры предприятия, формы бухгалтерского учета и методики планирования, технической оснащенности управленческого аппарата, методов исчисления готовой продукции и т. д.
Характер документирования каждой отдельной хозяйственной операции зависит от конкретных особенностей и условий ее осуществления и в связи с этим оформление одной и той же операции не одинаково для разных предприятий и организаций. Поэтому и количество форм документов, в которых регистрируется на предприятиях даже однотипное явление (например, расход материалов на производство), имеет много разновидностей. Так, существующие на предприятиях формы лимитной карты отличаются наличием или отсутствием некоторых реквизитов, их расположением и пр. Форма одного и того же наименования и назначения может быть в одном случае чрезвычайно сложной, в другом - простой.
Форму документа можно условно разбить на три части: общую, предметную и оформительную (подписи).
БИЛЕТ 16
Любые процессы жизни человеческого общества - производственные, хозяйственные, научно-исследовательские, демографические, общественно-политические и т. п. - находят отображение в информационных процессах.
Существующие определения понятия «информация» после тщательного анализа обычно признаются неудовлетворительными. Чаще всего они рассматривают информацию в сравнительно узком контексте. Попытки дать более широкое определение содержат элементы неясности. Поэтому вряд ли возможно сформулировать одно точное определение информации. Довольно распространенным является взгляд на информацию как на ресурс, аналогичный материальным, трудовым, денежным и т. п. ресурсам. Эта точка зрения отражается в следующем определении: информация - это новые сведения, позволяющие улучшить материальные процессы, связанные с преобразованием вещества, энергии и самой информации.
Информация неотделима от процесса информирования, поэтому необходимо рассматривать источник информации и потребителей информации. Роль потребителей информации очерчивается в следующем определении: информация - новые сведения, принятые, понятые и оцененные как полезные конечным потребителем.
Информация на пути от источника к потребителю проходит через ряд преобразователей: несколько кодирующих и декодирующих устройств, переносящих знаки с одного носителя на другой; ЭВМ, обрабатывающую информацию по определенному алгоритму, и т. д. На промежуточных стадиях преобразования смысловые свойства сообщений отступают на второй план, поэтому понятие «информация» заменяется на менее ограничительное понятие «данные».
Данные представляют собой набор утверждений, фактов и/или цифр, взаимосвязанных между собой. В тех случаях, когда различие между информацией и данными не нужно подчеркивать, они употребляются как синонимы.
Под информационным пространством некоторого объекта или множества объектов будем понимать совокупность всех информационных компонентов этого объекта или множества объектов независимо от способов и средств отображения этих компонентов.
Информационное пространство неоднородно. Оно содержит устные и письменные сообщения, в том числе организационном - распорядительскую документацию, отчеты о научно-исследовательских работах, экономическую, техническую и конструкторскую документацию и др., сообщения на машинных носителях (перфокартах, перфолентах, магнитных лентах, магнитных дисках и др.), а также такие виды представления информации, как звуковые, -электромагнитные и др.
Одна из важнейших характеристик информационного пространства - степень его структурированности.
Под структурированностью понимается такое свойство информационного пространства, при котором все содержание и особенности этого пространства представляются его компонентами и взаимосвязями между ними, выраженными в явном виде.
Между структурированностью информационного пространства и энтропией можно провести аналогию. Энтропия - это некоторая мера неупорядоченности в информации; чем больше энтропия, тем меньше упорядоченность информации. В структурированности информационного пространства обратная зависимость - чем больше структурированность информационного пространства, тем больше его упорядоченность. Тем не менее аналогия между энтропией и структурированностью информационного пространства достаточно глубока и позволяет переносить некоторые закономерности определения и изучения энтропии на структурированность информационного пространства.
Обработка информации на электронной вычислительной машине определяет необходимость представления ее в структурированном виде. Если в качестве меры структурированности информационного пространства принять отношение объема структурированной информации к объему всей информации в рассматриваемом пространстве, то степень структурированности информации, обрабатываемой на электронной вычислительной машине (при условии, что эта информация представляет собой рассматриваемое информационное пространство), наибольшая.
В любой системе машинной обработки экономической информации (СМОЭИ) все входные и выходные документы, все промежуточные и внутримашинные представления информации структурированы. Следовательно, для такого информационного пространства коэффициент структурированности равен или близок к максимальному значению.
В зависимости от степени структурированности информационного пространства выделим следующие пять его видов.
1. Неструктурированное информационное пространство (НИП). Для НИП характерно, что структурированность компонентов информации встречается редко. Примерами НИП являются разговорная речь или информация, которой обмениваются между собой дельфины. Некоторые элементы структурированности в этом подклассе могут присутствовать.
2. Слабо структурированное информационное пространство (ССИП) - полностью структурированы только отдельные компоненты. Типичным примером ССИП может служить письменный язык. Структурированность основного объема информации состоит в выполнении требований некоторого синтаксиса. Как правило, такие требования неоднозначны, противоречивы, имеют исключения, сохраняют омонимию и синонимию и т. п.
3. Структурированное информационное пространство (СИП) - характеризуется существенным преобладанием структурированных компонентов. В СИП информация документирована, широко используется кодирование для обеспечения однозначности трактовки тех или иных понятий. Типичный пример СИП - экономическая информационная система (ЭИС), представляющая собой часть информационного пространства, которая отображает деятельность некоторого экономического объекта.
4. Формализованно - структурированное информационное пространство (ФСИП)- для него должно существовать в явном виде такое описание информационных образований, в котором определены не только информационные структуры и связи, но и алгоритмы получения значений любого элемента данных.
Основное назначение формализованного структурированного информационного пространства в том, что представленные в явном виде описания информационных образований должны обеспечивать:
порождение (на основе формальных правил) не только блоков логико-алгебраических преобразований, но и любых операций по управлению данными (сортировка, подборка, вызов, размещение и др.);
возможность выбора оптимальной структуры экономической информационной системы в соответствии с выбранной целевой функцией;
возможность реорганизации как структур, так и алгоритмов обработки информации в процессе функционирования системы на основе обработки статистических данных и накапливаемых изменений об объекте.
5. Машинно - структурированное информационное пространство (МСИП) - формализовано описаны все информационные образования, в том числе формы входных и выходных документов, запросы конечных пользователей. Типичным примером МСИП является база данных в системе машинной обработки экономической информации. Все процессы преобразования информации в таком пространстве формализованы и представлены в виде машинных программ. Некоторые неструктурированные элементы используются при организации взаимодействия конечных пользователей и вычислительной системы на естественном (или близком к естественному) языке.
Изучение закономерностей построения и методов анализа структурированного, в том числе формализовано - и машинно -структурированных видов, информационного пространства объектов экономического характера, изучение абстрактно-теоретических положений и средств, обеспечивающих переход от одного вида информационного пространства к другому, и является основой учебного курса «Теория экономических информационных систем».
Процесс создания проекта системы машинной обработки данных для некоторого объекта можно представить в виде последовательного перехода от первичного описания этого объекта (некоторой информационной модели) через промежуточные модели, такие, как машинная и программно-алгоритмическая модели, к проекту системы машинной обработки данных (модель обработки данных).
Одно из свойств последовательности моделей - соблюдение семантического единства, семантическая совместимость моделей снизу вверх. Предыдущая модель связана с последующей в смысловом плане. Все сведения, имеющиеся в предыдущей модели, сохраняются в последующей. При этом последующая модель пополняется новыми (производными) сведениями, новыми информационными взаимосвязями, которых не было в предыдущей модели, за счет применения нового уровня обобщения, новых преобразований.
Другое свойство этой последовательности моделей - конструктивная полнота, заключающаяся в том, что должна обеспечиваться полнота сведений, достаточная для последующих формализованных преобразований от первичного описания экономического объекта до модели обработки данных .
Переход от предыдущей модели к последующей обеспечивается применением некоторых преобразователей. Выделим два типа преобразователей. Одни преобразователи обеспечивают собственно переход от одной модели к другой, другие позволяют анализировать синтаксическую и семантическую непротиворечивость модели, ее полноту, корректность и адекватность реальным условиям объекта управления.
На первом этапе создания последовательности моделей -информационной модели объекта используются преобразователи первого типа- организация и корректировка информационной модели и второго типа - анализ информационной модели.
На втором этапе - создании машинной модели, по существу, являющемся машинной интерпретацией информационной модели, используются преобразователи первого типа - преобразование информационной модели в машинную и ведение и корректировка машинной модели и второго типа - синтаксический и семантический анализ машинной модели .
Третий этап - программно-алгоритмическая модель, включающая средства управления данными и структуру базы данных. На этом этапе используются преобразователи первого типа - преобразование машинной модели в программно-алгоритмическую и второго типа - анализ программно-алгоритмической модели.
На четвертом этапе - создании модели обработки данных, по существу, представляющем собой проект системы машинной обработки данных, используются преобразователи первого типа - преобразование программно-алгоритмической модели в модель обработки данных и второго типа - документирование модели обработки данных, сопровождение модели обработки данных, модернизация модели обработки данных.
В различных представлениях информации можно выделить несколько уровней единиц информации. Им соответствуют некоторые последовательности символов, для которых существует семантическая интерпретация. Выделяют следующие единицы информации (в порядке возрастания синтаксической сложности); реквизит, показатель, составная единица информации, база данных.
Реквизит является информационным отображением отдельного свойства объекта или процесса реального мира. Составная единица информации представляет собой информационное отображение объекта или процесса в целом или их части. Показатель - это лишь одна из разновидностей составной единицы информации, минимальная по информационному содержанию, но достаточная для образования документа.
Базой данных называется единица информации, задающая информационное отображение множества разнородных взаимодействующих объектов реального мира.
Каждая единица информации характеризуется именем, структурой, значением, методами организации значений и допустимыми операциями над именем, структурой и значениями.
Имя единицы информации - это ее уникальное наименование в процессах обработки информации. Под структурой единицы информации понимается ее реквизитный состав с учетом иерархического вхождения в нее единиц информации более низкого уровня. Структурой реквизита считается описание формата, т. е. указание множества допустимых символов в каждой позиции значения. Множество значений единицы информации может быть объявлено и организовано в памяти ЭВМ различными способами. Точное описание множества значений и всех взаимосвязей, которые поддерживаются между его элементами, называется методом организации значений.
Допустимыми операциями над именем единицы информации являются открытие и закрытие имени, объявление синонимов для данного имени и др. Операции над структурой единицы информации - композиция и декомпозиция. В процессе композиции различные по структуре единицы информации объединяются, получая новое имя, новую структуру и новое множество значений. Для вычисления структуры и множества значений результата должен существовать алгоритм, который в качестве входной информации использует структуру и значения исходных единиц информации. Декомпозиция представляет собой операцию разъединения единицы информации на не совпадающие по структуре части.
Операции над значениями единиц информации очень разнообразны и рассматриваются в последующих разделах учебника.
Сведения об имени, структуре, множестве значений и допустимых операциях над единицей информации образуют ее модель. Чаще всего речь идет о модели базы данных, называемой моделью данных. Единицы информации и их модели представляют собой важный инструмент анализа и проектирования экономических информационных систем.
БИЛЕТ 17
Развитие теории и практики проектирования и эксплуатации баз данных сопровождается интенсивным развитием моделей данных (МД). Ранее рассматривались модели предметной области.
Каждая ЭВМ обладает относительно простой, но хорошо определенной моделью данных -это допустимые в ЭВМ форматы данных и состав операций, выполняемых над ними. С помощью исходной МД можно построить более сложные модели данных, т. е. выполнить переход к некоторой абстрактной машине, обладающей более удобной МД для представления исходных данных и решения прикладных задач.
Примерами абстрактных машин являются интерпретаторы (или трансляторы) с алгоритмических языков программирования высокого уровня. Каждый язык программирования высокого уровня имеет свою модель данных, которая не зависима от машинной реализации и спроектирована для улучшения моделирования определенных видов реальных ситуаций или для удобства выполнения определенных видов вычислений и представления соответствующих типов исходных, промежуточных и выходных данных в программах (для вычислительных языков). Все операторы любого алгоритмического языка можно разбить на две основные группы: декларативного типа (используемые писания данных) и процедурного типа (используемые для описания последовательности операций, которые должны быть выполнены над описанными данными). Множество допустимых состояний исходных, промежуточных и выходных данных в программе, написанной на некотором алгоритмическом языке, определяется описанием данных, задаваемым операторами декларативного типа. Изменение состояния данных в программе достигается средствами процедурных операторов языка программирования. Таким образом, совокупность операторов декларативного и процедурного типа некоторого алгоритмического языка определяет МД языка, понимаемую как совокупность методов и средств, как некоторый формализм для определения логических структур данных и процессов, динамического изменения их состояния с целью моделирования некоторых реальных процессов или явлений. Эти структуры называют логическими, чтобы отличить их основных структур модели данных ЭВМ, называемых физическими структурами данных, на которых эти логические структуры данных основываются. Пользователь, работающий с некоторым алгоритмическим языком, должен хорошо понимать и разбираться в логических структурах данных используемого языка. Физические структуры данных пользователь может и не знать, поскольку непосредственно с ними не работает.
Модель данных алгоритмического языка, определяемая совокупностью его операторов декларативного и процедурного типа, формализовано описывает все множество допустимых логических структур данных, которые могут принять, обработать и выдать программы, составленные на этом алгоритмическом языке. Совокупность конкретных логических структур данных любой конкретной программы, написанной на этом языке, представляет собой подмножество этого множества. Однако охарактеризовать это множество, перечислив все его элементы -возможные логические структуры данных, невозможно. Поэтому модель данных, поддерживаемую некоторым языком программирования, обычно характеризуют следующим образом:
-
идентифицируют типы логических структур данных, которые можно представить в МД. Две структуры следует рассматривать как структуры различного типа, если они имеют различные признаки, правила композиции или правила их обработки (правила манипулирования) процедурными операторами;
-
специфицируют: признаки (характеристики) структур данного типа, правила композиции (составления) структур данного типа из логических структур других типов; правила обработки структур данного типа процедурными операторами.
Все это полностью относится и к МД любой программной системы обработки данных и, в частности, к МД поддерживаемой конкретной СУБД. С позиций прикладного программиста можно рассматривать СУБД как некоторый алгоритмический язык, на котором программируются подлежащие решению задачи. Отличие от алгоритмического языка заключается в том, что операторы описания и процедурные операторы разделены и оформлены в виде самостоятельных языков: языка описания данных и языка манипулирования данными. Однако в логическом плане это не меняет ситуации, поэтому совокупность операторов ЯОД и ЯМД определяет модель данных, поддерживаемую конкретной рассматриваемой СУБД и понимаемую как совокупность структур данных и операций над этими структурами, для определения логической структуры БД и динамического моделирования состояний ПО.
Дополнительно к структурам данных СУБД обеспечивает построения, называемые схемой данных. Схемой структуры данных называется описание структуры данных некоторого типа на формализованном языке. Схема задает совокупность свойств, присущих данному типу структуры данных. Реализацией схемы является конкретная структура данных соответствующего типа. Каждая конкретная реализация называется экземпляром схемы.
Схема структуры данных описывает те свойства структуры, которые не изменяются в течении выполнения прикладных программ и которые можно объявить заранее, до выполнения программ. Эти свойства называют статическими свойствами данных. Система имеет возможность выполнять предварительную проверку корректности структур, которые будут в дальнейшем созданы в БД. Правила композиции схемы структуры данных и правила генерации (формирования) экземпляра схемы в БД определяются ЯОД СУБД.
Построение структур данных в каждой конкретной МД не может выполняться произвольным образом, а только по определенным правилам. Это связано с ограничениями, вытекающими из особенностей используемых в модели типов структур данных и операций, которые можно выполнять над этими структурами. Поэтому в качестве основных компонентов модели данных рассматривают: структуры данных, операции над данными, ограничения. Основные компоненты модели данных тесно взаимосвязаны между собой и в различных конкретных моделях могут быть реализованы различными способами.
БИЛЕТ 18
Модель типа «сущность - связь» - это неформальная модель предметной 'области, которая используется на этапе инфологического проектирования базы данных. Эта модель позволяет моделировать объекты ПО, взаимоотношения объектов. Относительная простота, применение естественного языка и легкость понимания позволяют использовать модель как инструмент для общения с будущими пользователями для сбора информации о предметной области для проектирования БД.
Основное назначение неформальной модели «сущность - связь»-семантическое описание предметной области и представление информации для обоснования выбора видов моделей и структур данных, которые в дальнейшем будут использованы в системе.
Существует несколько подходов к построению моделей типа «сущность - связь». Общим для всех подходов является использование трех основных конструктивных элементов для представления составляющих ПО -сущность, атрибут и связь. Информация о проекте объединяется с помощью графических диаграмм. Составляющая «время» в составе конструктивных элементов в явном виде отсутствует. Время наступления событий может быть представлено в модели использованием атрибутов. Например, ГОД-РОЖДЕНИЯ, ДАТА-ПОСТУПЛЕНИЯ, ДАТА-ОКОНЧАНИЯ и т. д.
Сущность-это собирательное понятие, некоторая абстракция реально существующего объекта, процесса или явления, о котором необходимо хранить информацию в системе. В качестве сущностей в моделях ПО рассматриваются материальные (предприятие, изделие, сотрудники учреждения и т. п.) и не материальные (описание некоторого явления, применяемых в системен данных, рефераты научных статей и т. д.) объекты реальной действительности. В моделях ПО типа «сущность-связь» каждая рассматриваемая конкретная сущность является узловой точкой сбора информации об этой сущности. В модели используется также понятие «экземпляр сущности».
Тип сущности определяет набор однородных объектов, а экземпляр сущности -конкретный объект в наборе. Каждый рассматриваемый в модели тип сущности должен быть поименован.
Для идентификации конкретных экземпляров сущностей в некотором типе используются специальные атрибуты-идентификаторы. Это может быть один или несколько атрибутов, значения которых позволяют однозначно отличать один экземпляр сущности от другого.
Атрибут-это поименованная характеристика сущности, которая принимает значения из некоторого множества значений. В модели атрибут выступает в качестве средства, с помощью которого моделируются свойства сущностей. Например, для описания свойств сущности КНИГА можно использовать атрибуты НАЗВАНИЕ, ФАМИЛИЯ-АВТОРА, ГОД-ИЗДАНИЯ. Чтобы задать атрибут в модели, необходимо присвоить ему наименование, привести смысловое описание атрибута, определить множество его допустимых значений и указать, для чего он используется.
Основное назначение атрибута -описание свойства сущности, а также индентификация экземпляров сущностей. Например, атрибут ШИФР-ДЕТАЛИ, которому соответствует множество уникальных значений шифров деталей, позволяет однозначно идентифицировать конкретные экземпляры сущности ДЕТАЛЬ в соответствующем наборе. Атрибут можно использовать и для представления связей (отношений) между сущностями, поскольку связь (отношение) характеризует именно те объекты, между которыми она существует (например, отношение ОТЕЦ -характер родства), и поэтому может выступать в роли свойства, признака сущности.
Связи выступают в модели в качестве средства, с помощью которого представляются отношения между сущностями имеющими место в ПО Тип связи рассматривается между типами сущностей, а конкретный экземпляр связи рассматриваемого типа существует между конкретными экземплярами рассматриваемых типов сущностей. При анализе связей между сущностями могут встречаться бинарные (между двумя сущностями), тернарные (между тремя сущностями) и, в общем случае n-арные связи.
Наиболее часто встречаются бинарные связи. Для определения характера взаимосвязей между двумя типами сущностей используются прямое и обратное отображения между двумя соответствующими множествами экземпляров сущностей. Приведем классификацию бинарных связей.
Отображение 1:1 (связь один к одному). С помощью отображения 1 : 1 определяют такой тип связи между типами сущностей А и В, когда каждому экземпляру сущности А соответствует один и только один экземпляр сущности В и, наоборот, каждому экземпляру сущности В соответствует один и только один экземпляр сущности А. Это означает, что один экземпляр сущности, от которого направлена связь, например А, идентифицирует один и только одни экземпляр другой сущности В (к которому направлена связь) и наоборот. Идентификация экземпляров сущностей уникальна в обоих направлениях для отображений 1 : 1.
Отображение 1:M (связь один ко многим). С помощью отображения 1:М определяется тип связи между типами сущностей А и В, когда одному экземпляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В, однако каждому экземпляру сущности В соответствует только один экземпляр сущности А. Это означает, что с одним экземпляром сущности А может быть связано либо несколько экземпляров сущности В, либо один, либо ни одного. Но при этом каждый экземпляр сущности В связан только с одним экземпляром сущности А, т. е. идентификация экземпляров при отображении 1 :.М уникальна только в направлении от В к А.
Отображение М : 1 (связь многие к одному) . Это отображение является обратным отображению 1:М
Отображение М : N (связь многие к о многим) . С помощью отображения М : N определяется тип связи между типами сущностей А и В, при котором каждому экземпляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В и наоборот. С одним экземпляром сущности А может быть связано либо несколько экземпляров сущности В, либо один, либо ни одного. И наоборот, с одним экземпляром сущности В также может быть связано либо несколько экземпляров сущности А, либо один, либо ни одного, т. е. идентификация экземпляров сущностей неуникальна в обоих направлениях.
В некоторых случаях целесообразно рассматривать однонаправленную связь от сущности А к сущности В. В зависимости от количественных характеристик отображения различают простую и многозначную связь.
При простой однонаправленной связи от сущности А к сущности В одному и тому же экземпляру сущности А соответствует один и тот же экземпляр сущности В. При этом обратная связь не определена. Идентификация экземпляров сущности В экземплярами сущности А- уникальна (однозначна).
При многозначной однонаправленной связи от сущности А к сущности В одному и тому же экземпляру сущности А соответствует 0, 1 или несколько экземпляров сущности В. При обратная связь не определена. Идентификация экземпляров сущности В экземплярами сущности А не уникальна.
Связи (отношения) между сущностями специфицируются выражениями реляционного вида, в которых сущности представлены своими идентифицирующими атрибутами. Во многих случаях интересен не сам факт наличия отношения между сущностями, а свойства этого отношения. Для производственно-экономических областей эти свойства определяются некоторой числовой мерой. Отношение сущностей совместно с числовой мерой этого отношения определяют показатель-понятие, широко используемое в управленческой деятельности.
В этих случаях можно рассматривать интересующий нас тип отношения как некоторый тип сущности (что не противоречит введенному определению). Например, отношение ДЕТАЛЬ - X - РАЗМЕЩЕНА - НА - СКЛАДЕ - V рассматриваем как сущность, о которой хотим хранить некоторую информацию (например о количестве деталей, что и должно быть представлено соответствующим атрибутом КОЛИЧЕСТВО). Или, например, отношение ЭКЗАМЕН между сущностями СТУДЕНТ, ДИСЦИПЛИНА и ПРЕПОДАВАТЕЛЬ может рассматриваться как сущность и иметь такие описательные атрибуты, как ОЦЕНКА и ДАТА - ЭКЗАМЕНА.
Информацию о проекте оформляют составлением спецификаций по сущностям, атрибутам и отношениям с использованием графических диаграмм, для этого обозначают: типы сущностей -прямоугольниками; атрибуты -овалами, соединяя их с соответствующими типами сущностей ненаправленными ребрами, идентифицирующие атрибуты подчеркиваются; связи (отношения) - ромбами, соединяя их с соответствующими типами сущностей ненаправленными ребрами, за исключением бинарных связей, которые представляются направленными ребрами. При моделировании используются следующие общие правила:
-
используются только три типа конструктивных элементов - сущность, атрибут, связь;
-
в отдельном проектном представлении каждый компонент информации моделируется только одним конструктивным элементом, т. е. необходимо избегать избыточности в использовании конструктивных элементов.
При моделировании предметной области проектировщик разбивает ее на ряд локальных областей, моделирует каждое локальное представление, а затем их объединяет.
БИЛЕТ 20
КАНОНИЧЕСКИЕ СТРУКТУРЫ ДАННЫХ
Существует много способов, с помощью которых можно объединять совокупность элементов данных для формирования логической базы данных. Администратор базы данных должен разработать такую модель или логическую структуру данных, которая будет наилучшим образом удовлетворять требованиям пользователей.
КАНОНИЧЕСКАЯ СХЕМА
Существует ли такая группировка данных, которая является наилучшей для данной группы конечных пользователей? Были предприняты попытки разработать процедуру, определяющую группировку данных, близкую к оптимальной. Получаемая в результате минимальная структура данных иногда называется канонической схемой [1].
Для создания баз данных, использующих современное программное обеспечение, идеи канонического структурирования очень важны. Они лежат в основе методики проектирования, которой может и должен воспользоваться администратор базы данных при разработке схем.
Такие понятия, как третья нормальная форма и принципы канонического структурирования, должны способствовать пониманию организации данных. Системные аналитики должны достаточно хорошо освоить эти идеи, чтобы уметь их свободно применять.
Мы определим каноническую схему как модель данных, с помощью которой представляются существующие в реальном мире структуры данных, вне зависимости от конкретных приложений или от программного обеспечения и аппаратных средств, используемых для представления данных и их эксплуатации.
Отвлечемся пока от возможностей современного программного обеспечения и зададим вопрос: «Обладают ли данные такими внутренними свойствами, которые могли бы сыграть основополагающую роль при объединении элементов данных в группы и соответственно при объединении групп элементов данных в конкретную структуру?» В этой главе описана процедура создания рациональных структур. Мы называем их каноническими структурами. База данных должна иметь каноническую структуру, если необходимо, чтобы она, с одной стороны, была достаточно устойчивой, а с другой - обеспечивала возможность использования ее новыми приложениями. Только это обусловливает жизнестойкость базы данных и сводит до минимума необходимость перезаписи программ, вызванную изменениями базы данных.