Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kolokvium / БИЛЕТ2.DOC
Скачиваний:
30
Добавлен:
19.04.2013
Размер:
156.67 Кб
Скачать

Слово информация происходит от латинского informatio - осведомление, сообщение о положении дел или о чьей-то деятельности, сведения о чем-либо. С появлением и развитием кибернетики, а позже вы­числительной техники и информатики это слово хотя и сохранило свой первоначальный смысл, но, кроме того, получило еще ряд новых значений. Говоря об информации, мы подразумеваем совокупность данных, фактов, знаний о некоторой системе, характери­зующих организацию, структуру, состояние и поведе­ние этой системы в целом или ее отдельных элемен­тов.

Информация о системе может быть получена либо путем наблюдения, либо в результате экспериментов как натурных, так и модельных, либо при изучении абстрактных гипотетических систем - на основе ло­гического вывода. Информация, имеющаяся до про­ведения эксперимента, называется априорной, полу­ченная после эксперимента -апостериорной. Она также может быть истинной или ломаной. Так как процесс получения информации зачастую имеет ста­тистический характер, то информация о системе (в особенности о сложной) может быть как детерминированной, так и вероятностной.

Намереваясь использовать информацию о системе для решения определенных задач, наблюдатель (ис­следователь, инженер-проектировщик, технолог, ор­ганизатор производства) рассматривает ее с различ­ных точек зрения. Важнейшими выступают аспекты: прагматический (достижение поставленных целей), семантический (смысловое содержание) и синтаксический (способ представления). В настоящее время сложились три основные точки зрения на то, что понимать под информацией.

Информация -потребляемый всеми отраслями народного хозяйства ресурс, имеющий для них такое же значение, как энергетические ресурсы или запасы полезных ископаемых. Причем с развитием общества организация использования информационных ресур­сов, в которых обобщаются и концентрируются все имеющиеся сведения (данные, факты, знания) о различных вопросах экономики, науки, техники, техно­логии, культуры, искусства, медицины и т. д., оказывает все большее влияние на интеллектуальную и экономическую жизнь.

Информация -совокупность научно-технических сведений, фактов, знаний о результатах развития на­уки и техники. Другими словами, информация, со­гласно данной трактовке, является продуктом и «сырьем» системы информационного обслуживания научно-технической деятельности.

Информация-сумма продуктов, формируемых в системах информационного обслуживания научно-тех­нической деятельности и подготовки кадров различ­ных профилей, т. е. область производства и потребле­ния информационных ресурсов ограничивается лишь интеллектуальной жизнью общества.

Очевидно, что наиболее полное, охватывающее все многообразие информационных процессов понима­ние дает первая из этих трактовок. Действительно, информация пронизывает все сферы деятельности че­ловека и общества. Именно этим обстоятельством определяется интенсивное развитие в последние годы науки, получившей название информатики, изу­чающей свойства информационных ресурсов и разра­батывающей эффективные методы и средства их ор­ганизации, пополнения, преобразования и использо­вания. Этим же объясняется особое значение, которое сейчас придается новой отрасли народного хозяй­ства - индустрии обработки информации. На поль­зовательском уровне, т. е. для конструкторов, техно­логов, проектировщиков, организаторов производства и т. д., достижения информатики и результаты развития индустрии обработки информации проявляются в создании и развитии систем автоматизации и информационных систем, обеспечивающих хранение и преобразование необходимых пользователю данных.

Рассмотрим укрупненную функциональную схему информационной системы. Как видно из этой схемы, область определения любой информаци­онной системы (предметная область) представляет собой некоторое информационное пространство, содержащее совокупность информационных объектов, каждый из которых может быть описан с точки зрения систем хранения, обработки и поиска информа­ции и взаимосвязей данного объекта с другими объ­ектами рассматриваемой предметной области. В об­щем случае информационное пространство неоднород­но, так как содержит информационные объекты, различающиеся по методам формирования, организа­ции и пополнения информации.

Все преобразования информации, осуществляемые системой, можно свести к пяти основным процеду­рам: хранение, поиск, обработка, ввод, вывод. Пер­вые три процедуры являются внутренними, а четвер­тая и пятая обеспечивают связь данной системы с объектами предметной области, т. е. источниками ин­формации, и внешней средой (потребителями инфор­мации). Таким образом, любая информационная система и обрабатываемая ею информация образуют сложную неоднородную систему, которая, в свою оче­редь, является элементом еще более сложной гло­бальной системы «природа -человек -человеческая деятельность - общество».

Эффективность управления любой динамической системой (технологическим процессом, производством, процессом создания нового изделия в условиях интегральной автоматизации цикла «исследования - про­ектирование - производство» и т. д.) во многом определяется тем, как организованы хранение, поиск, обработка и пополнение информации. Очевидно, что управление возможно только в той системе, в кото­рой четко определены информационные связи как между отдельными элементами, так и с внешней сре­дой. В этом случае обеспечиваются возможность координации деятельности различных подсистем, сопря­жения данной системы управления с системами более высокого и более низкого уровней. Если учесть, что эффективность управления в сложных системах в значительной степени определяется методами сбора, передачи и обработки информации, то очевидно, что информационная система является обязательным эле­ментом управляющей системы.

Важнейшей отличительной чертой процессов управ­ления является непременное наличие в управляющей системе обратной связи. Естественно, что выработка управляющих воздействий требует информации о ре­зультате предыдущего воздействия на объект управ­ления, информации о достижении некоторой заданной на предшествующем этапе управления цели.

Разработка систем информационного обеспечения процессов управления производством -весьма тру­доемкий и сложный процесс. Здесь уместно обратить внимание на специфику формиро­вания информационных потребностей руководителя, работающего, с одной стороны, в условиях перенасы­щения разнообразной по характеру и различной по ценности информацией, с другой - в условиях крайне ограниченного времени, которое он может выделить для восприятия и обработки этой информации. При этом руководитель постоянно нуждается в сведениях о ходе производственного процесса, поставках сырья, полуфабрикатов и комплектующих изделий, сбыте го­товой продукции, перспективах развития отрасли,, но­вой прогрессивной технике и технологии и т.д. Все это обусловливает важнейшее значение методов опреде­ления информационных потребностей как руководи­телей, так и любых других потребителей информации.

Очевидно, что информация выдаваемая информационной системой потребителю является одним из ресурсов, позволяющих повысить производительность труда и эффективность его деятельности. Поэтому важнейшим аспектом взаимоотношений потребителя и информационной системы является по возможности наиболее полное и рациональное удовлетворение информационной потребности пользователя, другими словами, обеспечение эффективного использования информационных ресурсов. Это, в свою очередь, предполагает доведение информации до потребителя в требуемом объеме, в заданные сроки и в удобной для восприятия форме. Именно использование инфор­мационных ресурсов таким образом позволяет мини­мизировать расход всех других видов ресурсов (материальных, трудовых, финансовых, вычислительных ресурсов ЭВМ) при информационном обеспечении потребителей.

Таким образом, информационные ресурсы представляют собой один из обязательных элементов, не­обходимых для осуществления любого вида челове­ческой деятельности: производства, управления, науч­ных исследований, проектирования новой техники и технологии, подготовки и переподготовки кадров. Как самостоятельный вид информационные ресурсы были выделены сравнительно недавно, когда в ходе науч­но-технической революции была в полной мере осо­знана роль информации, когда стало ясно, что эф­фективность производства во всех отраслях народного хозяйства, его интенсификация зависят от того, как внедряются достижения научно-технического про­гресса.

Под информационной системой (ПС) условимся понимать автоматизированную систему', предназначенную для организации, хранения, пополнения, поддержки и представления пользователям информации в соответствии с их запросами. Термин «информационная система» может быть отнесен к весьма широ­кому классу автоматизированных систем, поскольку целью любой автоматизированной системы, независи­мо от области ее применения, используемых методов построения, технической базы, аппарата поддержки принятия решений является предоставление полной, достоверной и своевременной информации. Информационные системы целесообразно прежде всего разделить на две основные группы: системы информационного обеспечения и системы, имеющие самостоятельное целевое назначение и область применения.

Системы (или подсистемы) информационного обеспечения входят в состав любой АСУ. Они являются важнейшими компонентами интенсивно разви­ваемых в настоящее время систем интегральной автоматизации производственных систем, систем автоматизированного проектирования (САПР), автоматизированных систем научных исследований, АСУП. Хотя работы по созданию систем информационного обеспечения были начаты уже в шестидесятые годы (при проектировании первых АСУП), им в то время не придавалось определяющего значения. Это, на мой взгляд, является одной из причин того, что автоматизированные системы управления производством не дали ожидаемого экономического и социального эф­фекта.

БИЛЕТ 2

Что такое информация?

Обычно информацию отождествляют со знаниями, све­дениями, данными. Пока в силу описанных выше факто­ров не выросло значение информации и не определились новые проблемы и аспекты ее исследования, такое пред­ставление было допустимым. Но вот условия изменились. Стали создаваться мощные и дорогостоящие информационные системы. .Затраты на информацию, прежде растворявшиеся в общей сумме производственных и уп­равленческих расходов и поэтому незаметные, стали ис­числяться миллиардами. При этом выяснилось, что соби­раемые и обрабатываемые данные далеко не равноценны, что одни данные, пусть небольшие по объему, очень важны и для их получения целесообразно создавать самые сложные информационные системы, другие же, несмотря на большой объем, мало что дают для управления. Мы и раньше знали, что короткое сообщение может быть содержательнее пухлых докладов и отчетов. Но какие законы определяют различие между ними - этого мы не знали.

Первый шаг в раскрытии этих законов был сделан с возникновением в 40-х годах XX века так называемой «статистической» теории информации, создателями кото­рой были Клод Шеннон и Норберт Винер. Большой вклад в ее разработку внесли также советские ученые А. Н. Колмогоров и В. А. Котельников. Статистической ее назы­вают потому, что информация в этой теории определяет­ся на основе вероятностей тех или иных событий.

Для этого вводится мера неопределенности некото­рого события, имеющего несколько разных исходов. Если все исходы события равновероятны, то его неопределен­ность принимается равной логарифму числа исходов, причем на каждый исход из общей неопределенности приходятся одинаковые доли, равные их вероятности. В более общем случае, когда вероятности разных исхо­дов не равны, неопределенность одного исхода измеряет­ся логарифмом его вероятности, а неопределенность все­го события - средней из неопределенностей отдельных исходов, взвешенных по их вероятностям. Исчисляемая таким образом величина в теории информации называет­ся энтропией.

На основе понятия энтропии строится и количествен­ное определение информации, которая в статистической теории трактуется как мера уменьшения неопределенности при совершении какого-либо события. Информа­цию об одном из исходов некоторого события можно представить как разность его неопределенностей до и после события. При этом оказывается, что чем больше вероятность исхода до осуществления события, тем мень­ше количество информации, получаемое при его совершении. "

Чем более неожиданно сообщение, чем менее вероятно оно, тем больше информации оно содержит. Такое определение информации хорошо согласуется с широко распространенным представлением.

Разработав меру количества информации, статистическая теория информации впервые доказала, что дан­ные нельзя отождествлять с информацией. Информация содержит лишь те данные, которые уменьшают неопреде­ленность интересующих нас событий, т. е. вновь полу­чаемые сведения, а количество содержащейся в них информации зависит от того, насколько их нельзя было предвидеть заранее. Статистическая теория информации зародилась на почве анализа передачи сообщении по каналам связи, т. е. в области, прямо не связанной с проблемами управ­ления. Уже позднее обнаружилась возможность обобще­ния теории информации и приложения ее результатов к решению проблем управления. В частности, было по­казано, что всякий орган управления (регулятор) мо­жет рассматриваться как канал связи. При этом его мощность, т. е. способность к выработке эффективных управляющих воздействий, не может превышать его пропускной способности как канала связи с учетом воз­никающих в канале помех. Это утверждение получило название закона необхо­димого разнообразия. Он требует, чтобы при этом принимались во внимание объемы потоков информации и пропускная способность элементов (людей н машин), из которых строится система управления. Если один цен­тральный орган управления не обладает необходимым разнообразием, структура управления становится иерар­хической, многоуровневой. Применение элементов с бо­лее высокой пропускной способностью, например ЭВМ вместо арифмометров, создает предпосылки для сокращения числа уровней, упрощения структуры управления.

Статистическая теория информации оказала большое влияние на глубину познания природы информационных процессов и разработку методов их организации. В то же время, будучи развита прежде всего для решения проблем передачи сообщений, она страдает известной ограниченностью. Основной ее минус в том, что она не принимает во внимание ни содержания сообщений, ни ценности их для конкретных получателей, а неожидан­ность является единственным критерием информатив­ности.

Разумеется, экономисты легко обнаруживают огра­ниченность статистической теории. Они знают, что показатели, вовсе не неожиданные, могут быть весьма содержательными и ценными в зависимости от того, что они отображают и для решения каких задач исполь­зуются. Иначе говоря, неожиданность сообщения - это важный, но не единственный фактор, определяющий его информативность для конкретного получателя.

Другие факторы удается выделить на основе современной теории знаковых систем - семиотики. Предметом семиотики является процесс общения (коммуникации) внутри группы получателей и отправителей сообщений, язык как средство общения. Язык рассматривается при этом как знаковая система, т. е. совокупность знаков и правил их использования для выражения того или иного содержания. Знаком (z) может быть любой материаль­ный объект, если он оказывается элементом так называ­емой знаковой ситуации. Знаковая ситуация, предполагает наличие следующих элементов: 1) совокупности знаков с заданными способами их различения - языка Z, 2) совокупности различимых объек­тов реального мира А: каждый объект а е А обозначается опреде­ленным знаком, например z, т. е. z является обозначением а, который в этом отно­шении есть обозначаемое; 3) совокупности поня­тий S, отражающих реальные объекты в памяти по­лучателей и отправителей информации: каждое поня­тие s е S является отражением определенного объекта, например а, и образует значение (или смысловое значе­ние) обозначающего его знака z, 4) группы получате­лей и отправителей сообщений М: каждый член этой группы т е M получает или отправляет сообщения, вы­раженные в языке Z, причем не только воспринимает, но и оценивает их, соответственно изменяя свое пове­дение.

Отношения между знаками в языке Z взятые неза­висимо от их содержания (значения) и ценности для тех или иных получателей, изучаются особым аспектом се­миотики - синтактикой. Из сказанного выше следует, что статистическая теория информации исследует ин­формацию главным образом в этом аспекте.

Отношения между знаками и обозначаемыми ими объектами (z - а), знаками и их значениями (z - s), а также между объектами и отражающими их поняти­ями - s) образуют предмет другого аспекта семио­тики - семантики. Семантика изучает содержание со­общений - то, что упускается из виду теорией информации. Содержанием сообщения является знание - упорядоченное определенным образом отражение в понятиях, суждениях и других построенных из понятий образах объектов и процессов реального мира. Чтобы воспринять содержание сообщения, получатель сам должен распола­гать определенным запасом знаний. Последний в семио­тике и информатике называют тезаурусом. Восприятие содержания знака состоит в том, что из тезауруса долж­но быть вызвано понятие, являющееся его значением. Если значение знака не будет установлено, знак не доставит получателю никакой информации, каким бы не­ожиданным он ни был.

Отношения между знаками и их получателями (z - m) в плане оценки и влияния их на поведение последних изучаются еще одним аспектом семиотики - прагматикой. Прагматика занимается ценностью сообщений в связи с теми задачами, которые решает их получатель в процессе своей практической деятельности. Чтобы оценить сообщение, его вначале надо принять (по физи­ческому каналу связи) и понять (с помощью тезау­руса). Это означает, что прагматический аспект иссле­дования информации является·наиболее конкретным, учи­тывающим и синтаксические, и семантические отношения между знаками.

БИЛЕТ 3

Рассмотрим процесс восприятия сообщения в целом. Вначале сообщение, представ­ленное упорядоченной последовательностью знаков передается по физическому каналу связи и принимается. Качество приема зависит от физического шума в канале и приемнике, от пропускной способности последнего. В этом смысле можно говорить, что при восприятии сообщение проходят физический фильтр. То, что прошло через него, можно считать информацией синтаксической или, статистической, т. е. информацией в смысле клас­сической теории.

Далее эта информация должна быть понята, усвоена получателем. Для, этого сообщение должно пройти теза­урус (тезаурус в переводе с латинского языка означает сокровище, сейчас этим термином чаще всего обозначают систематиче­ский словарь понятий, в котором фиксируются как сами понятия, так и постоянные, не зависящие от контекста, отношения между ними, например классификационные), играющий роль семантического фильтра, отсеивающего семантический шум. Последний может возникнуть, например, в силу того, что в тезаурусе получателя отсутствуют понятия, являющиеся значениями знаков сообщения. В этом случае говорят, что тезаурус и сообщение не имеют общих точек, не пересекаются. Возмо­жен другой случай, когда все содержание сообщения уже имеется в тезаурусе, включено в него. Тогда полу­чатель опять же не получит никакой информации, не узнает ничего нового, и то, что даже понято им, тоже можно считать семантическим шумом. Советские ученые Ю. Шрейдер и И.Грекова предложили считать информацией ту часть содержания сообщения, которая состав­ляет приращение тезауруса получателя. Оно образуется тогда, когда, с одной стороны, тезаурус получателя и содержание сообщения имеют достаточное количество общих точек, чтобы было возможным понимание, а с другой - в сообщении содержатся сведения, новые для получателя. Их восприятие обеспечивается зафиксированными в тезаурусе ассоциативными связями между по­нятиями: благодаря им новым понятиям находится в памяти место, они пристраиваются к тезаурусу, увязы­ваются с другими понятиями.

Для данного получателя сообще­ние содержит только семантический шум и тогда, когда оно не имеет общих точек с тезаурусом, и в случае пол­ного совпадения с ним. При оптимальной степени пере­сечения сообщения и тезауруса достигается максималь­ное приращение тезауруса, т. е. из сообщения извле­кается максимум информации.

Такую информацию можно назвать семантической. Она не только принята, но и понята получателем. Но это не все. Содержание сообщения может быть приня­то, понятно, и все же не исключено, что для конкретного получателя оно не доставит информации, если он не найдет в нем нечто полезное для решения стоящих перед ним задач, если он не настроен на восприятие и исполь­зование его. Содержание сообщения должно быть еще оценено. Эту функцию выполняет третий, прагматический фильтр. Сведения, которые бесполезны для реше­ния актуальных задач, отсекаются им как прагматиче­ский шум. И только те, которые считаются полезными с этой точки зрения, оцениваются как информация. Ее можно было бы назвать прагматической. Однако следует иметь в виду, что в практике управления и в общении между людьми вообще только эту информацию в конеч­ном счете и считают информацией. Статистическая и се­мантическая информация может считаться информацией только в определенных частных случаях, когда от оцен­ки полезности сообщений можно отвлечься. При изучении передачи сообщений по каналам связи, например, можно отвлечься и от содержания, и от ценности их. В оперативном управлении неожиданность (вероят­ность) сообщения ценится так высоко, что прочие фак­торы тоже можно оставить в стороне, хотя они предпо­лагаются. В процессе обучения новые знания, расширяю­щие тезаурус обучаемого, приобретают самостоятельную ценность независимо- от того, будут или не будут они использоваться в дальнейшем. Это тот случай, когда можно отвлечься от ценности получаемых знаний. Но в практической деятельности чаще всего именно оценка дает окончательное заключение относительно того, какие сведения можно считать информацией.

Таким образом, под информацией условимся понимать новые знания, принятые, понятые и оцененные как полезные для решения тех или иных задач. Информа­ция - это то, что доведено до получателя через тройной фильтр механизма восприятия

БИЛЕТ 6

Информационные системы: типы и этапы создания и развития

Под информационной системой (ПС) условимся понимать автоматизированную систему', предназначенную для организации, хранения, пополнения, поддержки и представления пользователям информации в соответствии с их запросами. Термин «информационная система» может быть отнесен к весьма широ­кому классу автоматизированных систем, поскольку целью любой автоматизированной системы, независи­мо от области ее применения, используемых методов построения, технической базы, аппарата поддержки принятия решений является предоставление полной, достоверной и своевременной информации. Информационные системы целесообразно прежде всего разделить на две основные группы: системы информационного обеспечения и системы, имеющие самостоятельное целевое назначение и область применения.

Системы (или подсистемы) информационного обеспечения входят в состав любой АСУ. Они являются важнейшими компонентами интенсивно разви­ваемых в настоящее время систем интегральной автоматизации производственных систем, систем автоматизированного проектирования (САПР), автоматизированных систем научных исследований, АСУП. Хотя работы по созданию систем информационного обеспечения были начаты уже в шестидесятые годы (при проектировании первых АСУП), им в то время не придавалось определяющего значения. Это, на мой взгляд, является одной из причин того, что автоматизированные системы управления производством не дали ожидаемого экономического и социального эф­фекта.

К числу ИС, имеющих самостоятельное значение, относятся информационно-поисковые (ИПС), информационно-справочные (ИСС) и информационно-уп­равляющие (ИУС) системы. Информационно-поиско­вые и информационно-справочные системы предназна­чены для хранения и представления пользователю информации (данных, фактографических записей, текстов, документов и т. п.) в соответствии с некото­рыми формально задаваемыми характеристиками. Для ИПС и ИСС характерны два основных этапа функционирования: сбор и хранение информации; по­иск и выдача информации пользователю. Движение информации в таких системах осуществляется по замкнутому контуру от источника к потребителю ин­формации. При этом ИПС или ИСС выступает лишь как средство ускорения поиска необходимых данных. Наиболее сложным процессом с точки зрения его реализации выступает поиск необходимой информации, который осуществляется в соответствии со специально издаваемым поисковым образом доку­мента (ПОД), текста и т. п. При этом важнейшими требованиями, которые должны быть обеспечены в процессе поиска, являются требование соответствия найденного текста или документа фактической информационной потребности по­требителя, и требование смысловой и формальной соответствия одного текста .(документа) другому. Для оценки смысловой соответственности вводятся критерии смыслового соответст­вия, а для оценки соответствия поисковых признаков (формального соответствия) - критерии формально­го соответствия текстов, по которым осуществляется сравнение ПОД и определение соответствия найден­ных текстов запросам пользователей.

В зависимости от режима организации поиска ИПС и ИСС могут быть разделены на документальные, библиографические, библиотечные, фактографические. Документальными называют информационно-поисковые системы, в которых реализуется поиск в информационном фонде ИПС документов или текстов в соответствии с полученным запросом с последую­щим предоставлением пользователю этих документов или их копий. Вся обработка полученной информации в документальных ИПС осуществляется самим поль­зователем. В зависимости от того, по каким храни­мым документам или по их описаниям (вторичным документам) осуществляется поиск, документальные ИПС часто делят на системы с библиотечным или системы с библиографическим поиском. В первом случае поиск ведется в информационном фонде, со­держащем первичные документы, во втором - в ин­формационном фонде вторичных документов. Заметим, что наибольшее практическое значение имеют документальные ИПС, поиск в которых организован по двум контурам: библиографическому, с определением основных характеристик первичного документа и предоставлением пользователю возможности оценить, может ли данный документ удовлетворить его информационные потребности, и библиотечному, ко­гда в информационном фонде осуществляется нахождение требуемого документа с последующей его (или копии) выдачей пользователю.

Фактографические информационно-поисковые системы реализуют поиск и выдачу фактов, текстов, документов, содержащих сведения, которые могут удовлетворить поступивший запрос пользователя. В этом случае осуществляется поиск не какого-то конкретного документа, а всей совокупности сведений по данному запросу, хранящихся в информационном фонде ИПС или ИСС. Отметим, что основным отли­чием фактографических информационно-поисковых систем от документальных является то, что эти си­стемы выдают пользователю не какой-либо ранее введенный документ, а уже в той или иной степени обработанную информацию.

В зависимости от того, как в фактографической ИПС реализована подобная обработка информации, различают три поколения таких систем. ИС пер­вого поколения обеспечивают накопление и поиск ин­формации по одному типу объектов и реализуют один тип запросов при использовании для фактографиче­ского описания данных фиксированного формата. В фактографических системах второго поколения воз­можен уже выбор типа запроса из представленного набора. Отображаемые объекты могут принадлежать к различным классам, формат фактографического описания задается для класса объектов. В фактографических ИПС третьего поколения, которые являются, по сути дела, разновидностью рассматриваемых ниже интеллектуальных диалоговых систем, реализу­ется поиск информации по нерегламентированному перечню запросов, поисковый образ задается пользо­вателем в произвольной форме, предусматриваются операции синтеза информации для удовлетворения запросов пользователей, имеется специальный аппарат анализа вновь вводимой информации на смысловую и формальную релевантности хранящимся в инфор­мационном фонде данным.

Еще одним признаком классификации ИПС и ИСС может выступать реализуемый режим распро­странения информации. По этому признаку различа­ют: системы с режимом избирательного распростра­нения информации (ИРИ), обеспечивающим органи­зацию периодического (раз в неделю, раз в месяц, раз в квартал и т. п.) поиска информации в соответ­ствии с заданным ПОД в массиве новых поступле­ний в информационный фонд ИПС и предоставление пользователям сообщений о появлении таких доку­ментов; системы с режимом ретроспективного поиска (РП), реализующим поиск информации по заданным ПОД во всем информационном фонде ИПС или ИСС; интегральные системы, в которых реализованы как ИРИ -режим, так и РП -режим. Достигнутые в течение последнего десятилетия результаты развития средств вычислительной техники методов проектирования программного и информационного обеспечения систем автоматизации различного уровня и назначения способствовали существенному пересмотру принятых ранее подходов к созданию ин­формационных систем, и, прежде всего, к созданию новой информационной технологии, основными принципами которой являются:

1. Обеспечение общения конечного пользователя (исследователя, проектировщика, конструктора, тех­нолога, оператора ИПК и ГАП, плановика) с системой автоматизации на профессионально-ограниченном естественном языке, представление входной и резуль­тирующей информации в привычной и удобной пользователю форме.

2. Обеспечение возможности решения задач планирования, управления, проектирования, подготовки производства и научных исследований по их постановкам и исходным данным независимо от сложно­сти и наличия формальных математических моделей этих задач.

3. Создание конечному пользователю таких ус­ловий работы, при которых он осуществляет процессы управления, планирования, проектирования и по­иска новых решений в режиме активного, расширяю­щегося диалога с ЭВМ, оперируя понятиями своей предметной области, используя профессиональный опыт и навыки и принимая решения одновременно по множеству критериев, часть из которых не описана формально и не имеет количественного выражения.

Системы, построенные на принципах новой инфор­мационной технологии, можно разделить на три ос­новных класса: интеллектуальные диалоговые (вопросно-ответные); расчетно-логические или систе­мы поддержки принятия решений; экспертные систе­мы. Необходимо отметить, что в настоящее время построение систем всех перечисленных классов пред­ставляет весьма сложный и трудоемкий процесс, ре­ализация которого затруднена недостаточной прора­боткой ряда вопросов представления и хранения знаний, создания лингвистических процессоров и средств логического вывода. Поэтому на первых эта­пах создания экспертных систем и систем поддержки принятия решений (для решений различных задач проектирования, организационного управления и т.п.) рациональнее ориентироваться на создание систем информационной поддержки (СИП). В этом случае под СИП понимается информационная система, обеспечивающая эффективную организацию и предоставление пользователям необходимой для принятия решений информации. При таком процесс проектирования системы информационной поддержки целесообразно организовать по схеме, предложенной в работе для проектирования баз данных, расширив и модифицировав ее в соответствии с требованиями эффективного взаимодействия пользователя и систе­мы. При таком подходе процесс проектирования СИП реализуется в две стадии: концептуальное проектиро­вание и проектирование реализации. Проведение ра­бот на стадии концептуального проектирования предшествует выбору вычислительного оборудования и осуществляется практически независимо от его ре­зультатов. При этом должна учитываться лишь при­нятая концепция построения аппаратного обеспече­ния. Результаты реализации этой стадии определяют важнейшие требования к характеристикам и типам используемого в системе информационной поддержки электронно-вычислительного оборудования.

Стадия проектирования реализации начинается после выбора аппаратного обеспечения, поэтому все работы по проектированию СИП ориентированы здесь на конкретный тип вычислительного оборудо­вания.

БИЛЕТ 11

Структуризация данных базируется на использовании концепций типа «агрегация» и «обобщение». Например, в файловых систе­мах, которые реализуют модель типа «плоский файл» с понятий­ным базисом из четырех основных типов логических структур данных: а) поле -наименьшая поименованная единица данных; б) запись -поименованная совокупность полей; в) файл -поименованная совокупность экземпляров записей одного типа; г) набор файлов или библиотека -поименованная совокупность файлов обрабатываемых в системе. Агрегация используется для композиции полей в запись, а обобщение -для представления множества экземпляров записей одного типа одной общей структурой более высокого уровня -файлом. В ряде систем допускается объединение в файл экземпляров записей нескольких заданных типов. Обобщение также используется для выборки из файла прикладной программой некоторого подмножества экземпляров записей, удовлетворяющих заданному критерию выборки. Существует большое количество терминов, используемых для значения определенных типов структур данных. Широко распространена терминология, предложенная КОДАСИЛ- Ассоциация по языкам систем обработки данных

Элемент данных - наименьшая поименованная единица дан­ных (аналог поля в файловых системах). Элемент данных -это минимальная единица данных, к которой СУБД может адресоваться непосредственно и с помощью которой выполняется по строение всех остальных структур. Элементы данных обычно не пользуются для представления отдельных элементарных свойств объектов, например ТАБЕЛЬНЫЙ-НОМЕР, ШИФР-ДЕТАЛИ ГОД-РОЖДЕНИЯ и т. п.

Имя элемента данных используется для его идентификации в схеме структуры данного более высокого уровня. Значение эле­мента данных может быть числового (целый, вещественный) и не­числового (символьный, логический) типа. В некоторых прило­жениях используется «неопределенное» значение элемента данных, свидетельствующее о том, что значение соответствующего свой­ства объекта еще не введено в БД, а ряд других свойств, описы­вающих объект, уже представлены значениями.

Агрегат данных - поименованная совокупность элементов дан­ных внутри записи, которую можно рассматривать как единое це­лое. Имя агрегата используется для его идентификации в схеме структуры данного более высокого уровня. Агрегат данных может быть простым, если состоит только из элементов данных, и состав­ным, если включает в свой состав другие агрегаты. Пример про­стого агрегата данных -агрегат данных ДАТА, который состоит из элементов данных ЧИСЛО, МЕСЯЦ, ГОД. Пример составного агрегата данных -агрегат ПРЕД­ПРИЯТИЕ, который состоит из элементов данных - НАЗВАНИЕ ПРЕДПРИЯТИЯ, АДРЕС ПРЕДПРИЯТИЯ (ПОЧТОВЫЙ ИНДЕКС, ГОРОД, УЛИЦА И № ДОМА).

Различают агрегаты типа «вектор» и типа «повторяющаяся группа» Агрегат, повторяющаяся компонента которого является простым элементом данных, называется вектором.. Например, агрегат ЗАРАБОТНАЯ-ПЛАТА, в котором экземпляр элемента данных может повториться до 12 раз (за каждый месяц года). Агрегат, повторяющаяся компонента которого представлена со­вокупностью данных, называется повторяющейся группой. В пов­торяющуюся группу могут входить отдельные элементы данных, векторы, агрегаты или другие повторяющиеся группы. Например, агрегат ЗАКАЗ-НА-ПОКУПКУ имеет в своем составе повто­ряющуюся группу ПАРТИЯ-ТОВАРА. Максимальное количество экземпляров для вектора и для повторяющейся группы ограничено и задается при спецификации схемы записи.

Запись - поименованная совокупность элементов данных или элементов данных и агрегатов. Имя записи используется для иден­тификации типа записи в схемах типов структур более высокого уровня. Запись -это агрегат, не входящий в состав никакого другого агрегата. Запись может иметь сложную иерархическую структуру, поскольку допускается многократное применение агре­гации.

Процесс, обратный агрегации данных, называется пошаговой детализацией данных и широко применяется при программиро­вании с целью выделения требуемого данного из агрегированного.

Набор- поименованная совокупность записей, образующих двухуровневую иерархическую структуру. Этот термин не является аналогом набора файлов. Каждый тип набора представляет собой отношение (связь) между двумя или несколькими типами записей. Для каждого типа набора один тип записи может быть объяв­лен «владельцем», тогда остальные типы записей -его «члены», т. е. различают «запись-владелец» и «запись-член» набора. Каждый экземпляр набора должен содержать один экземпляр записи, имеющий тип «запись-владелец», и может содержать любое количество экземпляров записей типа «запись-член».

Основное назначение набора -представление связей между записями. Если запись используется для представления сущно­сти, то набор -для представления связей между рассматривае­мыми сущностями, представленными записями, входящими в набор. В схеме набора задаются типы составляющих его записей, определяется тип записи владельца и типы записей членов, прис­ваивается имя набору.

База данных - поименованная совокупность экземпляров записей различного типа, содержащая ссылки между записями, представленные экземплярами наборов. Описание структуры БД задается ее схемой. Однако не во всех СУБД используется Рас­смотренная терминология. Многообразие систем управления ба­зами данных и пестрота употребляемых в них терминов для обоз­начения поддерживаемых системой структур данных создают трудности при сравнении моделей данных конкретных СУБД. По­этому при рассмотрении МД целесообразно использовать терми­нологию, включающую следующий понятный базис: элемент дан­ных, группа, групповое отношение, база данных.

Элемент данных соответствует определению, приведенному в терминологии КОДАСИЛ.

Понятие группа одновременно соответствует и понятию «агрегат» и понятию «запись». Группа -это поименованная со­вокупность элементов данных или элементов и других групп. Различают группы: простую и составную, повторяющуюся и неповторяющуюся. Схема составной группы, в которую входит пов­торяющаяся группа, предусматривает включение некоторого числа реализации (экземпляров) этой повторяющейся группы.

Групповое отношение используется для задания связей между группами в базе данных. Групповое отношение определяется как поименованное бинарное отношение, заданное на двух множест­вах экземпляров рассматриваемых групп. Тип группового отноше­ния задается между двумя типами групп. По характеру бинарных связей между экземплярами рассматриваемых групп (например, типа А и типа В) различают групповые отношения вида: 1:1, 1:М; М:1; М:N. Пары чисел 1:1, 1:М; М:1; М:N называют коэффициентами группового отношения. Групповые отношения вида 1:1, 1:М; М:1 иногда еще называют функциональными (во втором случае функцией является обратное отношение). В групповом отношении один тип группы назначается владель­цем отношения, а другой -членом отношения. Экземпляр группового отношения представлен одним экземпляром группы типа группа -владелец и совокупностью связанных с ним экземпляров групп- членов.

База данных - поименованная совокупность экземпляров групп и групповых отношений. В схеме БД задаются типы групп и групповых отношений.

Рассмотренные типы структур позволяют использовать различ­ные формы представления схемы данных, включая обычное пред­ставление в виде исходного текста на ЯОД. При графовой форме представления агрегаты атрибутов, обычно используемые для представления сущностей, изображаются вершинами графа, а связи между ними -соответствующими дугами. Графовая форма представления схемы БД облегчает пользователям понимание и интерпретацию данных. Для построения графической диаграммы в терминах групп и групповых отношений используются следую­щие соглашения. Тип группы изображается прямоугольником, над левым верхним углом, которого указывается имя группы. Внутри прямоугольника можно указывать имена элементов данных, агре­гированных в группу. Групповые отношения обозначаются стрелками от группы-владельца к группе-члену с указанием имени отношения и коэффициента.

Конкретный экземпляр группы может быть идентифицирован в базе данных независимо либо по его связям с экземплярами других типов групп в групповых отношениях. При независимой идентификации для конкретного экземпляра типа группы опре­деляется неизбыточная совокупность элементов данных, высту­пающая в качестве первичного ключа -внутреннего индикатора группы. На графической диаграмме эта совокупность элементов обычно подчеркивается, а тип группы с внутренней идентифика­цией помечается особым знаком.

Другая форма представления схемы данных, удобная для поль­зователя с точки зрения понимания и интерпретации, - таблич­ная. С таблицами люди привыкли работать давно, поэтому они нашли применение в системах обработки данных.

Рассматривая таблицу как совокупное описание экземпляров сущности некоторого типа или как совокупное описание экземпляров связи некоторого типа между сущностями, при определенных допущениях можно использовать математическое понятие отношения для фор­мального описания таблицы, что и было использовано при разработке реляционной модели данных. Сущность представляется агрегатом атрибутов, а связь -агрегатом идентифицирующих атрибутов сущностей, между которыми она рассматривается.

Используя столбцы таблицы для зада­ния атрибутов и представляя экземпляр сущности агрегатом значений соответствую­щих атрибутов, а экземпляр связи -агрегатом значений идентифицирующих атрибутов сущностей, между которыми эта связь рас­сматривается, получим строку соответствую­щей таблицы. В реляционной модели дан­ных столбец таблицы интерпретируется ат­рибутом, строка -кортежем, а сама таблица отношением. Шап­ка таблицы может выступать в качестве наглядного средства пред­ставления схемы отношения.

В качестве аналогов таблиц и их элементов при машинной обработке могут выступать файлы, записи и поля.

БИЛЕТ 13

Каждая представляемая информацией сущность (объект, явление) имеет ряд характерных для нее свойств (черт, при­знаков, параметров, характеристик, моментов). Например, свойствами материала являются его вес, габариты, сорт, цена, номенклатурный номер и др. Свойствами-признаками, характеризующими такую сущность, как организация-поку­патель, представляются его наименование, ведомственная принадлежность, адрес, номер расчетного счета и др. Свойства физической сущности отображаются с по­мощью переменных величин, являющихся элементарными единицами информации - реквизитами.

Реквизит - это логически неделимый элемент любой сложной информационной совокупности, соотносимый с опре­деленным свойством отображаемого информацией объекта или процесса. Из реквизитов компонуются все остальные, более сложные информационные конструкции. Единицы информации любой сложности можно последовательным раз­ложением на составляющие компоненты (декомпозицией) расчленить до таких составляющих - переменных вели­чин, которые не поддаются дальнейшему логическому раз­биению, т. е. реквизитов. Дальнейшее членение реквизита на более мелкие составляющие - символы (символы в свою очередь - на биты, биты - на последовательность электрон­ных импульсов и т. д.) разрывает его привязку к определен­ному свойству объекта (процесса), нарушает информатив­ность.

Реквизит обладает некоторой самостоятельностью и имеет особые характерные для него черты. Так, он может входить в самые разнообразные составные единицы информации, относящиеся к различным сущностям и имеющие различную сложность, так же, как какое-либо слово может входить в состав самых различных предложений.

Это свойство реквизита находит свое отображение в его форме, всесторонне характеризующей реквизит вне зави­симости от его конкретного вхождения в ту или иную состав­ную единицу информации.

Форма реквизита включает его наименование, струк­туру (формат), значение или совокупность значений и неко­торые другие свойства.

Наименование реквизита (имя) служит для обращения к нему и обычно представляется словом или группой слов (например, «табельный номер рабочего»), названием опре­деленной графы (строки) входного или выходного доку­мента, номером, условным кодом, адресом на носителе (перфокартах, магнитной ленте, диске) или в памяти ЭВМ. При алгоритмизации и программировании с целью компакт­ного написания чаще используют сокращенные имена - идентификаторы. Идентификаторы обычно имеют ограниче­ния на длину, используемый алфавит и сферу действия. В некоторых случаях допускается также употребление синони­мов наименований реквизита.

Целесообразно, чтобы основное имя - идентификатор реквизита - было закреплено за ним вне зависимости от того, используется ли этот реквизит в той или иной составной еди­нице информации, в той или другой подсистеме. В этом слу­чае обеспечивается ряд преимуществ при создании баз дан­ных и совместимости различных информационных систем.

Точность же обращения к конкретному реквизиту достигается применением уточняющих указателей.

Каждому реквизиту присуще некоторое множество зна­чений в зависимости от характеристик того свойства объекта (явления), которое информационно отображает данный рек­визит. Это множество будем называть областью определения реквизита, или классом значений. Область определения, например, для параметра «температура больного» одна, для признака «пол больного» - дру­гая, для реквизита «код цеха» - третья.

Таким образом, значение реквизита является одним из элементов множества значений области определения данного реквизита, отображающей соответствующее состояние (из множества состояний) того свойства объекта (явления), ко­торое характеризует реквизит. Так, текущим значением реквизита «температура больного» может быть «37,40», а реквизита «пол больного» - «мужской». Другими словами, значение реквизита используется для представления зна­чения соответствующего свойства сущности.

Выбор формы представления значений некоторого свой­ства сущности прямо зависит от его природы и по возможно­сти должен в максимальной мере способствовать приближе­нию информационного отображения к естественной харак­теристике свойства. Так, свойству «вес груза» наиболее со­ответствует числовое представление определенного рекви­зита (в установленных единицах измерения и с заданной точностью), свойству «тип упаковки» - словесное описа­ние, а утверждение о предъявлении документов к оплате - логическое значение истинности или ложности.

Структурой реквизита называется способ представле­ния его значений. В структуре различают длину, тип и фор­мат реквизита.

Длина реквизита есть число символов, которые образуют его значение. Длина реквизита может быть посто­янной или переменной. Например, значение реквизита «код цеха», как правило, является двузначным, значение рек­визита «количество сданных да склад деталей» может зани­мать от одной до семи позиций, значение реквизита «потреб­ность некоторого материала на годовую программу пред­приятия» может занимать от одной до шести позиций до за­пятой, отделяющей дробную часть от целой, и от одной до пяти позиций после запятой, значение реквизита «наимено­вание материала» может занимать до 120 позиций.

Типы реквизитов зависят от видов значений. Наиболее распространены числовой, текстовой и логический типы.

Реквизиты числового типа характери­зуют количественные свойства сущностей, полученные в ре­зультате подсчета натуральных единиц, измерения, взвеши­вания, вычисления на основе других количественно-сум­мовых данными т. п. Значениями таких реквизитов являются числа.

Выделяется несколько типов числовых величин в зави­симости от класса чисел, системы счисления, фиксации деся­тичной запятой, упаковки и других характеристик; на­кладываются ограничения на диапазон чисел, форматы их представления при вводе-выводе и на различных носителях даже в рамках одной реализации. Реквизиты числового типа активно используются в различных арифметических преобразованиях, а большинство из них создается в резуль­тате таких преобразований.

Особую роль играют реквизиты числового типа, принимающие только целочисленные значения. Такие реквизиты могут выступать в качестве реквизитов - признаков.

Реквизиты текстового типа выражают, как правило, качественные свойства сущностей и характери­зуют обстоятельства, при которых имел место изучаемый про­цесс и были получены те или иные числовые значения. Такие реквизиты называются признаками.

Реквизиты текстового типа могут использоваться в ка­честве операндов в арифметических и логических выражени­ях. Более того, значения таких реквизитов могут быть полу­чены в результате арифметических или логических пре­образований .

Специальными свойствами реквизитов являются признаки редактирования и преобразования, замок защиты, индика­ция наличия значения или множества значений, даты из­менения значений и др.

Реквизиты логического типа принима­ют только два значения: истинность или ложность. Исполь­зуются они в логических выражениях.

Будем считать, что над реквизитами определены ариф­метические и логические операции, понимаемые в обычном математическом смысле, текстовые операции и операции отношения как операции реляционной алгебры.

Значениями реквизитов являются последовательности символов (букв, цифр, различных знаков и специальных обозначений), называемые строками или текстом.

Каждый из наблюдаемых объектов, процессов характери­зуется рядом присущих ему свойств. Но точно так же, как взятое в отдельности любое свойство еще не представляет сущность (объект, процесс) в целом, так и изолированно взятый тот или иной реквизит, характеризующий своим значением одно из свойств сущности, не может представлять законченного сообщения о наблюдаемом объекте (процессе). Требуется некоторая взаимосвязанная совокупность рек­визитов для того, чтобы воспроизвести некоторое сообщение о сущности, определенную информацию о явлении.

Реквизитом-признаком называется такой реквизит, зна­чение которого определяет некоторое обстоятельство дей­ствия (место действия, действующих лиц, предметы и про­дукты труда, время и др.).

Реквизит-основание - это такой реквизит, значение ко­торого определяет некоторую меру действия (количество или стоимость предметов и продуктов труда, норму выработки или времени и др.).

Чаще реквизит-основание является реквизитом числово­го типа (иногда его называют количественным).

Каждый реквизит в сообщении имеет лишь одно значе­ние (строку или число). Однако поскольку одна и та же сущ­ность (допустим, факт отпуска изделий покупателям) фикси­руется многократно с возникновением каждый раз нового сообщения, значения любого реквизита Rj меняются в зави­симости от обстоятельств.

БИЛЕТ 15

Поскольку в экономике документ служит основным сред­ством регистрации отдельных фактов хозяйственной деятельности, основным способом определения характера эко­номической информации является анализ содержания и структуры документов.

В частности, содержание всех документов предприятия в совокупности фактически отображает всю его деятельность в том виде, в каком она была зафиксирована и зарегистри­рована управленческим аппаратом, в каком весь трудовой процесс был представлен в результате определенных эконо­мических обобщений и оперирования первоначальными дан­ными.

Многочисленные факты и операции хозяйственной жизни предприятия отражаются документами. Варианты реги­страции могут быть самыми разнообразными в зависимости от объема и характера производства, количества рабочих, производственной структуры предприятия, формы бухгал­терского учета и методики планирования, технической осна­щенности управленческого аппарата, методов исчисления готовой продукции и т. д.

Характер документирования каж­дой отдельной хозяйственной операции зависит от конкрет­ных особенностей и условий ее осуществления и в связи с этим оформление одной и той же операции не одинаково для разных предприятий и организаций. Поэтому и количество форм документов, в которых регистрируется на предприяти­ях даже однотипное явление (например, расход материалов на производство), имеет много разновидностей. Так, сущест­вующие на предприятиях формы лимитной карты отлича­ются наличием или отсутствием некоторых реквизитов, их расположением и пр. Форма одного и того же наименования и назначения может быть в одном случае чрезвычайно слож­ной, в другом - простой.

Форму документа можно условно разбить на три части: общую, предметную и оформительную (подписи).

БИЛЕТ 16

Любые процессы жизни человеческого общества - производственные, хозяйственные, научно-исследовательс­кие, демографические, общественно-политические и т. п. - находят отображение в информационных процессах.

Существующие определения понятия «информация» после тщательного анализа обычно признаются неудовлетвори­тельными. Чаще всего они рассматривают информацию в сравнительно узком контексте. Попытки дать более широкое определение содержат элементы неясности. Поэтому вряд ли возможно сформулировать одно точное определение инфор­мации. Довольно распространенным является взгляд на информацию как на ресурс, аналогичный материальным, трудовым, денежным и т. п. ресурсам. Эта точка зрения отра­жается в следующем определении: информация - это но­вые сведения, позволяющие улучшить материальные про­цессы, связанные с преобразованием вещества, энергии и самой информации.

Информация неотделима от процесса информирования, поэтому необходимо рассматривать источник информации и потребителей информации. Роль потребителей информа­ции очерчивается в следующем определении: информация - новые сведения, принятые, понятые и оцененные как полез­ные конечным потребителем.

Информация на пути от источника к потребителю прохо­дит через ряд преобразователей: несколько кодирующих и декодирующих устройств, переносящих знаки с одного но­сителя на другой; ЭВМ, обрабатывающую информацию по определенному алгоритму, и т. д. На промежуточных ста­диях преобразования смысловые свойства сообщений от­ступают на второй план, поэтому понятие «информация» за­меняется на менее ограничительное понятие «данные».

Данные представляют собой набор утверждений, фактов и/или цифр, взаимосвязанных между собой. В тех случаях, когда различие между информацией и данными не нужно подчеркивать, они употребляются как синонимы.

Под информационным пространством некоторого объекта или множества объектов будем понимать совокупность всех информационных компонентов этого объекта или мно­жества объектов независимо от способов и средств отобра­жения этих компонентов.

Информационное пространство неоднородно. Оно содер­жит устные и письменные сообщения, в том числе организа­ционном - распорядительскую документацию, отчеты о науч­но-исследовательских работах, экономическую, техничес­кую и конструкторскую документацию и др., сообщения на машинных носителях (перфокартах, перфолентах, маг­нитных лентах, магнитных дисках и др.), а также такие ви­ды представления информации, как звуковые, -электромаг­нитные и др.

Одна из важнейших характеристик информационного пространства - степень его структурированности.

Под структурированностью понимается такое свойство информационного пространства, при котором все содержа­ние и особенности этого пространства представляются его компонентами и взаимосвязями между ними, выраженными в явном виде.

Между структурированностью информационного прост­ранства и энтропией можно провести аналогию. Энтропия - это некоторая мера неупорядоченности в информации; чем больше энтропия, тем меньше упорядоченность информации. В структурированности информационного пространства обратная зависимость - чем больше структурированность информационного пространства, тем больше его упорядо­ченность. Тем не менее аналогия между энтропией и струк­турированностью информационного пространства доста­точно глубока и позволяет переносить некоторые законо­мерности определения и изучения энтропии на структури­рованность информационного пространства.

Обработка информации на электронной вычислительной машине определяет необходимость представления ее в струк­турированном виде. Если в качестве меры структурирован­ности информационного пространства принять отношение объема структурированной информации к объему всей ин­формации в рассматриваемом пространстве, то степень структурированности информации, обрабатываемой на элек­тронной вычислительной машине (при условии, что эта ин­формация представляет собой рассматриваемое информа­ционное пространство), наибольшая.

В любой системе машинной обработки экономической информации (СМОЭИ) все входные и выходные документы, все промежуточные и внутримашинные представления ин­формации структурированы. Следовательно, для такого ин­формационного пространства коэффициент структурирован­ности равен или близок к максимальному значению.

В зависимости от степени структурированности информа­ционного пространства выделим следующие пять его видов.

1. Неструктурированное информационное пространст­во (НИП). Для НИП характерно, что структурированность компонентов информации встречается редко. Примерами НИП являются разговорная речь или информация, ко­торой обмениваются между собой дельфины. Некоторые эле­менты структурированности в этом подклассе могут присут­ствовать.

2. Слабо структурированное информационное пространст­во (ССИП) - полностью структурированы только отдель­ные компоненты. Типичным примером ССИП может служить письменный язык. Структурированность основного объе­ма информации состоит в выполнении требований неко­торого синтаксиса. Как правило, такие требования неодно­значны, противоречивы, имеют исключения, сохраняют омонимию и синонимию и т. п.

3. Структурированное информационное пространство (СИП) - характеризуется существенным преобладанием структурированных компонентов. В СИП информация до­кументирована, широко используется кодирование для обеспечения однозначности трактовки тех или иных поня­тий. Типичный пример СИП - экономическая информаци­онная система (ЭИС), представляющая собой часть информа­ционного пространства, которая отображает деятельность некоторого экономического объекта.

4. Формализованно - структурированное информационное пространство (ФСИП)- для него должно существовать в явном виде такое описание информационных образований, в котором определены не только информационные структуры и связи, но и алгоритмы получения значений любого элемен­та данных.

Основное назначение формализованного структурирован­ного информационного пространства в том, что представлен­ные в явном виде описания информационных образований должны обеспечивать:

порождение (на основе формальных правил) не только блоков логико-алгебраических преобразований, но и лю­бых операций по управлению данными (сортировка, под­борка, вызов, размещение и др.);

возможность выбора оптимальной структуры экономи­ческой информационной системы в соответствии с выбран­ной целевой функцией;

возможность реорганизации как структур, так и алго­ритмов обработки информации в процессе функционирова­ния системы на основе обработки статистических данных и накапливаемых изменений об объекте.

5. Машинно - структурированное информационное про­странство (МСИП) - формализовано описаны все инфор­мационные образования, в том числе формы входных и выходных документов, запросы конечных пользователей. Типичным примером МСИП является база данных в системе машинной обработки экономической информации. Все про­цессы преобразования информации в таком пространстве формализованы и представлены в виде машинных программ. Некоторые неструктурированные элементы используются при организации взаимодействия конечных пользователей и вычислительной системы на естественном (или близком к естественному) языке.

Изучение закономерностей построения и методов анали­за структурированного, в том числе формализовано - и машинно -структурированных видов, информационного про­странства объектов экономического характера, изучение абстрактно-теоретических положений и средств, обеспе­чивающих переход от одного вида информационного прост­ранства к другому, и является основой учебного курса «Теория экономических информационных систем».

Процесс создания проекта системы машинной обработ­ки данных для некоторого объекта можно представить в виде последовательного перехода от первичного описания этого объекта (некоторой информационной модели) через про­межуточные модели, такие, как машинная и программно-алгоритмическая модели, к проекту системы машинной обработки данных (модель обработки данных).

Одно из свойств последовательности моделей - соблю­дение семантического единства, семантическая совместимость моделей снизу вверх. Предыдущая модель связана с по­следующей в смысловом плане. Все сведения, имеющиеся в предыдущей модели, сохраняются в последующей. При этом последующая модель пополняется новыми (производными) сведениями, новыми информационными взаимосвязями, ко­торых не было в предыдущей модели, за счет применения но­вого уровня обобщения, новых преобразований.

Другое свойство этой последовательности моделей - конструктивная полнота, заключающаяся в том, что должна обеспечиваться полнота сведений, достаточная для после­дующих формализованных преобразований от первичного описания экономического объекта до модели обработки данных .

Переход от предыдущей модели к последующей обеспе­чивается применением некоторых преобразователей. Выде­лим два типа преобразователей. Одни преобразователи обес­печивают собственно переход от одной модели к другой, другие позволяют анализировать синтаксическую и семан­тическую непротиворечивость модели, ее полноту, коррект­ность и адекватность реальным условиям объекта управле­ния.

На первом этапе создания последовательности моде­лей -информационной модели объекта используются преобразователи первого типа- организация и корректи­ровка информационной модели и второго типа - анализ информационной модели.

На втором этапе - создании машинной модели, по су­ществу, являющемся машинной интерпретацией информа­ционной модели, используются преобразователи первого типа - преобразование информационной модели в машин­ную и ведение и корректировка машинной модели и второго типа - синтаксический и семантический анализ машинной модели .

Третий этап - программно-алгоритмическая модель, включающая средства управления данными и структуру базы данных. На этом этапе используются преобразова­тели первого типа - преобразование машинной модели в программно-алгоритмическую и второго типа - анализ про­граммно-алгоритмической модели.

На четвертом этапе - создании модели обработки дан­ных, по существу, представляющем собой проект системы машинной обработки данных, используются преобразователи первого типа - преобразование программно-алгоритмичес­кой модели в модель обработки данных и второго типа - до­кументирование модели обработки данных, сопровождение модели обработки данных, модернизация модели обработ­ки данных.

В различных представлениях информации можно выделить несколько уровней единиц информации. Им соответствуют некоторые последовательности символов, для которых су­ществует семантическая интерпретация. Выделяют следую­щие единицы информации (в порядке возрастания синтакси­ческой сложности); реквизит, показатель, составная еди­ница информации, база данных.

Реквизит является информационным отображением от­дельного свойства объекта или процесса реального мира. Составная единица информации представляет собой ин­формационное отображение объекта или процесса в целом или их части. Показатель - это лишь одна из разновид­ностей составной единицы информации, минимальная по ин­формационному содержанию, но достаточная для образова­ния документа.

Базой данных называется единица информации, задаю­щая информационное отображение множества разнородных взаимодействующих объектов реального мира.

Каждая единица информации характеризуется именем, структурой, значением, методами организации значений и допустимыми операциями над именем, структурой и зна­чениями.

Имя единицы информации - это ее уникальное наиме­нование в процессах обработки информации. Под структу­рой единицы информации понимается ее реквизитный состав с учетом иерархического вхождения в нее единиц ин­формации более низкого уровня. Структурой реквизита счи­тается описание формата, т. е. указание множества допусти­мых символов в каждой позиции значения. Множество зна­чений единицы информации может быть объявлено и орга­низовано в памяти ЭВМ различными способами. Точное опи­сание множества значений и всех взаимосвязей, которые под­держиваются между его элементами, называется методом организации значений.

Допустимыми операциями над именем единицы информации являются открытие и закрытие имени, объявление синонимов для данного имени и др. Операции над структу­рой единицы информации - композиция и декомпозиция. В процессе композиции различные по структуре единицы ин­формации объединяются, получая новое имя, новую струк­туру и новое множество значений. Для вычисления струк­туры и множества значений результата должен существовать алгоритм, который в качестве входной информации исполь­зует структуру и значения исходных единиц информации. Декомпозиция представляет собой операцию разъединения единицы информации на не совпадающие по структуре части.

Операции над значениями единиц информации очень раз­нообразны и рассматриваются в последующих разделах учебника.

Сведения об имени, структуре, множестве значений и допустимых операциях над единицей информации образуют ее модель. Чаще всего речь идет о модели базы данных, называемой моделью данных. Единицы информации и их модели представляют собой важный инструмент анализа и про­ектирования экономических информационных систем.

БИЛЕТ 17

Развитие теории и практики проекти­рования и эксплуатации баз данных сопровождается интенсивным разви­тием моделей данных (МД). Ранее рассматривались модели предметной области.

Каждая ЭВМ обладает относи­тельно простой, но хорошо определен­ной моделью данных -это допусти­мые в ЭВМ форматы данных и со­став операций, выполняемых над ними. С помощью исходной МД можно построить более сложные модели дан­ных, т. е. выполнить переход к некото­рой абстрактной машине, обладающей более удобной МД для представления исходных данных и решения приклад­ных задач.

Примерами абстрактных машин яв­ляются интерпретаторы (или трансля­торы) с алгоритмических языков про­граммирования высокого уровня. Каж­дый язык программирования высокого уровня имеет свою модель данных, ко­торая не зависима от машинной реа­лизации и спроектирована для улуч­шения моделирования определенных видов реальных ситуаций или для удобства выполнения определенных видов вычислений и представления соответствующих типов исходных, промежуточных и выходных данных в программах (для вычислительных языков). Все операторы любого алгоритмического языка можно разбить на две основные группы: декларативного типа (используемые писания данных) и процедурного типа (используемые для описания последовательности операций, которые должны быть выполнены над описанными данными). Множество допустимых состояний исходных, промежуточных и выходных данных в программе, написанной на некотором алгоритмическом языке, определяется описанием данных, задаваемым операторами декларативного типа. Изменение состояния данных в программе достигается средствами процедурных операторов языка программирования. Таким образом, совокупность операторов декларативного и процедурного типа некоторого алгоритмического языка определяет МД языка, понимаемую как совокупность методов и средств, как некоторый формализм для определения логических структур данных и процессов, динамического изменения их состояния с целью моделирования некоторых реальных процессов или явлений. Эти структуры называют логическими, чтобы отличить их основных структур модели данных ЭВМ, называемых физическими структурами данных, на которых эти логические структуры данных основываются. Пользователь, работающий с некоторым алгоритмическим языком, должен хорошо понимать и разбираться в логических структурах данных используемого языка. Физические структуры данных пользователь может и не знать, поскольку непосредственно с ними не работает.

Модель данных алгоритмического языка, определяемая совокупностью его операторов декларативного и процедурного типа, формализовано описывает все множество допустимых логических структур данных, которые могут принять, обработать и выдать программы, составленные на этом алгоритмическом языке. Совокупность конкретных логических структур данных любой конкретной программы, написанной на этом языке, представляет собой подмножество этого множества. Однако охарактеризовать это множество, перечислив все его элементы -возможные логические структуры данных, невозможно. Поэтому модель данных, поддерживаемую некоторым языком программирования, обычно характеризуют следующим образом:

  1. идентифицируют типы логических структур данных, которые можно представить в МД. Две структуры следует рассматривать как структуры различного типа, если они имеют различные признаки, правила композиции или правила их обработки (правила манипулирования) процедурными операторами;

  2. специфицируют: признаки (характеристики) структур данного типа, правила композиции (составления) структур данного типа из логических структур других типов; правила обработки структур данного типа процедурными операторами.

Все это полностью относится и к МД любой программной системы обработки данных и, в частности, к МД поддерживаемой конкретной СУБД. С позиций прикладного программиста можно рассматривать СУБД как некоторый алгоритмический язык, на котором программируются подлежащие решению задачи. Отли­чие от алгоритмического языка заключается в том, что операторы описания и процедурные операторы разделены и оформлены в виде самостоятельных языков: языка описания данных и языка мани­пулирования данными. Однако в логическом плане это не меняет ситуации, поэтому совокупность операторов ЯОД и ЯМД опре­деляет модель данных, поддерживаемую конкретной рассматри­ваемой СУБД и понимаемую как совокупность структур данных и операций над этими структурами, для определения логической структуры БД и динамического моделирования состояний ПО.

Дополнительно к структурам данных СУБД обеспечивает по­строения, называемые схемой данных. Схемой структуры данных называется описание структуры данных некоторого типа на фор­мализованном языке. Схема задает совокупность свойств, прису­щих данному типу структуры данных. Реализацией схемы является конкретная структура данных соответствующего типа. Каждая кон­кретная реализация называется экземпляром схемы.

Схема структуры данных описывает те свойства структуры, которые не изменяются в течении выполнения прикладных про­грамм и которые можно объявить заранее, до выполнения прог­рамм. Эти свойства называют статическими свойствами данных. Система имеет возможность выполнять предварительную проверку корректности структур, которые будут в дальнейшем созданы в БД. Правила композиции схемы структуры данных и правила генерации (формирования) экземпляра схемы в БД определяются ЯОД СУБД.

Построение структур данных в каждой конкретной МД не мо­жет выполняться произвольным образом, а только по определен­ным правилам. Это связано с ограничениями, вытекающими из особенностей используемых в модели типов структур данных и операций, которые можно выполнять над этими структурами. Поэтому в качестве основных компонентов модели данных рас­сматривают: структуры данных, операции над данными, огра­ничения. Основные компоненты модели данных тесно взаимосвя­заны между собой и в различных конкретных моделях могут быть реализованы различными способами.

БИЛЕТ 18

Модель типа «сущность - связь» - это неформальная модель предметной 'области, которая используется на этапе инфологического проектирования базы данных. Эта модель позволяет моде­лировать объекты ПО, взаимоотношения объектов. Относительная простота, применение естественного языка и легкость понимания позволяют использовать модель как инструмент для общения с будущими пользователями для сбора информации о предметной области для проектирования БД.

Основное назначение неформальной модели «сущность - связь»-семантическое описание предметной области и представление информации для обоснования выбора видов моделей и структур данных, которые в дальнейшем будут использованы в системе.

Существует несколько подходов к построению моделей типа «сущность - связь». Общим для всех подходов является исполь­зование трех основных конструктивных элементов для представ­ления составляющих ПО -сущность, атрибут и связь. Инфор­мация о проекте объединяется с помощью графических диаграмм. Составляющая «время» в составе конструктивных элементов в явном виде отсутствует. Время наступления событий может быть представлено в модели использованием атрибутов. Например, ГОД-РОЖДЕНИЯ, ДАТА-ПОСТУПЛЕНИЯ, ДАТА-ОКОН­ЧАНИЯ и т. д.

Сущность-это собирательное понятие, некоторая абстракция реально существующего объекта, процесса или явления, о кото­ром необходимо хранить информацию в системе. В качестве сущ­ностей в моделях ПО рассматриваются материальные (предприя­тие, изделие, сотрудники учреждения и т. п.) и не материальные (описание некоторого явления, применяемых в системен данных, рефераты научных статей и т. д.) объекты реальной дей­ствительности. В моделях ПО типа «сущность-связь» каждая рассматриваемая конкретная сущность является узловой точкой сбора информации об этой сущности. В модели используется также понятие «экземпляр сущности».

Тип сущности определяет набор однородных объектов, а эк­земпляр сущности -конкретный объект в наборе. Каждый рас­сматриваемый в модели тип сущности должен быть поименован.

Для идентификации конкретных экземпляров сущностей в не­котором типе используются специальные атрибуты-идентифи­каторы. Это может быть один или несколько атрибутов, значе­ния которых позволяют однозначно отличать один экземпляр сущности от другого.

Атрибут-это поименованная характеристика сущности, кото­рая принимает значения из некоторого множества значений. В модели атрибут выступает в качестве средства, с помощью ко­торого моделируются свойства сущностей. Например, для описа­ния свойств сущности КНИГА можно использовать атрибуты НАЗВАНИЕ, ФАМИЛИЯ-АВТОРА, ГОД-ИЗДАНИЯ. Чтобы задать атрибут в модели, необходимо присвоить ему наименова­ние, привести смысловое описание атрибута, определить множе­ство его допустимых значений и указать, для чего он исполь­зуется.

Основное назначение атрибута -описание свойства сущности, а также индентификация экземпляров сущностей. Например, атрибут ШИФР-ДЕТАЛИ, которому соответствует множество уникальных значений шифров деталей, позволяет однозначно идентифицировать конкретные экземпляры сущности ДЕТАЛЬ в соответствующем наборе. Атрибут можно использовать и для представления связей (отношений) между сущностями, поскольку связь (отношение) характеризует именно те объекты, между ко­торыми она существует (например, отношение ОТЕЦ -характер родства), и поэтому может выступать в роли свойства, признака сущности.

Связи выступают в модели в качестве средства, с помощью которого представляются отношения между сущностями имею­щими место в ПО Тип связи рассматривается между типами сущностей, а конкретный экземпляр связи рассматриваемого типа существует между конкретными экземплярами рассматриваемых типов сущностей. При анализе связей между сущностями могут встречаться бинарные (между двумя сущностями), тер­нарные (между тремя сущностями) и, в общем случае n-арные связи.

Наиболее часто встречаются бинарные связи. Для определения характера взаимосвязей между двумя типами сущностей исполь­зуются прямое и обратное отображения между двумя соответ­ствующими множествами экземпляров сущностей. Приведем клас­сификацию бинарных связей.

Отображение 1:1 (связь один к одному). С помощью отображения 1 : 1 определяют такой тип связи между типами сущностей А и В, когда каждому экземпляру сущности А соответствует один и только один экземпляр сущно­сти В и, наоборот, каждому экземпляру сущности В соответствует один и только один экземпляр сущности А. Это означает, что один экземпляр сущности, от которого направлена связь, напри­мер А, идентифицирует один и только одни экземпляр другой сущности В (к которому направлена связь) и наоборот. Иденти­фикация экземпляров сущностей уникальна в обоих направле­ниях для отображений 1 : 1.

Отображение 1:M (связь один ко многим). С помощью отображения 1:М определяется тип связи между типами сущностей А и В, когда одному экземпляру сущности А может соответствовать 0, 1 или несколько экземпля­ров сущности В, однако каждому экземпляру сущности В соот­ветствует только один экземпляр сущности А. Это означает, что с одним экземпляром сущности А может быть связано либо не­сколько экземпляров сущности В, либо один, либо ни одного. Но при этом каждый экземпляр сущности В связан только с одним экземпляром сущности А, т. е. идентификация экземпляров при отображении 1 :уникальна только в направлении от В к А.

Отображение М : 1 (связь многие к одному) . Это отображение является обратным отображению 1:М

Отображение М : N (связь многие к о многим) . С помощью отображения М : N определяется тип связи между типами сущностей А и В, при котором каждому экземпляру сущности А может соответствовать 0, 1 или несколько экземпля­ров сущности В и наоборот. С одним экземпляром сущности А может быть связано либо несколько экземпляров сущности В, либо один, либо ни одного. И наоборот, с одним экземпляром сущности В также может быть связано либо несколько экземпля­ров сущности А, либо один, либо ни одного, т. е. идентификация экземпляров сущностей неуникальна в обоих направлениях.

В некоторых случаях целесообразно рассматривать однона­правленную связь от сущности А к сущности В. В зависимости от количественных характеристик отображения различают про­стую и многозначную связь.

При простой однонаправленной связи от сущности А к сущности В одному и тому же экземпляру сущности А соот­ветствует один и тот же экземпляр сущности В. При этом обрат­ная связь не определена. Идентификация экземпляров сущности В экземплярами сущности А- уникальна (однозначна).

При многозначной однонаправленной связи от сущности А к сущности В одному и тому же экземпляру сущности А соответствует 0, 1 или несколько экземпляров сущности В. При обратная связь не определена. Идентификация экземпляров сущности В экземплярами сущности А не уникальна.

Связи (отношения) между сущностями специфицируются выражениями реляционного вида, в которых сущности представлены своими идентифицирующими атрибутами. Во многих случаях интересен не сам факт наличия отношения между сущностями, а свойства этого отношения. Для производственно-экономических областей эти свойства определяются некоторой числовой мерой. Отношение сущностей совместно с числовой мерой этого отношения определяют показатель-понятие, широко используемое в управленческой деятельности.

В этих случаях можно рассматривать интересующий нас тип отношения как некоторый тип сущности (что не противоречит введенному определению). Например, отношение ДЕТАЛЬ - X - РАЗМЕЩЕНА - НА - СКЛАДЕ - V рассматриваем как сущность, о которой хотим хранить некоторую информацию (например о количестве деталей, что и должно быть представлено соответствующим атрибутом КОЛИЧЕСТВО). Или, например, отношение ЭКЗАМЕН между сущностями СТУДЕНТ, ДИСЦИПЛИНА и ПРЕПОДАВАТЕЛЬ может рассматриваться как сущность и иметь такие описательные атрибуты, как ОЦЕНКА и ДАТА - ЭКЗАМЕНА.

Информацию о проекте оформляют составлением спецификаций по сущностям, атрибутам и отношениям с использованием графических диаграмм, для этого обозначают: типы сущностей -прямоугольниками; атрибуты -овалами, соединяя их с соответствую­щими типами сущностей ненаправленными ребрами, идентифици­рующие атрибуты подчеркиваются; связи (отношения) - ромбами, соединяя их с соответствующи­ми типами сущностей ненаправленными ребрами, за исключением бинарных связей, которые представляются направленными реб­рами. При моделировании используются следующие общие правила:

  • используются только три типа конструктивных элементов - сущность, атрибут, связь;

  • в отдельном проектном представлении каждый компонент информации моделируется только одним конструктивным элемен­том, т. е. необходимо избегать избыточности в использовании кон­структивных элементов.

При моделировании предметной области проектировщик раз­бивает ее на ряд локальных областей, моделирует каждое ло­кальное представление, а затем их объединяет.

БИЛЕТ 20

КАНОНИЧЕСКИЕ СТРУКТУРЫ ДАННЫХ

Существует много способов, с помощью которых можно объединять совокупность элементов данных для формирования логи­ческой базы данных. Администратор базы данных должен разработать такую модель или логическую структуру данных, которая будет наи­лучшим образом удовлетворять требованиям пользователей.

КАНОНИЧЕСКАЯ СХЕМА

Существует ли такая группировка данных, которая является наи­лучшей для данной группы конечных пользователей? Были предпри­няты попытки разработать процедуру, определяющую группировку данных, близкую к оптимальной. Получаемая в результате минималь­ная структура данных иногда называется канонической схемой [1].

Для создания баз данных, использующих современное программное обеспечение, идеи канонического структурирования очень важны. Они лежат в основе методики проектирования, которой может и дол­жен воспользоваться администратор базы данных при разработ­ке схем.

Такие понятия, как третья нормальная форма и принципы кано­нического структурирования, должны способствовать пониманию ор­ганизации данных. Системные аналитики должны достаточно хорошо освоить эти идеи, чтобы уметь их свободно применять.

Мы определим каноническую схему как модель данных, с помощью которой представляются существующие в реальном мире структуры данных, вне зависимости от конкретных приложений или от програм­много обеспечения и аппаратных средств, используемых для представ­ления данных и их эксплуатации.

Отвлечемся пока от возможностей современного программного обеспечения и зададим вопрос: «Обладают ли данные такими внутрен­ними свойствами, которые могли бы сыграть основополагающую роль при объединении элементов данных в группы и соответственно при объединении групп элементов данных в конкретную структуру?» В этой главе описана процедура создания рациональных структур. Мы называем их каноническими структурами. База данных должна иметь каноническую структуру, если необходимо, чтобы она, с одной стороны, была достаточно устойчивой, а с другой - обеспечивала воз­можность использования ее новыми приложениями. Только это обус­ловливает жизнестойкость базы данных и сводит до минимума необ­ходимость перезаписи программ, вызванную изменениями базы данных.

Соседние файлы в папке Kolokvium