Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Polnoe_sobranie_konspektov_33.docx
Скачиваний:
7
Добавлен:
01.03.2025
Размер:
1.02 Mб
Скачать

Объектно-ориентированное программирование

Проектирование и разработка программ, реализующих модели сложных процессов и явлений достаточно сложны и трудоемки. Одним из подходов, обеспечивающих структурирование математической модели и упрощение ее программирования, является объектный подход, в котором реальный процесс или система представляются совокупностью объектов, взаимодействующих друг с другом.

Принцип объектно-ориентированного программирования (ООП) основан на формализации описания объектов. Под объектом понимается совокупность свойств (параметров) определенных сущностей и методов их обработки (программных средств). Объект содержит инструкции (программный код), определяющие действия, которые может выполнять объект и обрабатываемые данные. Состояние объекта определяется перечнем всех возможных (обычно статических) свойств и текущими значениями (обычно динамическими) каждого из этих свойств. Свойства объекта характеризуются значениями его параметров.

Основные идеи объектно-ориентированного подхода опираются на следующие положения:

1.программа представляет собой модель некоторого реального процесса, части реального мира.

2.модель реального мира или его части может быть описана как совокупность взаимодействующих между собой объектов.

3. Объект описывается набором параметров, значения которых определяют состояние объекта, и набором операций (действий), которые может выполнять объект.

4. Взаимодействие между объектами осуществляется посылкой специальных сообщений от одного объекта к другому. Сообщение, полученное объектом, может потребовать выполнения определенных действий, например, изменения состояния объекта.

5. Объекты, описанные одним и тем же набором параметров и способные выполнять один и тот же набор действий представляют собой класс однотипных объектов.

Три основных достоинства ООП: упрощение проектирования; ускорение разработки за счет многократного использования готовых модулей; легкость модификации.

Общим предком практически всех используемых сегодня объектных и объектно-ориентированных языков является Simula, созданный в 1960 году Далем, Мюрхогом и Ныгардом. Существенно, что Simula, предназначенная для описания систем и моделирования, ввела дисциплину написания программ, отражающую словарь предметной области.

Практически все объектно-ориентированные языки программирования являются развивающимися языками, их стандарты регулярно уточняются и расширяются. Следствием этого развития являются неизбежные различия во входных языках компиляторов различных систем программирования. Наиболее распространенными в настоящее время являются системы программирования Microsoft C++ , Microsoft Visual C++ и системы программирования фирмы Borland International.

Вопрос №68

компьютеры. Программное обеспечение.

П рограммное обеспечение персонального компьютера - совокупность программных средств, обеспечивающих функционирование компьютера.

Все программное обеспечение по сфере использования принято подразделять на три большие группы: системное программное обеспечение, пакеты прикладных программ и инструментарий технологии программирование, т.е. программное обеспечение сферы производства программ.

Системное программное обеспечение (System Software) - совокупность программ и программных комплексов для обеспечения работы компьютера и сетей ЭВМ, оно направлено на создание операционной среды функционирования других программ; на обеспечение надежной работы компьютера и вычислительной сети; на проведение диагностики и профилактики аппаратуры компьютера и вычислительных сетей; на выполнение вспомогательных технологических процессов (копирование, архивирование, восстановление файлов и т.д.).

Пакеты прикладных программ (application program package) - комплекс взаимосвязанных программ для решения задач определённого класса конкретной предметной области. Это самый многочисленный класс программных продуктов. Непосредственную их эксплуатацию осуществляют, как правило, конечные пользователи - потребители информации, деятельность которых во многих случаях далека от компьютерной области. Наиболее часто используемыми прикладными программами считаются редакторы (текстовые, графические, музыкальные) и электронные таблицы.

Инструментарий технологии программирования - совокупность программ и программных комплексов, обеспечивающих технологию разработки, отладки и внедрения создаваемых программных продуктов. Пользователями этого класса программного обеспечения являются системные и прикладные программисты.

Вопрос№61

Основные св-ва ИТ, опред. их роль в технолог развитии современного об-ва.

В числе отличительных свойств информационных технологий, имеющих стратегическое значение для развития общества, представляется целесообразным выделить следующие семь наиболее важных:

  1. Информационные технологии позволяют активизировать и эффективно использовать информационные ресурсы общества, которые сегодня являются наиболее важным стратегическим фактором его развития.

  2. Информационные технологии позволяют оптимизировать и во многих случаях автоматизировать информационные процессы, которые в последние годы занимают все большее место в жизнедеятельности человеческого общества.

  3. Информационные процессы являются важными элементами других более сложных производственных или же социальных процессов. Поэтому очень часто и информационные технологии выступают в качестве компонентов соответствующих производственных или социальных технологий.

  4. Информационные технологии сегодня играют исключительно важную роль в обеспечении информационного взаимодействия между людьми, а также в системах подготовки и распространения массовой информации.. Эти средства быстро ассимилируются культурой нашего общества, так как не только создают удобства, но и снимают многие производственные, социальные и бытовые проблемы, вызываемые процессами глобализации и интеграции мирового сообщества, расширением внутренних и международных экономических и культурных связей, миграцией населения и его все более динамичным перемещением по планете.

  5. Информационные технологии занимают сегодня центральное место в процессе интеллектуализации общества, развития его системы образования и культуры. Возможности данного направления развития информационных технологий настолько многообещающи, что вполне обоснованно можно говорить о зарождении целого нового направления в области культуры - экранной культуры.

6. Информационные технологии играют в настоящее время ключевую роль также и в процессах получения и накопления новых знанийВ первую очередь здесь выделяют методы информационного моделирования исследуемых наукой процессов и явлений, позволяющие ученому проводить своего рода «вычислительный эксперимент». Второе перспективное направление представляют собой методы искусственного интеллекта, позволяющие находить решение плохо формализуемых задач, а также задач с неполной информацией и нечеткими исходными данными. Третье перспективное направление представляют собой методы так называемой когнитивной компьютерной графики. При помощи этих методов, позволяющих образно представлять различные математические формулы и закономерности, уже удалось доказать несколько весьма сложных теорем в теории чисел.

7. Принципиально важное для современного этапа развития общества значение развития информационных технологий заключается в том, что их использование может оказать существенное содействие в решении глобальных проблем человечества и, прежде всего, проблем, связанных с необходимостью преодоления переживаемого мировым сообществом глобального кризиса цивилизации.

Вопрос №64

ИТ. Критерий эффективности ИТ.

В качестве общего критерия эффективности любых видов технологий можно использовать экономию социального времени, которая достигается в результате их практического использования. Эффективность этого критерия особенно хорошо проявляется на примере информационных технологий. Какие же виды информационных технологий представляются с точки зрения этого критерия наиболее перспективными сегодня и в ближайшем будущем? Необходимость экономии социального времени ориентирует наше внимание, в первую очередь, на технологии, связанные с наиболее массовыми информационными процессами, оптимизация которых, как представляется и должна дать наибольшую экономию социального времени именно благодаря их широкому и многократному использованию.

Вопрос №70

Данные и знания.

Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают.

Данные - это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства.

Параллельно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, возникли списочные структуры, иерархические структуры. В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу.

По мере развития исследований в области интеллектуальных систем возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации.

Знания - совокупность сведений, образующих целостное описание, соответствующее некоторому уровню осведомленности об описываемом вопросе, предмете, проблеме и т.д. Знания - это выявленные закономерности в предметной области (принципы, связи, законы), позволяющие решать задачи в этой области.

В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. Но это было бы слишком узкое понимание. А между тем, в системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний.

Знания могут быть классифицированы по следующим категориям:

  • поверхностные - знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области;

  • глубинные - абстракции, аналогии, схемы, отображающие структуру и процессы в предметной области.

Кроме того, знания можно разделить на следующие виды:

  • процедурные: знания, отвечающие на вопрос «Как решать поставленную задачу?»; эти знания хранятся в памяти интеллектуальной системы в виде описаний процедур, с помощью которых их можно получить. В таком виде обычно описывается информация о предметной области, характеризующая способы решения задач в этой области, а также различные инструкции, методики и т.п.

декларативные: знания, не содержащие в явном виде процедуры решения задач; которые записаны в памяти так, что они непосредственно доступны для использования после обращения к соответствующему полю памяти. В таком виде обычно записывается информация о свойствах предметной области фактах, имеющих в ней место и т.п. информация.

Модели представления знаний в современных интеллектуальных системах.

Модель знаний - описание знаний в базе знаний. Известны четыре типа моделей знаний:

1. логические, в основе которых лежит формальная логическая модель;

2. сетевые, в основе которых лежат семантические сети;

3. фреймовые, основанные на фреймах;

4. продукционные, основанные на продукциях.

Каждая такая М.З. определяет форму представления знаний.

Формальные логические модели

Система ИИ в определенном смысле моделирует интеллектуальную деятельность человека и, в частности, - логику его рассуждений. В грубо упрощенной форме наши логические построения при этом сводятся к следующей схеме: из одной или нескольких посылок (которые считаются истинными) следует сделать «логически верное» заключение (вывод, следствие).

Логические выражения, построенные в данном языке, могут быть истинными или ложными. Некоторые из этих выражений, являющиеся всегда истинными, объявляются аксиомами (или постулатами). Они составляют ту базовую систему посылок, исходя из которой и пользуясь определенными правилами вывода, можно получить заключения в виде новых выражений, также являющихся истинными.

Если перечисленные условия выполняются, то говорят, что система удовлетворяет требованиям формальной теории. Ее так и называют формальной системой (ФС). Система, построенная на основе формальной теории, называется также аксиоматической системой.

Классическими примерами аксиоматических систем являются исчисление высказываний и исчисление предикатов. Эти ФС хорошо исследованы и имеют прекрасно разработанные модели логического вывода.

ФС имеют и недостатки, которые заставляют искать иные формы представления. Главный недостаток - это «закрытость» ФС, их негибкость.

Логические модели

В основе моделей такого типа лежит формальная система, задаваемая четверкой вида: M = <T, P, A, B>. Множество T есть множество базовых элементов различной природы, например слов из некоторого ограниченного словаря, деталей детского конструктора, входящих в состав некоторого набора и т.п.

Множество P есть множество синтаксических правил. С их помощью из элементов T образуют синтаксически правильные совокупности.

В множестве синтаксически правильных совокупностей выделяется некоторое подмножество A. Элементы A называются аксиомами.

Множество B есть множество правил вывода. Применяя их к элементам A, можно получать новые синтаксически правильные совокупности, к которым снова можно применять правила из B. Так формируется множество выводимых в данной формальной системе совокупностей.

Для знаний, входящих в базу знаний, можно считать, что множество A образуют все информационные единицы, которые введены в базу знаний извне, а с помощью правил вывода из них выводятся новые производные знания. Другими словами формальная система представляет собой генератор порождения новых знаний, образующих множество выводимых в данной системе знаний. Это свойство логических моделей делает их притягательными для использования в базах знаний. Оно позволяет хранить в базе лишь те знания, которые образуют множество A, а все остальные знания получать из них по правилам вывода.

Семантические (смысловые) сети

В основе моделей этого типа лежит конструкция, названная ранее семантической сетью. Сеть, в вершинах которой находятся информационные единицы, а дуги характеризуют отношения и связи между ними. Семантическая сеть является наиболее общей моделью представления знаний.

В зависимости от типов связей, используемых в модели, различают классифицирующие сети, функциональные сети и сценарии. В классифицирующих сетях используются отношения структуризации. Такие сети позволяют в базах знаний вводить разные иерархические отношения между информационными единицами. Функциональные сети характеризуются наличием функциональных отношений. Их часто называют вычислительными моделями

Вопрос №55

Основные компоненты экспертной системы, специалисты-разработчики.

Экспертные системы основаны на использовании искусственного интеллекта. Главная идея использования технологии экспертных систем заключается в том, чтобы получить от эксперта его знания и, загрузив их в память компьютера, использовать всякий раз, когда в этом возникает необходимость.

Экспертные системы (ЭС) - это сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующие этот эмпирический опыт для консультаций менее квалифицированных пользователей.

Традиционно знания существуют в двух видах - коллективный опыт и личный опыт. Если большая часть знаний в предметной области представлена в виде коллективного опыта (например, высшая математика), эта предметная область не нуждается в экспертных системах. Если в предметной области большая часть знаний является личным опытом специалистов высокого уровня (экспертов), если эти знания по каким-либо причинам слабо структурированы, такая предметная область, скорее всего, нуждается в экспертной системе.

При создании баз знаний самая трудная задача - извлечение из них эксперта. Для этого существуют методы извлечения знаний. Экспертные системы представляют собой компьютерные программы, трансформирующие опыт экспертов в какой-либо области в форму эвристических правил.

Эвристики не гарантируют получения результата с такой же степенью уверенности, как алгоритмы ППР. Однако они часто дают приемлемые решения для практического использования. Таким образом, экспертные системы используются в качестве советующих систем.

Пользователь - специалист предметной области, для которого предназначена система. Обычно его квалификация недостаточно высока, и поэтому он нуждается в помощи и поддержке своей деятельности со стороны ЭС.

Специалист по знаниям - специалист по искусственному интеллекту, выступающий в роли промежуточного буфера между экспертом и базой знаний. Синонимы: когнитолог, инженер по знаниям, инженер-интерпретатор, аналитик.

Интерфейс пользователя - комплекс программ, реализующих диалог пользователя с ЭС как на стадии ввода информации, так и получения результатов. Специалист использует интерфейс также для ввода команд, содержащих параметры, определяющие процесс обработки информации. Пользователь может использовать четыре метода ввода информации: меню, команды, естественный язык, собственный интерфейс.

Технология экспертных систем предусматривает возможность получать в качестве выходной информации не только решения, но и объяснения.

База знаний (БЗ) - ядро ЭС, совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и пользователю (обычно на некотором языке, приближенном к естественному). Параллельно такому «человеческому» представлению существует БЗ во внутреннем «машинном» представлении. Для организации базы знаний используют различные модели представления знаний: продукционную, семантическое сети, фреймы, формальные логические модели.

Интерпретатор - часть ЭС, производящая в определенном порядке обработку знаний, находящихся в базе знаний. Как правило, в нем выделяют два блока: решатель и подсистема объяснений. Решатель - программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в БЗ (синонимы: дедуктивная машина, блок логического вывода). Подсистема объяснений - программа, позволяющая пользователю получить ответы на вопросы: «Как была получена та или иная рекомендация?» и «Почему система приняла такое решение?» Ответ на вопрос «как» - это трассировка всего процесса получения решения с указанием использованных фрагментов БЗ, т.е. всех шагов цепи умозаключений. Ответ на вопрос «почему» - ссылка на умозаключение, непосредственно предшествовавшее полученному решению, т.е. отход на один шаг назад. Кроме этого, во многих экспертных системах вводят дополнительные блоки: базы данных, блок расчета, блок ввода и корректировки данных.

Модуль создания системы - служит для создания набора (иерархии) правил. Существует два подхода, которые могут быть положены в основу модуля создания системы: использование алгоритмических языков программирования и использование оболочек экспертных систем. Как правило, в модуль создания системы включается интеллектуальный редактор БЗ - программу, предоставляющую инженеру по знаниям возможность создавать БЗ в диалоговом режиме. Включает в себя систему вложенных меню, шаблонов языка представления знаний, подсказок («help» - режим) и других сервисных средств, облегчающих работу с базой.

Класс «экспертные системы» сегодня объединяет несколько тысяч различных программных комплексов, решающих разные типы задач:

Задачи интерпретации данных.

Задача диагностики.

Задача мониторинга.

Задача проектирования.

Задача прогнозирования.

Задача планирования.

Задачи обучения.

Информационные технологии ППР и информационные технологии ЭС широко используются для решения задач в слабоформализованных предметных областях, однако между ними существуют существенные различия:

1) решение проблемы в рамках систем ППР открывает уровень понимания возможностей системы пользователем и его возможности получить и осмыслить решение; технология экспертных систем предлагает пользователю принять решение, превосходящее его возможности;

2) экспертные системы способны пояснить свои рассуждения в процессе получения решения (очень часто эти пояснения более важны для пользователя, чем само решение);

3) новый компонент информационных технологий - знания, использующиеся только в экспертных системах;

4) главная ориентация СППР - принятие решений, а ИТЭС - на тиражирование знаний.

Вопрос №62

Основные программные и аппаратные компоненты сети.

Компьютерная (вычислительная) сеть - совокупность компьютеров и терминалов, соединенных с помощью каналов связи в единую систему, удовлетворяющую требованиям распределенной обработки данных.

Компьютерные сети - высшая форма многомашинных ассоциаций.

Основные отличия КС от МВК:

1. размерность (МВК -2 или 3, КС - десятки или сотни, и далеко отстоящих друг от друга);

2. разделение функций между ЭВМ (функций обработки данных, передачи данных и управления системой в МВК могут быть реализованы в одной ЭВМ, в вычислительных сетях эти функции распределены между различными ЭВМ);

3. необходимость решения в сети задачи маршрутизации сообщений (в зависимости от состояния каналов связи сообщение от одной ЭВМ к другой может быть передано по разным каналам).

Абоненты сети - объекты, генерирующие или потребляющие информацию в сети (это могут быть отдельные ЭВМ, комплексы, терминалы, роботы, станки с ЧПУ и т.д.) Любой абонент сети подключается к станции.

Станция - аппаратура, которая выполняет функции, связанные с приемом и передачей информации.

Совокупность абонента и станции принято называть абонентской системой. Для организации взаимодействия абонентов необходима физическая передающая среда.

Физическая передающая среда - линии связи или пространство, в котором распространяются электрические сигналы, и аппаратура передачи данных.

На базе физической передающей среды строится коммуникационная сеть, которая обеспечивает передачу информации между абонентскими системами. Таким образом, любую компьютерную сеть можно рассматривать как совокупность абонентских систем и коммуникационной сети.

Вопрос №65

Функциональные группы устройств в сети.

Основное назначение любой компьютерной сети - предоставление информационных и вычислительных ресурсов подключенным к ней пользователям.

С этой точки зрения ЛВС можно рассматривать как совокупность серверов и рабочих станций.

Сервер - компьютер, подключенный к сети и обеспечивающий ее пользователей определенными услугами.

Серверы могут осуществлять хранение данных, управление базами данных, удаленную обработку заданий, печать заданий и ряд других функций. Сервер - источник ресурсов сети.

Рабочая станция - персональный компьютер, подключенный к сети, через который пользователь получает доступ к ее ресурсам.

Рабочая станция функционирует как в сетевом, так и в локальном режимах. Она может быть оснащена собственной операционной системой.

Файл-сервер хранит данные пользователей сети и обеспечивает им доступ к этим данным. Это компьютер с большой емкостью оперативной памяти, жесткими дисками большой емкости и дополнительными накопителями на магнитной ленте (стримерами). Файл-сервер выполняет следующие функции: хранение данных, архивирование данных, синхронизацию изменений данных различными пользователями, передачу данных. Он работает под управлением специальной операционной системы, которая обеспечивает одновременный доступ пользователей сети к расположенным на нем данным.

Компьютерные сети реализуют распределенную обработку данных, которая в данном случае распределяется между клиентом и сервером.

Клиент - задача, рабочая станция или пользователь компьютерной сети.

Вопрос №57

Архитектура ПК.

Основные блоки ПК и их назначение.

Выделяют пять базовых компонент любого компьютера (рис: 7)

1. процессор (или центральный процессор - ЦП, Central Processor Union - CPU);

2. основная память (memory);

3. схемы ввода-вывода (Input/Output - I/O);

4. дисковая память (disk storage);

5. программы (programs).

Обсуждая возможности компьютеров имеют в виду, как правило, техническое (hardware), программное (software) и интеллектуальное (brainware) обеспечение.

Основные блоки ПК и их назначение:

Центральный процессор, оперативное запоминающее устройство, накопители на жестких магнитных дисках, накопители на гибких магнитных дисках, блок питания, внутренний канал обмена данных, электронные схемы (контроллеры), монитор, клавиатура, мышь, принтер, сканер, джойстик, графопостроитель (плоттер), дигитайзер, сетевой адаптер, модемы, музыкальная приставка.

Вопрос №60

Показатели качества информации.

Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют: правильность концепции, на базе которой сформулировано исходное понятие; обоснованность отбора существенных признаков и связей отображаемого явления. Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям.

Содержательность информации отражает семантическую емкость, равную отношению количества семантической информации в сообщении к объему обрабатываемых данных, т.е. C = Ic/Vд. С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных. Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации (по Шеннону) к объему данных Y = I/Vд.

Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный для принятия правильного решения набор показателей. Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.

Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.

Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного со временем решения поставленной задачи.

Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности: формальная точность, измеряемая значением единицы младшего разряда числа; реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется; максимальная точность, которую можно получить в конкретных условиях функционирования системы; необходимая точность, определяемая функциональным назначением показателя.

Достоверность информации определяется ее свойством отражать реально существующие объекты с необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.

Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.

Такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность. При этом параметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.

Вопрос №63

Системы классификации информации, основные идеи.

Важным понятием при работе с информацией является классификация объектов - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов - это процедура группировки на качественном уровне, направленная на выделение однородных свойств.

Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.

Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.

При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.

Разработка классификаторов является достаточно сложной задачей и проводится, как правило, в несколько этапов.

На 1-м этапе проводят исследования, определяющие исходное множество объектов, подлежащих классификации; выбор метода классификации и классификационных признаков, позволяющих упорядочить объекты в систему.

На 2-м этапе разрабатывается методика создания классификатора, содержащая состав и характеристику объектов классификации: описание и обоснование классификационных признаков и методов классификации и кодирования объектов, включаемых в классификатор; структура классификатора.

3-й этап - создание классификатора и программного обеспечения системы ведения классификатора: сбор исходных данных; установление полного перечня объектов классификации и упорядочение этих объектов в систему; разработка структуры и формирование базы данных классификатора; подготовка задания на создание системы ведения классификатора; оформление, согласование и утверждение классификатора.

И только 4-й этап - ввод в действие классификатора.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков.

Иерархическая система классификации строится следующим образом: исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень; каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень; каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.

Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки.

В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранно­го классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации: простота построения; использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации: жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами и (facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака. Причем значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. При этом могут быть использованы не все фасеты. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

Кs = (Ф1, Ф2, …, Фi, …, Фп),

где Фi - i-й фасет, п - количество фасетов.

При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись. Фасетную систему легко можно модифицировать, внося изменения в конкретные значения любого фасета.

Достоинства фасетной системы классификации: возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок; возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

Примером фасетной системы классификации является система регистрации преступных элементов, предложенная французским криминалистом Альфонсом Бертильоном. Бертильон делит всех людей на три группы - по длине черепа, каждая из трех групп делится на три подгруппы - по ширине черепа, дальнейшие деления - по размеру среднего пальца левой руки, размеру правого уха, росту, длине рук, высоте в сидячем положении, размеру стопы, длине локтевого сустава. Всего 19683 категории.

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем: отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы; выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых; создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Вопрос№66

Система кодирования информации, классификация методов.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации.

Система кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется: длиной - числом позиций в коде; структурой - порядком расположения в коде символов, используемых для обозначения классификационного признака.

При кодировании могут ставится разные цели и соответственно применяться разные методы. Наиболее распространенные цели кодирования - это экономность, т.е. уменьшение избыточности сообщения; повышение скорости передачи или обработки; надежность, т.е. защита от случайных искажений; сохранность, т.е. защита от случайного доступа к информации; удобство физической реализации (например, двоичное кодирование информации в ЭВМ); удобство восприятия.

Процедура присвоения объекту кодового обозначения называется кодированием.

Можно выделить две группы методов, используемых в системе кодирования, которые образуют: классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы; регистрационную систему кодирования, не требующую предварительной классификации объектов.

Классификационное кодирование применяется после проведения классификации объектов. Различают последовательное и параллельное кодирование.

Последовательное кодирование используется для иерархической классификационной структуры. Суть метода заключается в следующем: сначала записывается код старшей группировки 1-го уровня, затем код группировки 2-го уровня, затем код группировки 3-го уровня и т.д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о специфике выделенной группы на каждом уровне иерархической структуры. Последовательная система кодирования обладает теми же достоинствами и недостатками, что и иерархическая система классификации.

Параллельное кодирование используется для фасетной системы классификации. Суть метода заключается в следующем: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации.

Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую систему.

Порядковая система кодирования предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Этот метод применяется в том случае, когда количество объектов невелико, например кодирование названий факультетов университета, кодирование студентов в учебной группе.

Серийно-порядковая система кодирования предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия также будет иметь порядковую нумерацию. По своей сути серийно-порядковая система является смешанной: классифицирующей и идентифицирующей. Применяется тогда, когда количество групп невелико.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]