Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема_2_Базовые понятия и методы структурировани...doc
Скачиваний:
4
Добавлен:
09.11.2019
Размер:
166.91 Кб
Скачать

Тема 2. Базовые понятия и методы структурирования знаний в системе информационной аналитики

Прежде чем переходить к изучению основных систем и методов аналитической обработки информации следует определиться с системой понятий, с которыми мы будем работать в дальнейшем.

Базовые понятия

Обратите внимание на тот факт, что, говоря об информационной деятельности и информационном сервисе, мы постоянно оперируем понятиями информация, данные, знания, документ.

Давайте определимся с этими понятиями, так как вся наша работа будет связана именно с ними.

Основным объектом нашей деятельности будет документ.

Документ (лат. documentum - свидетельство, способ доказательства) – это любой материальный носитель сведений с записанной на нем информацией, предназначенной для ее передачи во времени и пространстве.

Т.е. документ представляет собой материальный носитель, предназначенный для передачи информации. Можно сказать и по-другому:

Документ – это информация, зафиксирована в виде текста, звукозаписи, изображения или их сочетания и предназначенная для передачи во времени и пространстве.

Документы различаются по целевому назначению, по структуре, по периодичности, по характеру информации и т.д.

Мы видим, что документ определяется через понятие информации. Вспомним, что это такое. Мы говорили об определении информации, данном в кибернетике через понятие отражения. К этому следует добавить и то, что информация не может существовать без физического носителя. Тогда можно сказать, что:

Информация - в наиболее общем определении - это отражение предметного мира с помощью знаков и сигналов.

Следовательно, у нас появляются такие цепочки понятий:

Предметный мир + отражение = Информация

Информация + материальный носитель = Документ

Информацию, полученную путем измерения, наблюдения, логических или арифметических операций, и представленную в форме, пригодной для постоянного хранения, передачи и (автоматизированной) обработки называют данными.

Данные – это информация, представленная в формализованном виде, что обеспечивает возможность её хранения, автоматической обработки и передачи, в частности, с помощью технических средств.

Информация + формализация = Данные

Данные бывают простые и сложные. Данные простого типа это - символы, числа и т.п. элементы, дальнейшее дробление которых не имеет смысла. Из элементарных данных формируются структуры (сложные типы) данных (матрицы, множества и т.п.)

Знания – это информация, необходимая для принятия решений, т.е. истинная, достоверная, проверенная практикой информация.

Информация + проверка истинности = Знания

Естественно, что для принятия различных решений может понадобиться и разная информация. Поэтому говорят о различных видах знаний. Рассмотрим некоторые из них.

Знания делят на факты и эвристики, глубинные и поверхностные, жесткие и мягкие.

Факты указывают на хорошо известные обстоятельства.

Эвристики основываются на индивидуальном опыте специалиста.

Глубинные знания отражают понимание сути явления, назначение и взаимосвязь его составляющих (это законы и теоретические основания).

Поверхностные знания представляют знания, полученные из опыта, внешние эмпирические ассоциации с каким-либо явлением.

Жесткие знания позволяют получать однозначные четкие результаты при заданных начальных условиях.

Мягкие знания допускают множественные, нечеткие решения, допускающие различные варианты.

Задачи с преобладанием глубинных и мягких знаний называют трудно формализуемыми. Для них характерны следующие особенности:

  • задача не может быть определена в числовой форме (требуется символьное представление),

  • алгоритмическое решение задачи не известно (хотя, возможно, и существует),

  • цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачи.

Современная наука все чаще обращает свой взор на решение именно таких задач. Но как действовать в такой ситуации? Как можно обработать неформализованные знания? Решение таких задач лежит в сфере концептуального анализа знаний.