- •Тема 2. Базовые понятия и методы структурирования знаний в системе информационной аналитики
- •Базовые понятия
- •Структурирование знаний
- •Система понятий
- •Текстологический метод
- •Метод формирования перечня понятий
- •Метод составления оглавления учебника
- •Семантические отношения
- •Метод свободных ассоциаций
- •«Сортировка карточек»
- •«Обнаружение регулярностей»
- •Стратегии принятия решений
Тема 2. Базовые понятия и методы структурирования знаний в системе информационной аналитики
Прежде чем переходить к изучению основных систем и методов аналитической обработки информации следует определиться с системой понятий, с которыми мы будем работать в дальнейшем.
Базовые понятия
Обратите внимание на тот факт, что, говоря об информационной деятельности и информационном сервисе, мы постоянно оперируем понятиями информация, данные, знания, документ.
Давайте определимся с этими понятиями, так как вся наша работа будет связана именно с ними.
Основным объектом нашей деятельности будет документ.
Документ (лат. documentum - свидетельство, способ доказательства) – это любой материальный носитель сведений с записанной на нем информацией, предназначенной для ее передачи во времени и пространстве.
Т.е. документ представляет собой материальный носитель, предназначенный для передачи информации. Можно сказать и по-другому:
Документ – это информация, зафиксирована в виде текста, звукозаписи, изображения или их сочетания и предназначенная для передачи во времени и пространстве.
Документы различаются по целевому назначению, по структуре, по периодичности, по характеру информации и т.д.
Мы видим, что документ определяется через понятие информации. Вспомним, что это такое. Мы говорили об определении информации, данном в кибернетике через понятие отражения. К этому следует добавить и то, что информация не может существовать без физического носителя. Тогда можно сказать, что:
Информация - в наиболее общем определении - это отражение предметного мира с помощью знаков и сигналов.
Следовательно, у нас появляются такие цепочки понятий:
Предметный мир + отражение = Информация
Информация + материальный носитель = Документ
Информацию, полученную путем измерения, наблюдения, логических или арифметических операций, и представленную в форме, пригодной для постоянного хранения, передачи и (автоматизированной) обработки называют данными.
Данные – это информация, представленная в формализованном виде, что обеспечивает возможность её хранения, автоматической обработки и передачи, в частности, с помощью технических средств.
Информация + формализация = Данные
Данные бывают простые и сложные. Данные простого типа это - символы, числа и т.п. элементы, дальнейшее дробление которых не имеет смысла. Из элементарных данных формируются структуры (сложные типы) данных (матрицы, множества и т.п.)
Знания – это информация, необходимая для принятия решений, т.е. истинная, достоверная, проверенная практикой информация.
Информация + проверка истинности = Знания
Естественно, что для принятия различных решений может понадобиться и разная информация. Поэтому говорят о различных видах знаний. Рассмотрим некоторые из них.
Знания делят на факты и эвристики, глубинные и поверхностные, жесткие и мягкие.
Факты указывают на хорошо известные обстоятельства.
Эвристики основываются на индивидуальном опыте специалиста.
Глубинные знания отражают понимание сути явления, назначение и взаимосвязь его составляющих (это законы и теоретические основания).
Поверхностные знания представляют знания, полученные из опыта, внешние эмпирические ассоциации с каким-либо явлением.
Жесткие знания позволяют получать однозначные четкие результаты при заданных начальных условиях.
Мягкие знания допускают множественные, нечеткие решения, допускающие различные варианты.
Задачи с преобладанием глубинных и мягких знаний называют трудно формализуемыми. Для них характерны следующие особенности:
задача не может быть определена в числовой форме (требуется символьное представление),
алгоритмическое решение задачи не известно (хотя, возможно, и существует),
цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачи.
Современная наука все чаще обращает свой взор на решение именно таких задач. Но как действовать в такой ситуации? Как можно обработать неформализованные знания? Решение таких задач лежит в сфере концептуального анализа знаний.