Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
АПСИ НОВОЕ.doc
Скачиваний:
24
Добавлен:
18.11.2018
Размер:
436.22 Кб
Скачать

27. Классификационные ипя, применяемые в россии. Зарубежные классификационные ипя.

Информационно-поисковые каталоги, основанные на классификации сведений по определенной предметной области, были первыми системами информационного поиска документов.

Классификация — это группировка объектов по признакам.

Первоначальные подходы к классификации тематики документов основывались на формировании списка предметных заголовков, располагаемых в алфавитном порядке. Каждая предметная рубрика получала определенный цифровой или буквенно-цифровой код. Содержание документа индексировалось перечислением кодов тех рубрик, которые отражали темы документа. Это перечислительная классификация.

Особенностью систем перечислительной классификации является возможность индексирования документов любым количеством рубрик, отражающих содержание документа. Для осуществления поиска необходимых документов по классификатору определяются коды интересующих пользователя рубрик и далее отбираются из хранилища те документы, которые проиндексированы соответствующими кодами. Отсутствие систематизированных связей и отношений между предметными рубриками является основным недостатком перечислительной классификации.

При систематизированной классификации список предметных рубрик строится как иерархическая структура, в виде перевернутого дерева. Вся предметная область разбивается на ряд взаимоисключающих (непересекающихся) рубрик. Каждая рубрика, в свою очередь, может включать несколько подрубрик. Таким образом, при систематизированной классификации учитываются уже некоторые семантические основы предметной области, выражаемые в родо-видовых отношениях основных категорий, понятий и классов.

Содержание документа индексируется кодами соответствующих рубрик, однако при этом отпадает необходимость в явном указании

более общих рубрик, к которым относятся выделенные подрубрики. В результате индексирование и поиск документов на основе иерархической классификации позволяют более адекватно отражать содержание документов и обеспечивают большую точность поиска.

Перечислительный и иерархический подходы к классификации используются в алфавитно-предметных каталогах библиотек. Недостатком как перечислительной, так и иерархической классификации является принципиальная невозможность заранее перечислить все возможные темы документов.

Фасетная классификация не связана подобными ограничениями. Ее идея состоит в том, что вся предметная область разбивается на ряд исходных рубрик — фасет — по семантическому принципу, отражающему специфику предметной области.

Фасеты выступают в роли элементов, из которых можно сконструировать любую, даже самую сложную и узкую предметную рубрику. Внутри фасет предметные рубрики строятся и упорядочиваются по алфавитно-иерархическому принципу .

Основное достоинство фасетной классификации заключается в возможности небольшим перечнем фасетных рубрик отразить большое количество специализированных рубрик и тем самым наиболее точно и полно проиндексировать содержание документов.

35 – 41 АННОТИРОВАНИЕ И РЕФЕРИРОВАНИЕ ДОКУМЕНТОВ

Любой специалист должен иметь устойчивые навыки работы (обработки) с текстами. При этом, конечно, можно говорить об умении пользоваться всеми информационными процессами. Наиболее важным и трудным в рассматриваемом случае является процедура, включающая одновременно несколько информационных процессов, нацеленная на определённый способ переработки текста, позволяющий без искажений содержания (сущности) документа-источника получить из него вторичный документ в сжатом (свёрнутом) виде. Такая деятельность определяется как аннотирование и реферирование, а применяемый способ – аналитико-синтетическая переработка.

Дадим определение этим понятиям.

Аннотация (лат. «аnnatatiо» – замечание) – краткая характеристика документа (или совокупности документов), раскрывающая его содержание, вид, структуру, назначение и другие особенности.

Она является разновидностью информационного свертывания в результате аналитико-синтетической переработки документа, вторичным документом и используется в частности в библиотечном деле. Аннотация может быть элементом библиографической записи, оформления публикации материалов и др. Отмечается, что в среднем аннотация должна содержать от 150 до 200 знаков [БЭ].

Массовым традиционным аналитическим информационным процессом считается преобразование извлечённых сведений в краткий (примерно до 1500 символов) текст реферата.

Реферат по латыни «Refere» означает – докладываю, сообщаю. По реферату обычно можно легко и быстро установить необходимость для пользователя, описанного в нём документа.

Реферат является одной из самых древних информационных технологий сжатия информации. В России первую инструкцию по реферированию составил М.В. Ломоносов5. В ней он определил общие процессы документооборота в Академии наук России и разработал требования подготовки сжатого текста – реферата.

Как было сформулировано в России в 1950-е годы: «реферат выражает центральную тему или предмет публикации, но имеет объём не превышающий 3% объёма исходного текста». И ранее и ныне используются различные варианты реферирования. В конце прошлого столетия систематизация компонентов реферата вошла в состав ГОСТ 7.9-95 СИБИД «Реферат и аннотация. Общие требования». В нём даны рассматриваемые далее общие определения.

Реферат – это краткое и точное изложение содержания документа, включающее основные фактические сведения и выводы, без дополнительной интерпретации или критических замечаний автора реферата (согласно ГОСТ 7.9-95).

Отметим, что целью реферирования является включение наибольшего количества информации в ограниченный объём. Специалисты выделяют различные виды рефератов: перевод, рецензия, иллюстрация, таблица, фрагмент и др.6.

Сводный реферат – это реферат, составленный на основе двух и более исходных документов (ГОСТ 7.9-95). При этом результаты поиска в отдельных документах группируются, как правило, по категориям.

Реферирование можно охарактеризовать как:

1) разновидность свертывания информации;

2) процесс аналитико-синтетической переработки информации, результатами которого являются различного рода рефераты.

Реферирование делится на два типа – вторичное (сжатое) документирование и обзорная деятельность в рамках заданной тематики.

Примером первого процесса может быть составление автореферата диссертации, а второго – вводной части диссертации, подразумевающей ознакомление с множеством работ по разрабатываемой теме. При этом обзорное реферирование зачастую сводится к процессу реферирования каждого из источников, представляющих интерес для исследования, и сведению результатов в обзорный реферат.

Вторичное документирование определённого текста позволяет выявлять ключевые его фрагменты и устанавливать между ними структурные связи. Результат такой работы представляет интерес с точки зрения возможности оперативного ознакомления с содержанием объёмных текстов по документу (реферату), полученному в процессе вторичного кодирования (информационного сжатия). Его можно использовать для перевода в более структурированный вид слабо упорядоченных материалов текстов.

В ГОСТ 7.9-95 (см. Приложение) указано, что реферат документа должен включать в себя:

предмет, тему и цель работы;

метод и методологию проведения работы;

результат работы;

область применения результатов;

выводы;

дополнительную информацию.

Там же отмечается, что «предмет, тему и цель работы указывают в том случае, если они не ясны из заглавия документа» (п. 5.1.2), а «метод и методологию проведения работы описывают в случае, когда они отличаются новизной или представляют интерес с точки зрения данной работы (п. 5.1.3). При этом область применения результатов указывается только для патентных документов (п. 5.1.5), а дополнительная информация главным образом используется для характеристики данных, не связанных с основной темой исследования, но имеющих значение (п. 5.1.7).

В ГОСТ 7.9-95 так же говорится, что текст реферата должен отличаться лаконичностью, чёткостью, убедительностью формулировок, отсутствием второстепенной информации (п. 5.2.2.). В нём следует использовать значимые слова из текста исходного документа для обе6спечения автоматизированного поиска (п. 5.2.6).

Как видно, данный ГОСТ достаточно полно выдвигает требования к тому «что?» должно быть отражено в реферате. Однако в нём, а также во многих, порождённых им отраслевых инструкциях, практически отсутствует «как?» провести анализ рассматриваемого (исследуемого) документа, чтобы обеспечить выполнение указанных в ГОСТе требований.

Реферирование относятся к узкопрофессиональной информационно-аналитической деятельности. При этом в учебно-научной, научной и научно-практической, а также профессиональной деятельности специалистам и обучающимся достаточно часто приходится не только пользоваться рефератами, но и самим их создавать, что характеризует потребность индивидов формализовать определённые аспекты творческого процесса.

Так, например, студентам при подготовке курсовых и дипломных работ, а аспирантам и докторантам при проведении соответствующих научных исследований приходится использовать большое количество документов-источников, переработка которых приводит к созданию собственных материалов. Зачастую студентов обязывают исследовать заданный документ или документы по определённой теме, представив выполненную работу в форме реферата или эссе.

Ныне практически все письменные работы выполняются студентами на компьютерах. Аспиранты и диссертанты перед защитой своих работ обязаны опубликовать их в сжатой форме, то есть в виде автореферата.

Автореферат – это реферат произведения, созданный его автором.

Наиболее распространённый его вид – автореферат диссертации, в котором излагаются основные положения исследования, представленного к защите на соискание ученой степени кандидата или доктора наук. Существуют рекомендации по подготовке различных видов научных и научно-исследовательских работ. Так, на сайте Московской финансово-промышленной академии (http//:www.mifp.ru) представлены материалы под названием «Введение в научное исследование».

В 1980-е годы в нашей стране появляются типовые структуры рефератов (TCP), потребность в которых остро ощущалась в частности при подготовке реферативных журналов (РЖ) в ВИНИТИ. По оценке специалистов этой организации, нарастающие массивы необходимой для обработки информации вызвали появление информационных перегрузок как у работников ВИНИТИ и аналогичных организаций, так и у пользователей. Последнее обстоятельство приводило к неадекватному восприятию информации и грубым ошибкам в процессе принятия решений.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]