
- •Р. С. Гиляревский основы информатики Курс лекций
- •Содержание
- •Вводная лекция Информатика как научная дисциплина
- •Становление информатики
- •Предмет и объекты исследования
- •Информатика и другие науки и научные дисциплины
- •Информация – знание – наука
- •Информация и данные
- •Свойства информации
- •Структура информации
- •Особенности информации
- •Информация научная и техническая
- •Наука как социальное явление
- •Р. Мертон
- •М. Поланьи
- •К. Поппер
- •Перспективы развития науки
- •Интеллектуальная коммуникация Основные понятия
- •Система научной коммуникации
- •Библиотечная и информационная деятельность
- •Научно-информационная деятельность
- •Этапы и задачи коммуникации
- •Информационное обслуживание
- •Перспективы развития
- •Человек в процессе коммуникации Потребители информации
- •Эгалитарность информационного обслуживания
- •Информационные потребности в развитии
- •Литература как источник информации Основные понятия, эволюция и типология
- •Закономерности роста и старения
- •Закон рассеяния
- •Перспективы развития
- •Информационные издания и услуги Основные виды
- •Реферирование и библиографирование
- •Реферативный журнал винити
- •Зарубежные реферативные журналы
- •Электронная информация и базы данных
- •Сети передачи и средства хранения и обработки данных
- •Информационные услуги
- •Информационные структуры и инфраструктура
- •Информационный поиск Предыстория и сущность
- •Процедуры и понятия
- •Координатное индексирование
- •Цитирование, библиографическое сочетание, социтирование
- •Цитирующие документы
- •Цитируемые документы
- •Иерархические и фасетные классификации
- •Рубрикаторы информационных изданий
- •Разные типы информационно-поисковых языков
- •Базы и банки данных
- •Информационные системы Информационно-поисковые системы
- •Интеллектуальные информационные системы
- •Гипертекстовые системы Возникновение и развитие идеи гипертекста
- •Логико-смысловой граф и логика связности
- •Гипертекст как развитие функций чтения и письма
- •Отечественные гипертекстовые системы гиперлог и семпро
- •Системы гипермедиа как развитие гипертекста
- •Системы машинного перевода
- •Информационная технология о понятии информационной технологии
- •Тенденции развития информационных технологий
- •Влияние информационных технологий на развитие науки
- •Социальные последствия новой технологии
- •Компьютерные средства коммуникации Электронные вычислительные машины
- •Новые поколения компьютеров
- •Персональный компьютер и персональные вычисления
- •Работа с текстом на компьютере о языках программирования
- •Прикладные программы подготовки текстов
- •"Понимание" текста на естественном языке
- •Электронная книга Новая концепция книги
- •Сущность, особенности и разновидности электронной книги
- •Электронный журнал: проблемы распространения и хранения
- •Организационные и юридические проблемы
- •Электронная библиотека реальная и виртуальная
- •Лучше ли электронная книга традиционной печатной? Доводы за электронную книгу
- •Доводы против электронной книги
- •Заменит ли электронная книга бумажную?
- •Сведения об Интернет Интернет как глобальная компьютерная сеть
- •Организация доступа к первоисточникам Научно-техническая информация
- •Политическая информация
- •Новости и литература в электронной форме
- •Развлекательная и бытовая информация
- •Образование
- •Музеи, галереи и художественные выставки
- •Информация по Интернет
- •Заключительная лекция Идеи и методы информатики
- •Поиски фундаментального закона
- •Определение и предметная область информатики
- •Перспективы информатики
- •Словарь терминов
Цитирующие документы
E F
Библиографическое
сочетание
Цитирование
A B C D
Социтирование
Цитируемые документы
Рис. 10. Схема цитирования, социтирования и библиографического сочетания документов
Понимание потенциальных возможностей комплексирования документов по признаку общих ссылок и стремление максимально использовать накопленный массив в машиночитаемой форме повели к поискам новых путей применения метода цитирования. Еще в 1963 г. М. Кесслер в Массачусетском технологическом институте предложил считать связанными по смыслу документы, авторы которых ссылаются на одни и те же работы, а числом совпадающих ссылок измерять степень такой связанности. Этот метод, который он назвал библиографическим сочетанием документов, долгое время не имел широкого практического применения, но в 1968 г. Ю. Гарфилд использовал его для создания ретроспективной поисковой системы на компакт‑дисках.
По-другому подошли к этой проблеме сотрудник Института научной информации США Г. Смолл и тогдашняя аспирантка ВИНИТИ И. В. Маршакова. Они одновременно и независимо друг от друга в 1972 г. предложили считать связанными по смыслу и тематике работы, на которые совместно ссылаются авторы нескольких документов. Этот метод, чаще всего называемый социтированием, имеет другую коммуникационную основу. В каждой исследовательской области имеется некоторый набор важных работ, отражающих познавательную основу этой области. Данные работы цитируются многими исследователями и поэтому принадлежат к числу высоко цитируемых. Больше того, они часто цитируются вместе, образуя таким образом социтирование. Другими словами, социтированием принято называть одновременное упоминание любых двух или большего числа публикаций в какой-либо последующей.
Для лучшего представления разницы в этих методах выше приведена схема, на которой E и F являются цитирующими документами текущего года, а A, B, C и D – цитируемыми документами более ранних годов. Сплошными стрелками показаны связи по цитированию, т. е. E цитирует A, B и C, а F цитирует B, C и D . Тогда между цитирующими работами E и F образуется библиографическое сочетание, а между цитируемыми работами B и C – социтирование (обозначено пунктиром). Для простоты и наглядности степень связанности на схеме минимальная, хотя на практике она значительно больше (т. е. для признания библиографического сочетания между двумя работами или кластера социтирования в каждом отдельном случае устанавливается определенный минимальный порог, который тем выше, чем интенсивнее цитирование).
Между характером этих методов установления связи и областью их применения имеется существенная разница. Библиографическое сочетание – это однократно произошедший факт, поскольку E и F были однажды опубликованы со своими ссылками, и с ними в дальнейшем ничего уже произойти не может. Именно поэтому данный метод применяется для ретроспективного поиска документов, связанных между собой единством тематики, исследовавшейся их авторами.
Совсем по-другому обстоит дело с социтированием, так как связь между цитируемыми B и C может сохраняться (увеличиваться или уменьшаться) в последующие годы в зависимости от того, насколько часто они будут попарно цитироваться в новых работах. Частое социтирование указывает на их концептуальную близость, поскольку они используются как единый комплекс. Между этими работами как бы возникают невидимые связи, которые после наглядного их выражения образуют смысловые сгустки (кластеры). Совокупность таких кластеров ключевых работ, отражающих исследовательские области, представляют собой как бы карту определенной научной области, а совокупность карт – атлас науки на данный момент.
При регулярном выпуске подобных атласов (выходили атласы по биологии, биохимии, геологии, математике, вычислительной технике) появляется возможность регулярно следить за динамикой развития научных дисциплин, школ, направлений, коллективов, а, следовательно, и целенаправленно воздействовать на это развитие, т. е. управлять им. Методы библиографического сочетания и кластеризации социтирования моделируют содержательные отношения между документами, используя практику цитирования, сложившуюся при публикации научных работ. Но это не единственный возможный подход к установлению таких связей между документами, заложенных в их библиографических элементах и фрагментах текстов. В следующей лекции об информационных системах вы познакомитесь с методом логико-смыслового моделирования, а теперь мы перейдем к более традиционным видам информационно-поисковых языков.