- •Анализ отдельных слов
- •Анализ отдельных предложений
- •Семантический анализ
- •Заключение
- •Литература
- •Документальные ис.
- •Принцип функционирования ипс.
- •Состав аис.
- •Уровни представления языковых объектов.
- •Основные элементы ипя.
- •Требования к ипя.
- •Типология ипя.
- •Языки предкоординатного типа. Иерархическая классификация.
- •Перечислительные классификации.
- •Фасетные классификации.
- •Посткоординационные ипя.
- •Дескрипторные ипя.
- •Устранение синонимии.
- •Словари лексических единиц.
- •1. Тезаурус.
- •2. Другие виды.
- •Построение словаря дескрипторного языка. Основные характеристики. Анализ и построение словаря дескрипторного языка.
- •Количественные характеристики словарей.
- •Учёт синтагматических отношений.
- •Семантические коды.
- •Системы индексирования.
- •Типы (разновидности) систем индексирования.
- •Подходы к автоматизации индексирования.
- •Системы кодирования.
- •Оценка эффективности поиска.
- •Организация информационных массивов.
- •Стратегии поиска.
- •Элементы теории формальных языков и грамматик Введение.
- •Основные понятия и определения
- •Классификация грамматик и языков по Хомскому
- •Примеры грамматик и языков.
- •Разбор цепочек
- •Преобразования грамматик
- •Задачи.
- •Элементы теории трансляции Введение.
- •Описание модельного языка
- •Лексический анализ
- •О недетерминированном разборе
- •Задачи лексического анализа
- •Лексический анализатор для м-языка
- •Второй этап: по дс пишем программу
- •Задачи.
- •Синтаксический и семантический анализ
- •Метод рекурсивного спуска
- •Void error(); / функция обработки ошибок /
- •О применимости метода рекурсивного спуска
- •Синтаксический анализатор для м-языка
- •О семантическом анализе
- •Семантический анализатор для м-языка
- •Обработка описаний
- •Int declare; /* описан ? 1-"да", 0-"нет" */
- •Void ipush (int I); /* значение I - в стек */
- •Int ipop (void); /* из стека - целое */
- •Контроль контекстных условий в выражении
- •Void spush (char *s); /* значение s - в стек */
- •If (tid [I].Declare) /* описан? */
- •Контроль контекстных условий в операторах
- •Задачи.
- •Генерация внутреннего представления программ
- •Язык внутреннего представления программы
- •Синтаксически управляемый перевод
- •Генератор внутреннего представления программы на м-языке
- •Интерпретатор полиЗа для модельного языка
- •Задачи.
- •Литература
- •Раздел 7 (вопрос 3) Значение когнитивной психологии и структурной лингвистики для автоматизированной обработки текстов на ея
- •Когнитивная лингвистика
- •Когнитивная лингвистика и другие науки
- •Концепция образных схем
- •Концептуальная теория метафоры
- •Формирование когнитивной лингвистики
- •Раздел 7 (вопрос 5) Модель понимания текстов Кинча
- •1.2. Основные положения
- •1.3. Общая характеристика модели
- •Раздел 7 (вопрос 6) Принципы структуризации текстов на основе трансформационной грамматики.
- •Синтактика, семантика и прагматика
- •Знаки и культура
- •Синтагма и парадигма
- •Типы связей между знаком и денотатом
- •Знак. Его значение и смысл
- •Знаковое пространство. Парадигма трех миров
- •Знаковые системы и типы знаков
- •Понятие коннотата
- •Проблема похожести знака на денотат. Ономатопея
- •Случайность и закономерность в знаках и знаковых системах
- •Прагматика – часть семиотики
- •Глава 2. Слова, словари и понятия Слова и словари
- •Акты именования. Семиотические универсалии
- •Треугольник Фреге. Связь между знаком, денотатом и понятием
- •Глава 3. Теория тезауруса Тезаурус. Онтогенез
- •Тезаурус. Определение
- •Популярные тезаурусы и их особенности
- •Теория тезауруса и семиотика
- •Теория тезауруса и информатика
- •Тезаурус. Парадигматика
- •Тезаурусная терминология
- •Популярные тезаурусы и их особенности
- •Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
- •Парадигматика, или правила обращения с текстами
- •Материализация знака. Фактура речи
- •Переход от одной фактуры речи к другой
- •Глава 5. Парадигмы построения эффективных знаковых произведений Общие положения
- •Риторика и ее гуманитарная катастрофа
- •Определение риторики как науки об эффективной деятельности
- •Риторика как прагматика
- •Риторика и логика. Риторика и истина. Образ автора
- •Риторика. Классические парадигмы
- •Понятие риторического изобретения
- •Девиации синтактики и семантики знаков как риторическая парадигма
- •Риторика как технология эффективной деятельности. Теория документа
- •Глава 6. Знаки, люди и законы. Парадигмы их взаимодействия на примере рекламных текстов Американская реклама как сфера общения
- •Коммуникативная структура американской рекламы
- •Авторство и правила обращения с рекламными текстами
- •Роль рекламных текстов в американском обществе
- •Законодательное регулирование рекламной деятельности
- •Законы знакообразования
- •Законодательное регулирование связи знак–денотат в рекламе
- •Прагматика рекламного текста
- •Регулирование собственно рекламной деятельности как производства текстов
- •Рекламоведческие правила
- •Правила сбора информации
- •Синтактика рекламного текста
- •Интеграция с другими типами знаков
- •Прагматический эффект рекламы
- •Реклама – важная часть американской цивилизации
- •Универсальность и прогностический потенциал рекламной парадигмы
- •Нечеткие множества. Основные понятия и определения, подходы к их обработке, операции над нечёткими множествами.
Устранение синонимии.
В целях устранения синонимии в списках, отобранных для ИПЯ ключевых слов, осуществляется группировка этих ключевых слов по смысловому признаку. Таким образом формируются классы, называемые семантическими рядами. В каждом классе выделяют один доминантный термин и его именем называют класс. Все слова, входящие в этот класс будут определяться как синонимы доминанта.
При такой обработке состав каждого класса различен, так как в языке абсолютной эквивалентности не существует не существует понятия абсолютных синонимов при построении дескрипторов языка используют принцип условной эквивалентности (близкие по значению термины).
Каждый класс – класс условной эквивалентности, доминанта такого класса отражает главное значение всех слов и словосочетаний класса, называется дескриптором дескриптор предназначен для координатного индексирования документов и запросов. Нормативные ключевые слова отобраны из основного словарного состава ИПЯ, у которого искусственно устранены все проявления многозначности.
Дескрипторный язык – язык, словарный состав которого состоит из дескрипторов, а грамматика – способ построения ПОДов и ПОЗов путём координации дескрипторов (степень координации может быть различной). Перечень лексических единиц дескрипторного языка задаётся словарём лексических единиц. В состав ИПЯ входит правило применения ИПЯ (грамматика), определяющая процедуру индексирования (используемые единицы для описания документа и запроса), а также правило построения и ведения языка, при помощи которого вносят изменения и усовершенствования в язык.
В общем случае, в словарь лексических единиц могут входить как дескрипторы (узаконенные единицы), так и ключевые слова (полнозначное слово или словосочетание, выражающее определённый аспект документа или запроса), хотя они и не имеют права присутствовать в поисковом образе, их помещают в словарь.
Словари лексических единиц.
1. Тезаурус.
Это самый полный и совершенный вид лексического словаря. Это нормативный словарь-справочник, который содержит дескрипторы и ключевые слова в алфавитном порядке, предназначенные для координатного индексирования документов и запросов.
Характерные особенности: учтены парадигматические отношения (так как тезаурус состоит из дескрипторов), устранена синонимия.
Тезаурусы разнообразны:
-
по назначению и по составу (тематическая направленность)
-
включающие только дескрипторы или ещё и ключевые слова (аскрипторы)
-
по составу справочно-поискового материала.
К каждому тезаурусу разрабатывается ряд дополнительных входов – множество лексических единиц.
Общая характеристика: Упорядоченные по алфавиту дескрипторы (и ключевые слова), каждый дескриптор представлен словарной статьёй дескриптора. Каждая словарная статья дескриптора строится по строго определённому алфавитно-структурному типу. Каждую статью определяет заглавный дескриптор, в неё входят 4 множества лексических единиц.
Di=<Mi1 Mi2 Mi3 Mi4>, где
М1 – множество упорядоченных по алфавиту условных синонимов дескрипторов
М2 – множество упорядоченных по алфавиту дескрипторов, каждый из которых связан с заглавным отношениями род-вид
М3 – то же, но вид-род
М4 – множество упорядоченных по алфавиту дескрипторов, каждый из которых связан с заглавным по крайней мере одним прочным парадигматическим отношением (ассоциативная связь, часть-целое и т.д.).
Если включаются ключевые слова, то у ключевого слова нет статьи, но каждое ключевое слово снабжено ссылкой, позволяющей перейти к дескриптору, наиболее близкому по смыслу к ней. Назначение ключевых слов – увеличение числа входов и они также позволяют перейти к дескриптору.
В состав тезауруса также входит ряд справочных элементов. К ним чаще всего относят следующие.
1. Систематический указатель дескрипторов – совокупность алфавитных списков дескрипторов, причем каждый относится к некоторой рубрике в иерархической классификации для определённой научной области. В них сначала по алфавиту перечислены темы, а потом – дескрипторы. Таким образом возможно вычислить всю лексику по определённой теме. В таком указателе дескрипторы могут входить в несколько разделов. Данный указатель обычно рекомендуют тем, кто детально не знаком с тематикой. Поиск меньше – эффективность – больше.
2. Указатель иерархических отношений содержит свод классификационных иерархических деревьев, построенных на основе аналогичных связей между дескрипторами. Чаще всего он содержит граф или список с точками. Эти указатели удобны как средство контроля при ведении тезауруса, его пополнения, так как легко выявить противоречивые связи между терминами. Он удобен для тех, кто ориентируется в предметной области только на основе общих терминов предметной области, так как есть возможность уточнения термина. Его легко построить на компьютере.
3. Пермутационный указатель - особый вид алфавитного указателя, который предназначен для обеспечения удобного доступа к любой компоненте лексической единицы (КВИК и КВОК). Он может быть построен автоматически путём обработки заглавных дескрипторов.