- •Анализ отдельных слов
- •Анализ отдельных предложений
- •Семантический анализ
- •Заключение
- •Литература
- •Документальные ис.
- •Принцип функционирования ипс.
- •Состав аис.
- •Уровни представления языковых объектов.
- •Основные элементы ипя.
- •Требования к ипя.
- •Типология ипя.
- •Языки предкоординатного типа. Иерархическая классификация.
- •Перечислительные классификации.
- •Фасетные классификации.
- •Посткоординационные ипя.
- •Дескрипторные ипя.
- •Устранение синонимии.
- •Словари лексических единиц.
- •1. Тезаурус.
- •2. Другие виды.
- •Построение словаря дескрипторного языка. Основные характеристики. Анализ и построение словаря дескрипторного языка.
- •Количественные характеристики словарей.
- •Учёт синтагматических отношений.
- •Семантические коды.
- •Системы индексирования.
- •Типы (разновидности) систем индексирования.
- •Подходы к автоматизации индексирования.
- •Системы кодирования.
- •Оценка эффективности поиска.
- •Организация информационных массивов.
- •Стратегии поиска.
- •Элементы теории формальных языков и грамматик Введение.
- •Основные понятия и определения
- •Классификация грамматик и языков по Хомскому
- •Примеры грамматик и языков.
- •Разбор цепочек
- •Преобразования грамматик
- •Задачи.
- •Элементы теории трансляции Введение.
- •Описание модельного языка
- •Лексический анализ
- •О недетерминированном разборе
- •Задачи лексического анализа
- •Лексический анализатор для м-языка
- •Второй этап: по дс пишем программу
- •Задачи.
- •Синтаксический и семантический анализ
- •Метод рекурсивного спуска
- •Void error(); / функция обработки ошибок /
- •О применимости метода рекурсивного спуска
- •Синтаксический анализатор для м-языка
- •О семантическом анализе
- •Семантический анализатор для м-языка
- •Обработка описаний
- •Int declare; /* описан ? 1-"да", 0-"нет" */
- •Void ipush (int I); /* значение I - в стек */
- •Int ipop (void); /* из стека - целое */
- •Контроль контекстных условий в выражении
- •Void spush (char *s); /* значение s - в стек */
- •If (tid [I].Declare) /* описан? */
- •Контроль контекстных условий в операторах
- •Задачи.
- •Генерация внутреннего представления программ
- •Язык внутреннего представления программы
- •Синтаксически управляемый перевод
- •Генератор внутреннего представления программы на м-языке
- •Интерпретатор полиЗа для модельного языка
- •Задачи.
- •Литература
- •Раздел 7 (вопрос 3) Значение когнитивной психологии и структурной лингвистики для автоматизированной обработки текстов на ея
- •Когнитивная лингвистика
- •Когнитивная лингвистика и другие науки
- •Концепция образных схем
- •Концептуальная теория метафоры
- •Формирование когнитивной лингвистики
- •Раздел 7 (вопрос 5) Модель понимания текстов Кинча
- •1.2. Основные положения
- •1.3. Общая характеристика модели
- •Раздел 7 (вопрос 6) Принципы структуризации текстов на основе трансформационной грамматики.
- •Синтактика, семантика и прагматика
- •Знаки и культура
- •Синтагма и парадигма
- •Типы связей между знаком и денотатом
- •Знак. Его значение и смысл
- •Знаковое пространство. Парадигма трех миров
- •Знаковые системы и типы знаков
- •Понятие коннотата
- •Проблема похожести знака на денотат. Ономатопея
- •Случайность и закономерность в знаках и знаковых системах
- •Прагматика – часть семиотики
- •Глава 2. Слова, словари и понятия Слова и словари
- •Акты именования. Семиотические универсалии
- •Треугольник Фреге. Связь между знаком, денотатом и понятием
- •Глава 3. Теория тезауруса Тезаурус. Онтогенез
- •Тезаурус. Определение
- •Популярные тезаурусы и их особенности
- •Теория тезауруса и семиотика
- •Теория тезауруса и информатика
- •Тезаурус. Парадигматика
- •Тезаурусная терминология
- •Популярные тезаурусы и их особенности
- •Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
- •Парадигматика, или правила обращения с текстами
- •Материализация знака. Фактура речи
- •Переход от одной фактуры речи к другой
- •Глава 5. Парадигмы построения эффективных знаковых произведений Общие положения
- •Риторика и ее гуманитарная катастрофа
- •Определение риторики как науки об эффективной деятельности
- •Риторика как прагматика
- •Риторика и логика. Риторика и истина. Образ автора
- •Риторика. Классические парадигмы
- •Понятие риторического изобретения
- •Девиации синтактики и семантики знаков как риторическая парадигма
- •Риторика как технология эффективной деятельности. Теория документа
- •Глава 6. Знаки, люди и законы. Парадигмы их взаимодействия на примере рекламных текстов Американская реклама как сфера общения
- •Коммуникативная структура американской рекламы
- •Авторство и правила обращения с рекламными текстами
- •Роль рекламных текстов в американском обществе
- •Законодательное регулирование рекламной деятельности
- •Законы знакообразования
- •Законодательное регулирование связи знак–денотат в рекламе
- •Прагматика рекламного текста
- •Регулирование собственно рекламной деятельности как производства текстов
- •Рекламоведческие правила
- •Правила сбора информации
- •Синтактика рекламного текста
- •Интеграция с другими типами знаков
- •Прагматический эффект рекламы
- •Реклама – важная часть американской цивилизации
- •Универсальность и прогностический потенциал рекламной парадигмы
- •Нечеткие множества. Основные понятия и определения, подходы к их обработке, операции над нечёткими множествами.
Теория тезауруса и информатика
Зачем нужен тезаурус в информатике? Во-первых – это информационный поиск (ИП). Действительно, если мы ищем что-то в Интернете простейшей «искалкой», то мы найдем только те тексты, которые включают в себя заданные в запросе ключевые слова. Можно представить, что я ищу информацию о цветах. Мой запрос принесет мне тексты с этим словом. А теперь представим себе, что есть нужные мне тексты о розах или гвоздиках, в которых ни разу не встречается слово «цветы». Тогда эти тексты никогда не будут найдены, несмотря на любые увеличения скорости процессора. Если же данный запрос пропустить через простейший тезаурус, то он развернет поисковое слово в необходимых подробностях, опустившись на один уровень ниже в денотатной структуре. То есть в данном случае запрос может быть автоматически расширен – в него могут быть добавлены наименования разных цветов, и поиск будет вестись по всем этим названиям. Понятно, что результаты такого поиска будут гораздо более полными.
Во-вторых, зачем нужен тезаурус? Как уже говорилось выше, это интеграция знаний и повышение эффективности трудовой деятельности за счет оптимизации процесса коммуникации. Все денотаты любого вида деятельности могут быть сведены в понятную пользователю структуру, в которой он легко находит нужное ему значение слова, затем его название и пользуется им.
Тезаурус. Парадигматика
Как указывалось выше, тезаурус – это прежде всего стуктурированный мир денотатов какого-либо вида деятельности. Чаще всего – это иерархическая классификация. Она нужна, чтобы найти сначала нужный денотат, а затем его знак. Действительно, если я вижу гайку и не знаю, как она называется даже на моем родном языке, тезаурус предлагает мне такую схему поиска по дереву: гайка – это идея или материальная сущность. Затем: гайка – это природой созданный предмет или создан человеком и т.д. Мы движемся по дереву, пока не достигнем своего денотата, а потом видим, как он называется.
Поэтому для любой словарной статьи тезауруса нужно указать, в какие более общие понятия, конструкции и т.п. интегрируется описываемый ею объект (денотат), т.е., где вышестоящая обобщающая статья. Аналогичное рассуждение справедливо и в обратную сторону. Эта стройная иерархическая классификация дополняется перекрестными связями самого разного рода – чаще всего синонимическими или антонимическими, различного рода ассоциативными связями. Так реализуются тезаурусные функции, описывающие семантические связи между денотатами.
Тезаурусная терминология
Навигация по денотатной структуре тезауруса и семантические связи между денотатами описываются англоязычной терминологией. Даже на английском – современной имперской латыни – тезаурусная терминология содержит два наиболее употребительных синонимических набора терминов – один с более научным уклоном, другой – с более практическим или техническим предназначением.
Разберем наиболее употребительные из них. Так, вышестоящий термин по отношению к текущей словарной статье называется гиперонимом (hyperonym). Но в информатике (в частности, в программной системе, позволяющей реализовать свой тезаурус MULTITES) этот термин называется BT – Broader Term (как бы более широкий термин). Для денотата «дерево» гиперонимом будет «растение»
И наоборот, нижележащий термин соответственно – гипоним (hyponym), или его программно-технический синоним называется NT (Narrower Term). Для нашего примера с деревом это будут денотаты «ель», «береза» и т.д. Более подробно данная терминология описана на сайте MULTITES.