
- •Анализ отдельных слов
- •Анализ отдельных предложений
- •Семантический анализ
- •Заключение
- •Литература
- •Документальные ис.
- •Принцип функционирования ипс.
- •Состав аис.
- •Уровни представления языковых объектов.
- •Основные элементы ипя.
- •Требования к ипя.
- •Типология ипя.
- •Языки предкоординатного типа. Иерархическая классификация.
- •Перечислительные классификации.
- •Фасетные классификации.
- •Посткоординационные ипя.
- •Дескрипторные ипя.
- •Устранение синонимии.
- •Словари лексических единиц.
- •1. Тезаурус.
- •2. Другие виды.
- •Построение словаря дескрипторного языка. Основные характеристики. Анализ и построение словаря дескрипторного языка.
- •Количественные характеристики словарей.
- •Учёт синтагматических отношений.
- •Семантические коды.
- •Системы индексирования.
- •Типы (разновидности) систем индексирования.
- •Подходы к автоматизации индексирования.
- •Системы кодирования.
- •Оценка эффективности поиска.
- •Организация информационных массивов.
- •Стратегии поиска.
- •Элементы теории формальных языков и грамматик Введение.
- •Основные понятия и определения
- •Классификация грамматик и языков по Хомскому
- •Примеры грамматик и языков.
- •Разбор цепочек
- •Преобразования грамматик
- •Задачи.
- •Элементы теории трансляции Введение.
- •Описание модельного языка
- •Лексический анализ
- •О недетерминированном разборе
- •Задачи лексического анализа
- •Лексический анализатор для м-языка
- •Второй этап: по дс пишем программу
- •Задачи.
- •Синтаксический и семантический анализ
- •Метод рекурсивного спуска
- •Void error(); / функция обработки ошибок /
- •О применимости метода рекурсивного спуска
- •Синтаксический анализатор для м-языка
- •О семантическом анализе
- •Семантический анализатор для м-языка
- •Обработка описаний
- •Int declare; /* описан ? 1-"да", 0-"нет" */
- •Void ipush (int I); /* значение I - в стек */
- •Int ipop (void); /* из стека - целое */
- •Контроль контекстных условий в выражении
- •Void spush (char *s); /* значение s - в стек */
- •If (tid [I].Declare) /* описан? */
- •Контроль контекстных условий в операторах
- •Задачи.
- •Генерация внутреннего представления программ
- •Язык внутреннего представления программы
- •Синтаксически управляемый перевод
- •Генератор внутреннего представления программы на м-языке
- •Интерпретатор полиЗа для модельного языка
- •Задачи.
- •Литература
- •Раздел 7 (вопрос 3) Значение когнитивной психологии и структурной лингвистики для автоматизированной обработки текстов на ея
- •Когнитивная лингвистика
- •Когнитивная лингвистика и другие науки
- •Концепция образных схем
- •Концептуальная теория метафоры
- •Формирование когнитивной лингвистики
- •Раздел 7 (вопрос 5) Модель понимания текстов Кинча
- •1.2. Основные положения
- •1.3. Общая характеристика модели
- •Раздел 7 (вопрос 6) Принципы структуризации текстов на основе трансформационной грамматики.
- •Синтактика, семантика и прагматика
- •Знаки и культура
- •Синтагма и парадигма
- •Типы связей между знаком и денотатом
- •Знак. Его значение и смысл
- •Знаковое пространство. Парадигма трех миров
- •Знаковые системы и типы знаков
- •Понятие коннотата
- •Проблема похожести знака на денотат. Ономатопея
- •Случайность и закономерность в знаках и знаковых системах
- •Прагматика – часть семиотики
- •Глава 2. Слова, словари и понятия Слова и словари
- •Акты именования. Семиотические универсалии
- •Треугольник Фреге. Связь между знаком, денотатом и понятием
- •Глава 3. Теория тезауруса Тезаурус. Онтогенез
- •Тезаурус. Определение
- •Популярные тезаурусы и их особенности
- •Теория тезауруса и семиотика
- •Теория тезауруса и информатика
- •Тезаурус. Парадигматика
- •Тезаурусная терминология
- •Популярные тезаурусы и их особенности
- •Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
- •Парадигматика, или правила обращения с текстами
- •Материализация знака. Фактура речи
- •Переход от одной фактуры речи к другой
- •Глава 5. Парадигмы построения эффективных знаковых произведений Общие положения
- •Риторика и ее гуманитарная катастрофа
- •Определение риторики как науки об эффективной деятельности
- •Риторика как прагматика
- •Риторика и логика. Риторика и истина. Образ автора
- •Риторика. Классические парадигмы
- •Понятие риторического изобретения
- •Девиации синтактики и семантики знаков как риторическая парадигма
- •Риторика как технология эффективной деятельности. Теория документа
- •Глава 6. Знаки, люди и законы. Парадигмы их взаимодействия на примере рекламных текстов Американская реклама как сфера общения
- •Коммуникативная структура американской рекламы
- •Авторство и правила обращения с рекламными текстами
- •Роль рекламных текстов в американском обществе
- •Законодательное регулирование рекламной деятельности
- •Законы знакообразования
- •Законодательное регулирование связи знак–денотат в рекламе
- •Прагматика рекламного текста
- •Регулирование собственно рекламной деятельности как производства текстов
- •Рекламоведческие правила
- •Правила сбора информации
- •Синтактика рекламного текста
- •Интеграция с другими типами знаков
- •Прагматический эффект рекламы
- •Реклама – важная часть американской цивилизации
- •Универсальность и прогностический потенциал рекламной парадигмы
- •Нечеткие множества. Основные понятия и определения, подходы к их обработке, операции над нечёткими множествами.
Популярные тезаурусы и их особенности
Каждая национальная традиция создала свою особенную разновидность тезауруса. Для того чтобы увидеть, как действует тезаурус, в чем его польза и уникальность свойств, обратимся к популярному немецкому тезаурусу DUDEN. На каждой его странице нарисован какой-либо вид человеческой деятельности в картинках. Например, железная дорога. От каждой картинки, изображающей ж.-д. пути, вокзалы, вагоны и т.п., отходят стрелочки с номерами. На соседней странице около каждого номера прописано его название на немецком, русском, английском языках. Для того чтобы представить себе, в чем особенности поиска слов при помощи тезауруса, вообразим, что мы не знаем какой-либо части ж.-д. оборудования даже на родном русском языке. Но эту часть сможем найти по картинке, а затем прочитать его название на нужном нам языке в списке на соседней странице.
Видно, что здесь мы идем не от слова (знака) к его значению, как в толковом словаре, а в обратном направлении – от денотата к знаку. Эта принципиальная разница часто скрыта от пользователя особенностями структуры словарей, но она достаточно ясно прослеживается в словарях-тезаурусах разных видов. Действительно, если мы, встретив в тексте, не знаем слова «фижмы», мы ищем его в толковом словаре по алфавиту на букву «Ф». Это деталь женской одежды XIX века. Но, если мы видим эту женскую одежду (например, в музее) и хотим узнать, как называется эта деталь, то мы в тезаурусе DUDEN находим страницу с картинками одежды разных эпох и по указателю ищем название любой детали и не только на родном языке. Именно с такой ситуацией сталкиваются люди, участвующие в какой-либо сложной совместной деятельности. Часто проблемой является однозначное понимание, то есть обозначение разных ее объектов. Для оптимизации этих процессов в области аэрокосмических исследований был создан тезаурус НАСА.
Самый известный французский тезаурус – знаменитый Larousse, у англичан это Roget’s. Огромные ассигнования выделяются на создание специализированных (часто многоязычных) тезаурусов, как правило, реализованных уже на машинных носителях с программной поддержкой для пользователей. Например, в медицине это тезаурус SNOMED.
Теория тезауруса и семиотика
Рассмотрим, как реализуется функциональность тезауруса с точки зрения семиотики. Действительно, как уже говорилось выше, в толковом словаре мы ищем объяснение слова, т.е. движемся от знака к денотату–
S → D.
Это значит, что денотат у нас есть функция от знака:
D = f(S).
В тезаурусе же реализуется обратная функция:
D → S.
То есть знак есть функция денотата:
S = F(D).
Видно, что для того, чтобы реализовать типичную для тезауруса функцию нахождения слова (знака) по его значению (денотату), нужно найти этот денотат среди других ему подобных. Это заставляет создателей тезаурусов представить пользователю структурированную картину мира, чтобы он мог в ней найти свой денотат. Создатели словаря DUDEN решили эту проблему проще всего – изобразили наиболее популярные виды человеческой деятельности на нескольких сотнях картинок, на каждой из которых читатель может найти интересующий его объект. Создатели словаря Roget’s структурировали мир иерархически – идя от общего к частному. От изначальных понятий мир–человек, живая–неживая природа, мир техники и т.д. читатель спускается к нужному ему денотату, после чего находит его название (часто вместе с набором синонимов). Такая структурированная иерархическая картина мира денотатов легла в основу современных тезаурусов, реализованных на компьютерах.