- •Анализ отдельных слов
- •Анализ отдельных предложений
- •Семантический анализ
- •Заключение
- •Литература
- •Документальные ис.
- •Принцип функционирования ипс.
- •Состав аис.
- •Уровни представления языковых объектов.
- •Основные элементы ипя.
- •Требования к ипя.
- •Типология ипя.
- •Языки предкоординатного типа. Иерархическая классификация.
- •Перечислительные классификации.
- •Фасетные классификации.
- •Посткоординационные ипя.
- •Дескрипторные ипя.
- •Устранение синонимии.
- •Словари лексических единиц.
- •1. Тезаурус.
- •2. Другие виды.
- •Построение словаря дескрипторного языка. Основные характеристики. Анализ и построение словаря дескрипторного языка.
- •Количественные характеристики словарей.
- •Учёт синтагматических отношений.
- •Семантические коды.
- •Системы индексирования.
- •Типы (разновидности) систем индексирования.
- •Подходы к автоматизации индексирования.
- •Системы кодирования.
- •Оценка эффективности поиска.
- •Организация информационных массивов.
- •Стратегии поиска.
- •Элементы теории формальных языков и грамматик Введение.
- •Основные понятия и определения
- •Классификация грамматик и языков по Хомскому
- •Примеры грамматик и языков.
- •Разбор цепочек
- •Преобразования грамматик
- •Задачи.
- •Элементы теории трансляции Введение.
- •Описание модельного языка
- •Лексический анализ
- •О недетерминированном разборе
- •Задачи лексического анализа
- •Лексический анализатор для м-языка
- •Второй этап: по дс пишем программу
- •Задачи.
- •Синтаксический и семантический анализ
- •Метод рекурсивного спуска
- •Void error(); / функция обработки ошибок /
- •О применимости метода рекурсивного спуска
- •Синтаксический анализатор для м-языка
- •О семантическом анализе
- •Семантический анализатор для м-языка
- •Обработка описаний
- •Int declare; /* описан ? 1-"да", 0-"нет" */
- •Void ipush (int I); /* значение I - в стек */
- •Int ipop (void); /* из стека - целое */
- •Контроль контекстных условий в выражении
- •Void spush (char *s); /* значение s - в стек */
- •If (tid [I].Declare) /* описан? */
- •Контроль контекстных условий в операторах
- •Задачи.
- •Генерация внутреннего представления программ
- •Язык внутреннего представления программы
- •Синтаксически управляемый перевод
- •Генератор внутреннего представления программы на м-языке
- •Интерпретатор полиЗа для модельного языка
- •Задачи.
- •Литература
- •Раздел 7 (вопрос 3) Значение когнитивной психологии и структурной лингвистики для автоматизированной обработки текстов на ея
- •Когнитивная лингвистика
- •Когнитивная лингвистика и другие науки
- •Концепция образных схем
- •Концептуальная теория метафоры
- •Формирование когнитивной лингвистики
- •Раздел 7 (вопрос 5) Модель понимания текстов Кинча
- •1.2. Основные положения
- •1.3. Общая характеристика модели
- •Раздел 7 (вопрос 6) Принципы структуризации текстов на основе трансформационной грамматики.
- •Синтактика, семантика и прагматика
- •Знаки и культура
- •Синтагма и парадигма
- •Типы связей между знаком и денотатом
- •Знак. Его значение и смысл
- •Знаковое пространство. Парадигма трех миров
- •Знаковые системы и типы знаков
- •Понятие коннотата
- •Проблема похожести знака на денотат. Ономатопея
- •Случайность и закономерность в знаках и знаковых системах
- •Прагматика – часть семиотики
- •Глава 2. Слова, словари и понятия Слова и словари
- •Акты именования. Семиотические универсалии
- •Треугольник Фреге. Связь между знаком, денотатом и понятием
- •Глава 3. Теория тезауруса Тезаурус. Онтогенез
- •Тезаурус. Определение
- •Популярные тезаурусы и их особенности
- •Теория тезауруса и семиотика
- •Теория тезауруса и информатика
- •Тезаурус. Парадигматика
- •Тезаурусная терминология
- •Популярные тезаурусы и их особенности
- •Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
- •Парадигматика, или правила обращения с текстами
- •Материализация знака. Фактура речи
- •Переход от одной фактуры речи к другой
- •Глава 5. Парадигмы построения эффективных знаковых произведений Общие положения
- •Риторика и ее гуманитарная катастрофа
- •Определение риторики как науки об эффективной деятельности
- •Риторика как прагматика
- •Риторика и логика. Риторика и истина. Образ автора
- •Риторика. Классические парадигмы
- •Понятие риторического изобретения
- •Девиации синтактики и семантики знаков как риторическая парадигма
- •Риторика как технология эффективной деятельности. Теория документа
- •Глава 6. Знаки, люди и законы. Парадигмы их взаимодействия на примере рекламных текстов Американская реклама как сфера общения
- •Коммуникативная структура американской рекламы
- •Авторство и правила обращения с рекламными текстами
- •Роль рекламных текстов в американском обществе
- •Законодательное регулирование рекламной деятельности
- •Законы знакообразования
- •Законодательное регулирование связи знак–денотат в рекламе
- •Прагматика рекламного текста
- •Регулирование собственно рекламной деятельности как производства текстов
- •Рекламоведческие правила
- •Правила сбора информации
- •Синтактика рекламного текста
- •Интеграция с другими типами знаков
- •Прагматический эффект рекламы
- •Реклама – важная часть американской цивилизации
- •Универсальность и прогностический потенциал рекламной парадигмы
- •Нечеткие множества. Основные понятия и определения, подходы к их обработке, операции над нечёткими множествами.
Популярные тезаурусы и их особенности
В чистом виде тезаурус встречается редко, как и движение без трения или чистый кремний. В реальных тезаурусах происходит упрощение исходной идеи или добавление посторонней, но потенциально нужной его пользователю информации. Это можно проследить очень кратко на известных, уже упоминавшихся тезаурусах.
Roget's – наиболее популярный тезаурус. Организован вниз вплоть до набора синонимов в каждой словарной статье. Поэтому он часто используется для того, чтобы подыскать более подходящий синоним к слову. К тому же он и дополнен грамматическими сведениями в каждой своей статье. Очень удобный инструмент для любого пишущего человека. Сейчас многие компьютерные редакторы, кроме возможностей орфографической проверки слов (так называемыми «спеллчекерами»), укомплектованы также тезаурусами, позволяющими работать со значениями слов (денотатами), то есть подбирать синонимы, антонимы и т.п.
DUDEN. Идея поиска названия денотата реализована наиболее просто и наглядно. DUDEN – это книга с картинками на правой стороне (по разным ПО) с тщательно пронумерованными мельчайшими деталями. На правой стороне этот нумерованный список сопровождается названиями (даже на двух языках). Например, на целой странице нарисованы ж.-д. техника, станции, пути и т.п. Справа можно найти названия стрелок, семафоров, костылей.
SNOMED. Это огромный компьютеризированный тезаурус медицинской терминологии. Ссылка на его сайт дает хорошее представление о его возможностях.
Тезаурус НАСА. Как и SNOMED, этот тезаурус – одно из больших свершений в области лингвистики. Систематизированный свод терминов по ракетной технике и смежным областям. НАСА сделала прекрасный сайт. Можно посмотреть этот тезаурус в оригинальном динамическом графическом интерфейсе.
MULTITES. Это популярное средство создания словарей. Позволяет самому через графический интерфейс, следуя простым инструкциям, построить свой тезаурус для конкретной ПО и сразу получить его в виде программного продукта.
WORDNET – интеллектуальный компьютерный тезаурус. Создан в Принстонском университете и свободно распространяется. Основной материал о нем расположен на его сайте. Основные особенности WORDNET. Слова в нем сформированы в синонимические группы (синсеты – synsets). Они разбиты на 4 словаря: существительные, прилагательные, глаголы и наречия. Синсеты объединены как в иерархические связи (гипонимы и гиперонимы), так и в отношение антонимии и также меронимии (быть частью чего-либо или состоять из частей). Решена также проблема морфологии: слово после обращения к этому тезаурусу возвращается к исходной нормализованной грамматической форме. Описанный таким образом словарный состав английского (а сейчас уже и русского) языка позволяет решать с его помощью любые самые сложные информационные задачи.
Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
До сих пор мы рассматривали знаки несколько абстрактно, например:
-
в их отношениях между собой,
-
с теми объектами, которые они обозначают,
-
с теми идеями, которые они выражают,
-
как они комбинируются между собой.
Но не менее важно то, как знаковые произведения используются в обществе. Как уже говорилось выше, знаки и знаковые объекты иногда удобно рассматривать как элементы мира знаков или множества знаков.
Однако существует еще целый спектр проблем, связанных с тем, что знак также реализуется (материализуется) в реальном окружающем нас мире в виде текстов, дорожных знаков, компьютерных программ, игр и многого другого. Все эти знаковые произведения записываются на бумагу, куски жести или пластмассы, машинные носители. В материальном мире их хранят, читают, уничтожают, копируют, пересылают. Ясно, что эти проблемы с точки зрения семиотики относятся к прагматике, то есть к тому, как создатели и получатели знаков воспринимают создаваемые или получаемые знаковым произведения. И в данном случае совсем не все равно, каким образом знак материализовался.
Действительно, одно и то же произнесенное, написанное и напечатанное высказывание воспринимается по-разному. И совсем по-другому мы воспримем это высказывание, если услышим его по телевизору, дополненное видеорядом. Хотя, казалось бы, это совершенно одинаковые знаки. Но эффект от их восприятия неодинаков.
Более того, многие знаковые произведения (литературные, музыкальные, программные) являются товарами. Относительная легкость их копирования (не так легко скопировать автомобиль или булку хлеба) с целью последующей продажи заставляет принимать специальные законы, определяющие правила обращения с такими произведениями или текстами и влекущими уголовную или административную ответственность за их нарушение. Многим эти законы кажутся несправедливыми и они их нарушают, легко копируя не созданные ими литературные тексты, кинофильмы, музыку. С другой стороны, кажется удивительным, что права на знаменитые песни Битлз принадлежат не тем, кто их сочинил, а Майклу Джексону. Мы живем в сложно организованном обществе. Поэтому совершенно естественно задать вопрос: есть ли самые общие законы, определяющие правила, по которым материализуются и живут знаковые конструкции (тексты) в современном обществе? Зная эти правила, мы сможем более эффективно строить нашу деятельность, а во многих случаях даже успешно ее прогнозировать, опираясь на известные нам универсалии.
Естественно было бы предположить, что знание этой части законов семиотики наиболее важно для практической деятельности.