- •Анализ отдельных слов
- •Анализ отдельных предложений
- •Семантический анализ
- •Заключение
- •Литература
- •Документальные ис.
- •Принцип функционирования ипс.
- •Состав аис.
- •Уровни представления языковых объектов.
- •Основные элементы ипя.
- •Требования к ипя.
- •Типология ипя.
- •Языки предкоординатного типа. Иерархическая классификация.
- •Перечислительные классификации.
- •Фасетные классификации.
- •Посткоординационные ипя.
- •Дескрипторные ипя.
- •Устранение синонимии.
- •Словари лексических единиц.
- •1. Тезаурус.
- •2. Другие виды.
- •Построение словаря дескрипторного языка. Основные характеристики. Анализ и построение словаря дескрипторного языка.
- •Количественные характеристики словарей.
- •Учёт синтагматических отношений.
- •Семантические коды.
- •Системы индексирования.
- •Типы (разновидности) систем индексирования.
- •Подходы к автоматизации индексирования.
- •Системы кодирования.
- •Оценка эффективности поиска.
- •Организация информационных массивов.
- •Стратегии поиска.
- •Элементы теории формальных языков и грамматик Введение.
- •Основные понятия и определения
- •Классификация грамматик и языков по Хомскому
- •Примеры грамматик и языков.
- •Разбор цепочек
- •Преобразования грамматик
- •Задачи.
- •Элементы теории трансляции Введение.
- •Описание модельного языка
- •Лексический анализ
- •О недетерминированном разборе
- •Задачи лексического анализа
- •Лексический анализатор для м-языка
- •Второй этап: по дс пишем программу
- •Задачи.
- •Синтаксический и семантический анализ
- •Метод рекурсивного спуска
- •Void error(); / функция обработки ошибок /
- •О применимости метода рекурсивного спуска
- •Синтаксический анализатор для м-языка
- •О семантическом анализе
- •Семантический анализатор для м-языка
- •Обработка описаний
- •Int declare; /* описан ? 1-"да", 0-"нет" */
- •Void ipush (int I); /* значение I - в стек */
- •Int ipop (void); /* из стека - целое */
- •Контроль контекстных условий в выражении
- •Void spush (char *s); /* значение s - в стек */
- •If (tid [I].Declare) /* описан? */
- •Контроль контекстных условий в операторах
- •Задачи.
- •Генерация внутреннего представления программ
- •Язык внутреннего представления программы
- •Синтаксически управляемый перевод
- •Генератор внутреннего представления программы на м-языке
- •Интерпретатор полиЗа для модельного языка
- •Задачи.
- •Литература
- •Раздел 7 (вопрос 3) Значение когнитивной психологии и структурной лингвистики для автоматизированной обработки текстов на ея
- •Когнитивная лингвистика
- •Когнитивная лингвистика и другие науки
- •Концепция образных схем
- •Концептуальная теория метафоры
- •Формирование когнитивной лингвистики
- •Раздел 7 (вопрос 5) Модель понимания текстов Кинча
- •1.2. Основные положения
- •1.3. Общая характеристика модели
- •Раздел 7 (вопрос 6) Принципы структуризации текстов на основе трансформационной грамматики.
- •Синтактика, семантика и прагматика
- •Знаки и культура
- •Синтагма и парадигма
- •Типы связей между знаком и денотатом
- •Знак. Его значение и смысл
- •Знаковое пространство. Парадигма трех миров
- •Знаковые системы и типы знаков
- •Понятие коннотата
- •Проблема похожести знака на денотат. Ономатопея
- •Случайность и закономерность в знаках и знаковых системах
- •Прагматика – часть семиотики
- •Глава 2. Слова, словари и понятия Слова и словари
- •Акты именования. Семиотические универсалии
- •Треугольник Фреге. Связь между знаком, денотатом и понятием
- •Глава 3. Теория тезауруса Тезаурус. Онтогенез
- •Тезаурус. Определение
- •Популярные тезаурусы и их особенности
- •Теория тезауруса и семиотика
- •Теория тезауруса и информатика
- •Тезаурус. Парадигматика
- •Тезаурусная терминология
- •Популярные тезаурусы и их особенности
- •Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
- •Парадигматика, или правила обращения с текстами
- •Материализация знака. Фактура речи
- •Переход от одной фактуры речи к другой
- •Глава 5. Парадигмы построения эффективных знаковых произведений Общие положения
- •Риторика и ее гуманитарная катастрофа
- •Определение риторики как науки об эффективной деятельности
- •Риторика как прагматика
- •Риторика и логика. Риторика и истина. Образ автора
- •Риторика. Классические парадигмы
- •Понятие риторического изобретения
- •Девиации синтактики и семантики знаков как риторическая парадигма
- •Риторика как технология эффективной деятельности. Теория документа
- •Глава 6. Знаки, люди и законы. Парадигмы их взаимодействия на примере рекламных текстов Американская реклама как сфера общения
- •Коммуникативная структура американской рекламы
- •Авторство и правила обращения с рекламными текстами
- •Роль рекламных текстов в американском обществе
- •Законодательное регулирование рекламной деятельности
- •Законы знакообразования
- •Законодательное регулирование связи знак–денотат в рекламе
- •Прагматика рекламного текста
- •Регулирование собственно рекламной деятельности как производства текстов
- •Рекламоведческие правила
- •Правила сбора информации
- •Синтактика рекламного текста
- •Интеграция с другими типами знаков
- •Прагматический эффект рекламы
- •Реклама – важная часть американской цивилизации
- •Универсальность и прогностический потенциал рекламной парадигмы
- •Нечеткие множества. Основные понятия и определения, подходы к их обработке, операции над нечёткими множествами.
Документальные ис.
В быту – ИПС (информационно-поисковые системы). Предметная область описывается совокупностью документов, считается, что этого достаточно для решения задач пользователя.
Важнейшую часть документа составляет текст (слабоструктурированная информация). Для решения задач (обработка, поиск и др.) требуются специальные методы и средства, отличные от методов и средств, применяемых для фактографических систем. Особенности документальных систем порождают необходимость создания специальных методик проектирования.
Существуют специальные программные средства.
Документальная система хранит документы в виде документальной БД. Особенность – единицей хранения является документ. Результатом поиска также является документ, в котором можно найти требуемую информацию.
Принцип функционирования ипс.
Автоматизированная ИС (АИС) предназначена для ввода, хранения, поиска и т.д. семантической информации. Следовательно поиск предполагает сравнение смыслового содержания документа и смыслового содержания запроса. Надо до сравнения описать это содержание, причём средства описания должны быть одинаковы и для документа, и для запроса.
Для решения этой задачи разрабатывают специальные (искусственные) языки. Вследствие обработки на таком языке получается поисковый образ запроса (ПОД) и поисковый образ документа (ПОД).
В любой док. ИС её функционирование начинается с перевода основного содержания документа и запроса с естественного языка на информационно-поисковый язык (ИПЯ). Это называется индексирование. Получаем ПОД и ПОЗ (краткая характеристика содержания) Затем осуществляется сжатие информации. ПОДы хранятся в БД – хранилище семантической информации.
Иногда производится кодирование после индексирования и информация хранится в кодовом виде.
Одна из важнейших задач – организовать наиболее эффективную форму хранения, другая – обеспечить наиболее эффективный доступ к этой информации.
Одним из наиболее популярных способов доступа – поиск. Также существуют рубрикаторы (упорядочивание информации), навигация по гиперссылкам и др. Поиск реализуется путём сопоставления ПОЗ с ПОДами, хранящимися в БД.
Важная информация – как организовать порядок сопоставления.
Информация выдаётся в виде массива документов, которые система признала релевантными запросу.
Документ – многообразный по своему наполнению объект (может содержать текстовую, цифровую, графическую, звуковую и др. информацию).
Состав аис.
Деление АИС на подсистемы неоднозначно. Критерии делния должны удовлетворять требованиям разработчиков.
-
Функциональные подсистемы (подсистема сбора, хранения, обработки и т.д.)
-
Организационные подсистемы.
Логико-семантический комплекс (ЛСК) - совокупность языковых, логических и математических средств, предназначенных для формализованного описания семантической информации с целью её последующей обработки и поиска.
Компоненты ЛСК:
-
Языковые средства ИС.
У естественного языка есть 2 особенности : избыточность и недостаточность.
Избыточность. Для передачи содержания сообщения активную роль играют только некоторые слова (ключевые), всё остальное можно выкинуть для понимания смысла текста. Также в языке существует много синонимов и близких по значению слов. Также естественный язык допускает перефразировку.
Недостаточность выражается в многозначности отдельных слов естественного языка (омонимия, полисемия – название одного предмета переносится на другой, имеющий схожие признаки), элипсности (пропуск в тексте слов, которые явно подразумеваются).
ИПЯ – информационно-поисковый язык – специальный искусственно-созданный язык, предназначенный для описания основного содержания и формальных характеристик документов с целью реализации последующего автоматизированного поиска.
Информационный язык – система, предназначенная для описания, обработки, поиска информации, содержащей алфавит, правила образования языковых конструкций, а также правила их образования, интерпретации. Пример: алгоритмический язык.
Эта способность выражается по-разному, в зависимости от того, на каком уровне представления языковых объектов мы рассматриваем