- •Анализ отдельных слов
- •Анализ отдельных предложений
- •Семантический анализ
- •Заключение
- •Литература
- •Документальные ис.
- •Принцип функционирования ипс.
- •Состав аис.
- •Уровни представления языковых объектов.
- •Основные элементы ипя.
- •Требования к ипя.
- •Типология ипя.
- •Языки предкоординатного типа. Иерархическая классификация.
- •Перечислительные классификации.
- •Фасетные классификации.
- •Посткоординационные ипя.
- •Дескрипторные ипя.
- •Устранение синонимии.
- •Словари лексических единиц.
- •1. Тезаурус.
- •2. Другие виды.
- •Построение словаря дескрипторного языка. Основные характеристики. Анализ и построение словаря дескрипторного языка.
- •Количественные характеристики словарей.
- •Учёт синтагматических отношений.
- •Семантические коды.
- •Системы индексирования.
- •Типы (разновидности) систем индексирования.
- •Подходы к автоматизации индексирования.
- •Системы кодирования.
- •Оценка эффективности поиска.
- •Организация информационных массивов.
- •Стратегии поиска.
- •Элементы теории формальных языков и грамматик Введение.
- •Основные понятия и определения
- •Классификация грамматик и языков по Хомскому
- •Примеры грамматик и языков.
- •Разбор цепочек
- •Преобразования грамматик
- •Задачи.
- •Элементы теории трансляции Введение.
- •Описание модельного языка
- •Лексический анализ
- •О недетерминированном разборе
- •Задачи лексического анализа
- •Лексический анализатор для м-языка
- •Второй этап: по дс пишем программу
- •Задачи.
- •Синтаксический и семантический анализ
- •Метод рекурсивного спуска
- •Void error(); / функция обработки ошибок /
- •О применимости метода рекурсивного спуска
- •Синтаксический анализатор для м-языка
- •О семантическом анализе
- •Семантический анализатор для м-языка
- •Обработка описаний
- •Int declare; /* описан ? 1-"да", 0-"нет" */
- •Void ipush (int I); /* значение I - в стек */
- •Int ipop (void); /* из стека - целое */
- •Контроль контекстных условий в выражении
- •Void spush (char *s); /* значение s - в стек */
- •If (tid [I].Declare) /* описан? */
- •Контроль контекстных условий в операторах
- •Задачи.
- •Генерация внутреннего представления программ
- •Язык внутреннего представления программы
- •Синтаксически управляемый перевод
- •Генератор внутреннего представления программы на м-языке
- •Интерпретатор полиЗа для модельного языка
- •Задачи.
- •Литература
- •Раздел 7 (вопрос 3) Значение когнитивной психологии и структурной лингвистики для автоматизированной обработки текстов на ея
- •Когнитивная лингвистика
- •Когнитивная лингвистика и другие науки
- •Концепция образных схем
- •Концептуальная теория метафоры
- •Формирование когнитивной лингвистики
- •Раздел 7 (вопрос 5) Модель понимания текстов Кинча
- •1.2. Основные положения
- •1.3. Общая характеристика модели
- •Раздел 7 (вопрос 6) Принципы структуризации текстов на основе трансформационной грамматики.
- •Синтактика, семантика и прагматика
- •Знаки и культура
- •Синтагма и парадигма
- •Типы связей между знаком и денотатом
- •Знак. Его значение и смысл
- •Знаковое пространство. Парадигма трех миров
- •Знаковые системы и типы знаков
- •Понятие коннотата
- •Проблема похожести знака на денотат. Ономатопея
- •Случайность и закономерность в знаках и знаковых системах
- •Прагматика – часть семиотики
- •Глава 2. Слова, словари и понятия Слова и словари
- •Акты именования. Семиотические универсалии
- •Треугольник Фреге. Связь между знаком, денотатом и понятием
- •Глава 3. Теория тезауруса Тезаурус. Онтогенез
- •Тезаурус. Определение
- •Популярные тезаурусы и их особенности
- •Теория тезауруса и семиотика
- •Теория тезауруса и информатика
- •Тезаурус. Парадигматика
- •Тезаурусная терминология
- •Популярные тезаурусы и их особенности
- •Глава 4. Эволюция знаковых систем. Законы существования текстов в обществе Постановка проблемы
- •Парадигматика, или правила обращения с текстами
- •Материализация знака. Фактура речи
- •Переход от одной фактуры речи к другой
- •Глава 5. Парадигмы построения эффективных знаковых произведений Общие положения
- •Риторика и ее гуманитарная катастрофа
- •Определение риторики как науки об эффективной деятельности
- •Риторика как прагматика
- •Риторика и логика. Риторика и истина. Образ автора
- •Риторика. Классические парадигмы
- •Понятие риторического изобретения
- •Девиации синтактики и семантики знаков как риторическая парадигма
- •Риторика как технология эффективной деятельности. Теория документа
- •Глава 6. Знаки, люди и законы. Парадигмы их взаимодействия на примере рекламных текстов Американская реклама как сфера общения
- •Коммуникативная структура американской рекламы
- •Авторство и правила обращения с рекламными текстами
- •Роль рекламных текстов в американском обществе
- •Законодательное регулирование рекламной деятельности
- •Законы знакообразования
- •Законодательное регулирование связи знак–денотат в рекламе
- •Прагматика рекламного текста
- •Регулирование собственно рекламной деятельности как производства текстов
- •Рекламоведческие правила
- •Правила сбора информации
- •Синтактика рекламного текста
- •Интеграция с другими типами знаков
- •Прагматический эффект рекламы
- •Реклама – важная часть американской цивилизации
- •Универсальность и прогностический потенциал рекламной парадигмы
- •Нечеткие множества. Основные понятия и определения, подходы к их обработке, операции над нечёткими множествами.
Перечислительные классификации.
Чаще всего к ним относят алфавитно-предметные классификации (они являются наиболее типичными представителями).
Характерным признаком такого ИПЯ является то, что словарь такого языка состоит из упорядоченных по определённому признаку слов, словосочетаний естественного языка. Наиболее расхожим признаком упорядочивания является алфавит, а слова и словосочетания естественного языка обозначают предметы какой-либо отрасли науки или области деятельности, то такие языки называются алфавитно-предметными классификациями. В словаре просто перечисляются лексические единицы.
Алфавитно-предметная классификация – система классов, каждый из которых соответствует одному виду предмета. Классы расположены в алфавитном порядке их имён и простейшим примеров является телефонный справочник.
Лексические единицы такого языка называются предметными заголовками. Совокупность предметных заголовков и образует собственно язык. Обычно, предметный заголовок сопровождается пояснениями (состав рубрик, синонимы и др.). Сам заголовок вместе с пояснениями называется предметной рубрикой.
Алфавитно-предметные классификации чрезвычайно разнообразны. Назначение – использование в качестве дополнительных входов к иерархическим классификациям. (Это – некие указатели).
Преимущества:
-
простота: удобно работать, так как он имеет примитивную структуру, следовательно, поиск лексических единиц прост.
-
удобство добавления новых рубрик.
Недостатки:
-
невозможно (рационально) с помощью данного языка производить многоаспектный поиск по любому сочетанию признаков.
-
в нём синонимия терминов устраняется только с помощью отсылок (единственный способ установления парадигматических связей) – необходимо очень большое количество отсылок.
-
строгий лексикографический контроль.
-
язык сложно использовать для специалистов, которые говорят на другом языке ( при переводе структура разрушается).
Разновидности:
-
пермутационные указатели (permutation - перестановка), цепные указатели.
Часто бывает необходимо при поиске обеспечить доступ каждой составляющей словоформе. Для этого и существуют пермутационные указатели.
Каждая сложная лексическая единица повторяется столько раз, сколько в ней составляющих словоформ, при том каждый раз меняется порядок слов, чтобы при каждом повторе первая компонента (входная) не повторялась. Появляется возможность получить доступ к любой лексической единице. В зависимости от того как эта идея реализуется, есть 2 типа.
-
КВИК (KWIK – keyword in context)
Есть лексическая единица «научная картина мира». Она будет повторятся в пермутационных указателях три раза: «научная картина мира», «картина мира научная», «мира научная картина». При повторе все компоненты сохраняются.
-
КВОК (KWOK – keyword out context)
«научная картина мира», «картина мира», «мир».
Пермутационные указатели активно используются как входные указатели к иерархическим классификациям.
Фасетные классификации.
По своим свойствам эти языки правильнее было бы отнести к некоторому промежуточному классу (имеют свойства как пред-, так и посткоординационных языков).
Фасетная классификация – полииерархия ( корневых рубрик может быть много – множество деревьев, лес).
Автором этого типа классификаций является индийский учёный Рангнатан. При систематизации понятий в фасетной классификации используется обычный дедуктивный метод (от общих понятий к частным).
Фасетная классификация – такая система классификации, при которой классифицируемое множество образует ряд независимых группировок по различным аспектам классификации. Эти группировки называются фасетами. Они, как правило, соответствуют наиболее характерным аспектам тематической области, для которой создаётся язык, а внутри фасета термины могут упорядочиваться по разным правилам (иерархия, пересечение и т.д.). Каждый термин фасета называют фокусом.
Трафаретом для формирования запроса служит фасетная формула. Она фиксирует последовательность перечисления фасетов (аспектов классификации). Порядок следования фасетов строго регламентирован. Конкретный поисковый признак может быть разным.
Пр. предметная область «Карандаши».
A цвет грифеля
B твёрдость грифеля
C способ подачи грифеля
A1 цветные
A11 красный
A12 синий
…
A2 серые (простые)
B1 твердые
B2 твёрдо-мягкие
B3 мягкие
C1 автоматическая (с регулировкой)
C2 без регулировки
Фасетная формула ABC
Преимущества:
-
гибкость
-
возможность многоаспектного индексирования
-
возможность агрегатировать объекты по любому сочетанию фасетов
-
более глубокое деление понятий, чем в иерархической классификации
-
возможность более просто вводить новые понятия, нежели в иерархических классификациях
-
поисковый образ более простой, нежели в иерархических языках.
Недостатки:
-
язык имеет сложный процесс формирования
-
его сложно применять в ручных системах (если он имеет разветвлённую структуру).