- •§ 2. Рефлексия лингвистической теории в прикладной лингвистике
- •Предисловие
- •Глава 1 Объект и методы прикладной лингвистики § 1. Понимания термина «прикладная лингвистика»
- •§ 2. Круг задач прикладной лингвистики
- •§3. Методы прикладной лингвистики
- •Глава 2 Оптимизация когнитивной функции языка § 1. Компьютерная лингвистика
- •1.1. Компьютерная лингвистика как прикладная лингвистическая дисциплина
- •1.2. Когнитивный инструментарий компьютерной лингвистики
- •1.3. Некоторые направления компьютерной лингвистики
- •1.4. Гипертекстовые технологии представления текста
- •§ 2. Прикладные аспекты квантитативной лингвистики
- •2.1. Проблематика квантитативной лингвистики с теоретической и прикладной точек зрения
- •2.2. Основные области приложения структурно-вероятностной модели языка
- •2.3. Авторизация текста: пример экспертизы
- •§ 3. Психолингвистика как приложение лингвистики
- •Глава 3 Оптимизация эпистемической функции языка §1. Лексикография
- •1.1. Из истории словарного дела
- •1.2. Базовые параметры типологизации словарей
- •1.3. Основные структурные компоненты словаря
- •1.4. Основные структурные компоненты (зоны) словарной статьи
- •1.5. Компьютерная лексикография
- •§ 2. Терминоведение и терминография
- •2.1. Исходные понятия
- •2.2. Важнейшие направления деятельности в терминоведении и терминографии
- •2.3. Институциональный аспект терминоведения и терминографии
- •2.4. Лингвистическая терминология как особая терминосистема*
- •2.5. Миры лингвистической терминологии
- •Термины семиотики19'
- •Термины прагматики
- •Термины теории диалога, термины теории речевой коммуникации
- •Термины логического анализа естественного языка
- •Термины прикладной лингвистики
- •Термины теории речевых актов
- •Термины искусственного интеллекта
- •Термины когнитивной науки
- •2.6. Лингвистическая терминография
- •§ 3. Корпусная лингвистика
- •3.1. Языковой материал в лингвистическом исследовании
- •3.2. Исходные понятия корпусной лингвистики
- •3.3. Требования к корпусу текстов с точки зрения пользователя
- •3.4. Опыт разработки корпусов текстов
- •3.5. Заключение
- •Глава 4 Оптимизация функционирования языка как средства передачи информации § 1. Перевод как прикладная лингвистическая дисциплина*
- •1.1. Лингвистические и нелингвистические аспекты перевода
- •1.2. Виды перевода
- •1.3. «Естественный» перевод: лингвистические проблемы
- •1.4. Машинный перевод
- •§ 2. Теория и методика преподавания языка*
- •2.1. Грамматико-переводной метод в обучении иностранным языкам
- •2.2. Прямой метод обучения иностранному языку
- •2.3. Аудиолингвальный и аудиовизуальный методы обучения иностранным языкам
- •2.4. Коммуникативно-ориентированный подход в обучении иностранным языкам
- •§3. Оптимизация общения с эвм:системы обработки естественного языка
- •§4. Теория и практика информационно-поисковых систем
- •4.1. Основные понятия информационного поиска
- •4.2. Типы информационно-поисковых систем
- •4.3. Информационно-поисковые языки
- •Глава 5 Оптимизация социальной функции языка, функционирование языка как средства воздействия § 1. Лингвистика и функционирование государства
- •§ 2. Лингвистические аспекты теории воздействия: языковые механизмы вариативной интерпретации действительности*
- •2.1. Предмет теории воздействия и ее истоки
- •2.2. Языковое варьирование как важнейший источник имплицитного воздействия языка на сознание. Предпосылки языкового варьирования
- •2.3. Типология языковых механизмов воздействия на сознание
- •2.4. Лингвистические аспекты теории аргументации
- •2.5. Языковые механизмы вариативной интерпретации действительности в аргументации: пример анализа
- •§ 3. Механизмы вариативной интерпретации действительности в нейро-лингвистическом программировании
- •3.1. Нейро-лингвистическое программирование -эффективная практика как теория
- •3.2. Нлп как психотерапевтический метод
- •3.3. Постулаты нлп по отношению к языку: взгляд лингвиста
- •3.4. Роль языковых механизмов вариативной интерпретации действительности в нлп
- •§4. Политическая лингвистика
- •4.1. Предмет и задачи политической лингвистики
- •4.2. Методика контент-анализа
- •4.3. Примеры применения методики контент-анализа
- •4.4. Методика когнитивного картирования
- •Глава 6 Прикладная и теоретическая лингвистика: проблемы взаимовлияния § 1. Инструментарий прикладной лингвистики в лингвистической теории
- •1.1. Традиционные проблемы лексической семантики с точки зрения когнитивного подхода*
- •1.2. Эвристики лингвистической семантики
- •1.3. Заключение
- •§ 2. Рефлексия лингвистической теории в прикладной лингвистике
- •2.1. Базовые теоретические оппозиции в прикладной лингвистике
- •2.2. Филологические методы анализа текста как эвристики построения систем искусственного интеллекта*
- •Актуальные проблемы прикладной лингвистики
- •Список сокращений
- •Литература
- •Словарные издания
4.2. Типы информационно-поисковых систем
По типу хранимой и обрабатываемой информации, а также по особенностям поиска ИПС разделяются на две больших группы — документальные и фактографические. В документальных ИПС хранятся тексты документов или их описания (рефераты, библиографические карточки и пр.). До последнего времени обычной формой представления данных в документальных ИПС был реферат (или другое краткое описание документа) и его библиографические данные. В этом массиве, который называется первым документальным контуром, и проводился основной поиск. Первичные документы хранились отдельно на бумаге или микрофишах. Массив первичных документов называется вторым документальным контуром. В настоящее время в связи с развитием ИПС бестезаурусного типа и появлением новых продуктивных способов архивации данных, а также новых типов памяти ЭВМ (оптические диски большой емкости) различие между первым и вторым контурами стирается: в память ЭВМ вводятся и сам текст документа, и его сокращенные аналоги. Для этих целей разрабатываются международные стандарты. Сейчас получил широкое распространение стандарт ISO 2709 (ГОСТ 7.14-84), который, кроме текста документа, предполагает наличие маркера записи (включает характеристики, относящиеся ко всей записи) и справочника (характеристики внутренней структуры документа).
Фактографические ИПС имеют дело с описанием конкретных фактов, причем не обязательно в текстовой форме. Это могут быть таблицы, формулы и пр. Существуют и смешанные ИПС, включающие как документы, так и фактографическую информацию. В настоящее время фактографические ИПС строятся на основе технологий баз данных (БД). С теоретической точки зрения база данных представляет собой совокупность признаков описываемых объектов с указанием отношений между ними. В качестве описываемого объекта может выступать, например, книга, телефонный номер и пр. Объект в базе данных характеризуется по признакам или атрибутам. Так, книга может иметь следующие атрибуты: 1) автор; 2) название; 3) год выхода; 4) издательство; 5) тираж; 6) объем. Телефонный номер может характеризоваться по фамилии владельца, месту его проживания, сумме абонементной оплаты и т.д.
Базы данных по своей структуре разделяются на иерархические, сетевые и реляционные. Иерархические БД используются только по отношению к таким проблемным областям, в которых характеристики объектов имеют четкую иерархию. Таковыми могут быть, например, БД по химическим веществам, по деталям машин; четко выраженную иерархию имеют биологические классификации. В существенно меньшей степени выражена иерархическая структура для БД с разнородной информацией. Сетевые БД лишены ограничений на структуру атрибутов, однако программная обработка сети представляет определенные сложности. Наиболее распространены в настоящее время реляционные базы данных, которые можно представить в виде таблиц с очень большим количеством строк и столбцов. Несколько таблиц могут быть связаны между собой перекрестными отсылками, что позволяет формировать довольно сложные БД.
Для создания структуры данных, ввода информации в реляционные БД и ее обработки создаются специальные программные средства — системы управления базами данных (СУБД). С программной точки зрения каждый объект в реляционной БД представляется в виде отдельной записи (record). Атрибутам объекта в записи соответствуют поля (fields). Поиск может происходить по всем полям БД. Типы полей различаются. Основная проблема заключается в том, что у полей записи (кроме полей типа «memo») ограничена и фиксирована длина поля. Так, для поля типа «text» она не должна превышать 255 знаков. Иными словами, атрибуты объекта описания в БД должны быть внимательно проанализированы, чтобы поле не было избыточным по длине, поскольку это значительно увеличивает объем используемой памяти ЭВМ. Дело в том, что незаполненные фрагменты поля все равно заносятся в память. С другой стороны, поле не должно быть и излишне коротким, иначе часть информации невозможно будет ввести в БД. Ср. структуру реляционной базы данных по политической метафорике, разработанной в Институте русского языка РАН, и пример записи в этой базе данных:
Структура базы данных по политической метафорике
Название поля: METAPHOR (метафора) Тип поля Text — 90 знаков
Название поля: SIGNIF_DES (сигнификативный дескриптор — метафорическая модель)
Тип поля Text — 100 знаков
Название поля: DENOT_DES (денотативный дескриптор — политическая реалия)
Тип поля Text — 100 знаков
Название поля: EXAMPLE
Тип поля Memo27)
Название поля: DATE
Тип поля Date/Time
Название поля: NEWSPAPER
Тип поля Text — 10 знаков
Название поля: AUTHOR
Тип поля Text — 30 знаков
Запись 900
METAPHOR (метафора)
ПОЛИТИЧЕСКАЯ КУХНЯ
SIGNIF_DES (сигнификативный дескриптор — метафорическая модель)
КУХНЯ
DENOT_DES (денотативный дескриптор — политическая реалия)
ПОЛИТИКА
EXAMPLE
(...) но зная нравы отечественной политической кухни и уникальные способности многих лидеров в сжатые сроки портить отношения друг с другом, достижение такой исторической договоренности, принципиально меняющей ход скоротечной предвыборной кампании, представляется мне невероятным.
DATE
01.11.93
NEWSPAPER
Собеседник
AUTHOR
Соколов М.
27)В реляционных БД типа FOX, D-Base, ACCESS поле Memo не ограничено по длине.