
- •1. Соотношение теоретической и прикладной лингвистики. Основные задачи и методы прикладных лингвистических работ.
- •2. Декларативные и процедурные знания. Формы представления знаний в прикладной лингвистике. Фреймы, сценарии, планы, модели мира.
- •3. Ситуации и ключевые слова. Ключевые слова и текст. Ключевые слова и поисковый образ документа.
- •4. Теоретические и прикладные аспекты моделирования общения.
- •5. Гипертекст как особая форма передачи информации. Структурные и функциональные особенности гипертекста. Основные типы гипертекстов.
- •6. Квантитативная (количественная) лингвистика, ее лингвистические и математические основания. Структурно-вероятностная модель языка и ее приложения.
- •11. Прикладные аспекты лексикографии. Типология словарей. Компьютерная поддержка создания и использования словарей.
- •12. Структурные компоненты (зоны) словарной статьи. Параметризация лексики. Интегральное представление лексики в словаре.
- •13. «Новый объяснительный словарь синонимов русского языка» (рук. Ю.Д. Апресян) как словарь нового типа, отражающий системные связи лексики.
- •14. Частотные словари. Их создание и использование. Специфика информации, содержащейся в частотных словарях. Строение словарной статьи частотного словаря. Лексические зоны частотного словаря.
- •15. Компьютерная поддержка лексикографических работ. Автоматические словари.
- •16. Термин, терминология и специальные подъязыки. Прикладные работы в области терминологии. Стандартизация терминологической лексики.
- •18. Словари лингвистических терминов.
- •19. Корпусная лингвистика, ее идеология и основные понятия.
- •20. Текстовый корпус как модель коммуникативной сферы. Текстовая структура Британского национального корпуса.
- •21. Корпусы текстов по русскому языку. Национальный корпус русского языка. Текстовая структура, поисковые возможности.
- •22. Конкордансы и автоматические конкордансы. Автоматический конкорданс unilex.
- •23. Автоматический морфологический анализ и процедура лемматизации.
- •1. Маркеры - вставка маркеров абзаца и строки.
- •2. Сканирование - получение словника из текста.
- •3. Лемматизация - лемматизация полученного словника.
- •4. Сортировка - сортировка по [леммам и] словоформам.
- •5. Статистика - слияние, получение частоты и ранга.
- •6. Индекс - создание индекса к словнику.
- •6. Сортировка - получение алфавитного, частотного, обратного словника и по частям речи.
- •7. Печать - печать полученного словника.
- •24. Проблема переводимости. Переводческая эквивалентность.
- •25. Переводческие трансформации.
- •I. Лексические трансформации
- •1) Словообразовательные
- •3) Синтаксические
- •26. Лингвистические модели (теории) переводческой деятельности.
- •III. Семантическая модель (Кетфорд)
- •IV. Трехфазовая модель
- •VI. Теория уровней эквивалентности.
- •27. Специфика перевода текстов разных функциональных стилей.
- •I. Научные и научно-технические
- •II. Научно-учебный текст
- •III. Научно-популярный текст
- •IV Энциклопедические тексты
- •29. Информационный поиск. Ипс, их типы, использование. Лингвистические основы разработки и функционирования ипс.
- •30. Контент-анализ, его идеология, основные понятия, использование.
18. Словари лингвистических терминов.
Словари лингвистических терминов – разновидность отраслевых энциклопедических словарей.
Возникновение словарей этого типа относится к концу XIX в. До этого лингвистическая терминология отражалась в более широких справочниках: энциклопедиях, толковых словарях общеупотребительного языка и т.п.
Расцвет лингвистической лексикографии относится к 60-м гг. XX в., что связано с появлением новых лингвистических дисциплин, школ и направлений, представляющих новые термины.
Особое место среди словарей лингвистических терминов занимает словарь О. С. Ахмановой (1966; 7 000 терминов). Он представляет собой не только обобщение всего предшествующего терминологического опыта, но и новый типсловаря, сочетающий одновременно толкование термина, перевод его на четыре языка, иллюстрации реального функционирования термина и подобное. Сопоставление терминов с терминами следующих языков: английским, французским, немецким и испанским.
В качестве пособия для учителей средней школы издан «Словарь-справочник лингвистических терминов» Д. Э. Розенталя и М. А. Теленковой (М., 1975), в котором разъясняются термины лексики, фразеологии, фонетики, графики, орфографии, морфологии, синтаксиса, стилистики, пунктуации применительно к школьной практике.
19. Корпусная лингвистика, ее идеология и основные понятия.
Корпус текстов, с одной стороны, это исходный речевой материал для корпусной лингвистики и для других лингвистических дисциплин; с другой стороны, результат деятельности корпусной лингвистики.
Конкорданс – список словоформ встречающихся в тексте, расположенных в алфавитном порядке, слово даётся с его словесным окружением.
Проблемная область - область реализаций языковой системы, содержащая феномены, подлежащие лингвистическому описанию = множество данных, обработка которых затруднена из-за того, что языковых реализаций слишком много. Она может быть сколь угодно велика или мала — все определяется выбранным объектом анализа, имеет два измерения — языковое и речевое. Речевое представлено речевыми высказываниями (реализациями), а языковое измерение проявляется в существовании потенциальной возможности появления других употреблений, дополняющих массив имеющихся реализаций. Для лингвистического исследования в центре внимания стоит именно языковое измерение, поскольку его следует реконструировать в результате анализа.
Корпус данных - сформированная по определенным правилам выборка данных из проблемной области = результат отображения из проблемной области, имеет только одно измерение — речевое, поскольку сам по себе он не обладает потенцией производства своих составляющих. Лингвисту приходится по отдельным результатам деятельности языка делать выводы о функционировании языка как целого, как системы.
Единица хранения — это некоторая совокупность естественно-языковых выражений проблемной области, которой сопоставляется одно описание на некотором метаязыке, определяемом процедурой формирования корпуса. На основании описания единицы хранения можно судить о том, какая часть проблемной области представлена в корпусе. Совокупность описаний единиц хранения образует некоторое множество, по которому можно судить о представительности выборки — какие газеты представлены, как формировалась выборка по временному параметру (все газеты какого-то периода и т.д.).
Корпус текстов — это вид корпуса данных, единицами которого являются тексты или их достаточно значительные фрагменты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области.
Динамические и статические корпусы текстов. Первоначально корпусы текстов создавались как статические образования, отражающие определенное временное состояние языковой системы (авторские корпусы — коллекции текстов писателей). Для отражения процессуального аспекта проблемной области была разработана новая технология построения и эксплуатации динамического корпуса текстов. В имеющейся литературе такие корпусы получили также название мониторных. Особенность сборки мониторных корпусов заключается в том, что они не предполагают раз и навсегда заданного набора текстов. В течение заранее фиксированного промежутка времени происходит обновление и/или дополнение множества текстов корпуса. Специфика эксплуатации динамического корпуса состоит в том, что пользователь при проведении исследования может выделить из общего генерального корпуса рабочий корпус, включающий лишь часть текстов генерального корпуса. Для научных и практических целей формируются корпусы параллельных текстов. По своей структуре это подмножество текстов на языке-источнике и одно или несколько подмножеств текстов, которые являются переводами текстов языка-источника на языки-цели (английский текст и его переводы на немецкий, французский).
Порог отображения - соотношение между корпусом данных и проблемной областью при пропорциональном сужении. Поскольку корпус данных является сужением проблемной области, то совершенно очевидно, что при «пропорциональном» сужении, являющемся, по-видимому, простейшим случаем реализации принципа репрезентативности, некоторые части проблемной области оказываются вне корпуса данных.
Параметризация проблемной области. Сужение проблемной области к исследовательскому корпусу основывается на выделении некоторых характеристик текстов проблемной области, которые релевантны для предполагаемого исследования. Совокупность этих характеристик (их возможные комбинации) образует многомерную матрицу, служащую основой для отбора текстов в корпус. Часто для оценки релевантных параметров проблемной области привлекается экспертная оценка.
Требования к корпусу: Важнейшее свойство корпуса — репрезентативность по отношению к проблемной области (способность корпуса текстов отражать все свойства проблемной области, релевантные для данного типа лингвистического исследования, в определенной пропорции, определяемой частотой явления в проблемной области). Другими словами, частота явления в корпусе должна быть близка частоте в проблемной области. Репрезентативность корпуса указывает на то, что единицы проблемной области отражаются пропорционально в корпусе данных, но при определенном пороге некоторые релевантные явления пропадут, исчезнут из корпуса. Полнота требует учета релевантных явлений, даже если это не соответствует идее пропорционального сужения. Требование полноты совершенно необходимо в тех случаях, когда лингвист-конструктор корпуса приблизительно знает, что ему искать. Корпус текстов должен экономить усилия исследователя при изучении проблемной области. В общем случае чем более «экономичен» корпус, тем выше порог отображения. В то же время для исследовательских корпусов экономия не может проводиться в ущерб репрезентативности: статистические пропорции должны быть адекватно отображены, если это не оговорено специально.
Система позволяет осуществлять следующие функции: Стандартный просмотр текстов, входящих в состав корпуса (в виде просмотра таблицы базы данных). Выборка и упорядочивание текстов по указанным формальным или содержательным признакам, а также на основе различных их комбинаций. В системе реализован стандартный набор типовых запросов в виде выбора из списка, автоматически переводимых затем на язык SQL; возможен также ручной ввод запросов на SQL. Получение текстовых массивов, являющихся подмножествами исходного корпуса на основе изменяемой случайной выборки и задания процентов от общего корпуса по одному из параметров. Просмотр массивов-подмножеств и их обработку: получение словников и списков контекстов (конкордансов).
Информация о наличии корпусов в разных странах ограничена, что существенно затрудняет проведение научных исследований и приводит к дублированию работы. Международная координация усилий в этой области пока еще не налажена. Локальность проектов приводит к возникновению различных форматов представления корпусов текстов.