18. Словари лингвистических терминов.

Словари лингвистических терминов – разновидность отраслевых энциклопедических словарей.

Возникновение словарей этого типа относится к концу XIX в. До этого лингвистическая терминология отражалась в более широких справочниках: энциклопедиях, толковых словарях общеупотребительного языка и т.п.

Расцвет лингвистической лексикографии относится к 60-м гг. XX в., что связано с появлением новых лингвистических дисциплин, школ и направлений, представляющих новые термины.

Особое место среди словарей лингвистических терминов занимает словарь О. С. Ахмановой (1966; 7 000 терминов). Он представляет собой не только обобщение всего предшествующего терминологического опыта, но и новый типсловаря, сочетающий одновременно толкование термина, перевод его на четыре языка, иллюстрации реального функционирования термина и подобное. Сопоставление терминов с терминами следующих языков: английским, французским, немецким и испанским.

В качестве пособия для учителей средней школы издан «Словарь-справочник лингвистических терминов» Д. Э. Розенталя и М. А. Теленковой (М., 1975), в котором разъясняются термины лексики, фразеологии, фонетики, графики, орфографии, морфологии, синтаксиса, стилистики, пунктуации применительно к школьной практике.

19. Корпусная лингвистика, ее идеология и основные понятия.

Корпус текстов, с одной стороны, это исходный речевой материал для корпусной лингвистики и для других лингвистических дисциплин; с другой стороны, результат деятельности корпусной лингвистики.

Конкорданс – список словоформ встречающихся в тексте, расположенных в алфавитном порядке, слово даётся с его словесным окружением.

Проблемная область - область реализаций языковой системы, содержащая феномены, подлежащие лингвистическому описанию = множество данных, обработка которых затруднена из-за того, что языковых реализаций слишком много. Она может быть сколь угодно велика или мала — все определяется выбранным объектом анализа, имеет два измерения — языковое и речевое. Речевое представлено речевыми высказываниями (реализациями), а языковое измерение проявляется в существовании потенциальной возможности появления других употреблений, дополняющих массив имеющихся реализаций. Для лингвистического исследования в центре внимания стоит именно языковое измерение, поскольку его следует реконструировать в результате анализа.

Корпус данных - сформированная по определенным правилам выборка данных из проблемной области = результат отображения из проблемной области, имеет только одно измерение — речевое, поскольку сам по себе он не обладает потенцией производства своих составляющих. Лингвисту приходится по отдельным результатам деятельности языка делать выводы о функционировании языка как целого, как системы.

Единица хранения — это некоторая совокупность естественно-языковых выражений проблемной области, которой сопоставляется одно описание на некотором метаязыке, определяемом процедурой формирования корпуса. На основании описания единицы хранения можно судить о том, какая часть проблемной области представлена в корпусе. Совокупность описаний единиц хранения образует некоторое множество, по которому можно судить о представительности выборки — какие газеты представлены, как формировалась выборка по временному параметру (все газеты какого-то периода и т.д.).

Корпус текстов — это вид корпуса данных, единицами которого являются тексты или их достаточно значительные фрагменты, включающие, например, какие-то полные фрагменты макроструктуры текстов данной проблемной области.

Динамические и статические корпусы текстов. Первоначально корпусы текстов создавались как статические образования, отражающие определенное временное состояние языковой системы (авторские корпусы — коллекции текстов писателей). Для отражения процессуального аспекта проблемной области была разработана новая технология построения и эксплуатации динамического корпуса текстов. В имеющейся литературе такие корпусы получили также название мониторных. Особенность сборки мониторных корпусов заключается в том, что они не предполагают раз и навсегда заданного набора текстов. В течение заранее фиксированного промежутка времени происходит обновление и/или дополнение множества текстов корпуса. Специфика эксплуатации динамического корпуса состоит в том, что пользователь при проведении исследования может выделить из общего генерального корпуса рабочий корпус, включающий лишь часть текстов генерального корпуса. Для научных и практических целей формируются корпусы параллельных текстов. По своей структуре это подмножество текстов на языке-источнике и одно или несколько подмножеств текстов, которые являются переводами текстов языка-источника на языки-цели (английский текст и его переводы на немецкий, французский).

Порог отображения - соотношение между корпусом данных и проблемной областью при пропорциональном сужении. Поскольку корпус данных является сужением проблемной области, то совершенно очевидно, что при «пропорциональном» сужении, являющемся, по-видимому, простейшим случаем реализации принципа репрезентативности, некоторые части проблемной области оказываются вне корпуса данных.

Параметризация проблемной области. Сужение проблемной области к исследовательскому корпусу основывается на выделении некоторых характеристик текстов проблемной области, которые релевантны для предполагаемого исследования. Совокупность этих характеристик (их возможные комбинации) образует многомерную матрицу, служащую основой для отбора текстов в корпус. Часто для оценки релевантных параметров проблемной области привлекается экспертная оценка.

Требования к корпусу: Важнейшее свойство корпуса — репрезентативность по отношению к проблемной области (способность корпуса текстов отражать все свойства проблемной области, релевантные для данного типа лингвистического исследования, в определенной пропорции, определяемой частотой явления в проблемной области). Другими словами, частота явления в корпусе должна быть близка частоте в проблемной области. Репрезентативность корпуса указывает на то, что единицы проблемной области отражаются пропорционально в корпусе данных, но при определенном пороге некоторые релевантные явления пропадут, исчезнут из корпуса. Полнота требует учета релевантных явлений, даже если это не соответствует идее пропорционального сужения. Требование полноты совершенно необходимо в тех случаях, когда лингвист-конструктор корпуса приблизительно знает, что ему искать. Корпус текстов должен экономить усилия исследователя при изучении проблемной области. В общем случае чем более «экономичен» корпус, тем выше порог отображения. В то же время для исследовательских корпусов экономия не может проводиться в ущерб репрезентативности: статистические пропорции должны быть адекватно отображены, если это не оговорено специально.

Система позволяет осуществлять следующие функции: Стандартный просмотр текстов, входящих в состав корпуса (в виде просмотра таблицы базы данных). Выборка и упорядочивание текстов по указанным формальным или содержательным признакам, а также на основе различных их комбинаций. В системе реализован стандартный набор типовых запросов в виде выбора из списка, автоматически переводимых затем на язык SQL; возможен также ручной ввод запросов на SQL. Получение текстовых массивов, являющихся подмножествами исходного корпуса на основе изменяемой случайной выборки и задания процентов от общего корпуса по одному из параметров. Просмотр массивов-подмножеств и их обработку: получение словников и списков контекстов (конкордансов).

Информация о наличии корпусов в разных странах ограничена, что существенно затрудняет проведение научных исследований и приводит к дублированию работы. Международная координация усилий в этой области пока еще не налажена. Локальность проектов приводит к возникновению различных форматов представления корпусов текстов.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 1011 / 2211 12 13 14 15 16 17 18 19 20 21 22 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.04.202566.73 Кб3Otvety_na_voprosy.docx
#
01.04.2025198.45 Кб2otvety_po_anatomii.docx
#
09.06.2015146.73 Кб114otvety_po_bukh_uchetu-1.docx
#
12.09.2019146.88 Кб114Otvety_po_Ekonomike.docx
#
01.03.2025149.66 Кб32otvety_po_IT.docx
#
01.04.2025475.14 Кб33Otvety_po_prikl_lingv.doc
#
01.03.2025191.89 Кб45Otvety_po_TGP (1).docx
#
01.07.202576.3 Кб12otvety_po_topografii.docx
#
01.07.2025109.49 Кб8otvety_vvya_1k.docx
#
23.12.201838.4 Кб113OTVYeT_PO_INFORMATIKYe.docx
#
09.06.2015735.74 Кб677pedagogika.doc