Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Презентации_Мат.методы в лингвистике.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
255.98 Кб
Скачать

Статистические методы и генезис языка: глоттохронология, циклические процессы в языке

глоттохронология,

циклические процессы в языке

Генезис языка и его формализация

Математическое моделирование применяют для реконструкции момента появления языка, этапов его развития, периода распада и исчезновения.

Несмотря на сравнительно небольшой объем древних текстов, статистические методы успешно применяются на материале корпусов – в особенности в отношении к текстам XVIII-XXI вв.

Глоттохронология

Метод сравнительно-исторического языкознания для предположительного определения времени разделения родственных языков, основанный на гипотезе, что скорость изменения базового словаря языка остается примерно одинаковой. Гипотеза предложена американским лингвистом Моррисом Сводешом (Morris Swadesh).

Оценка «лексического полураспада» языка, определение периода, за который два или более языка разошлись от общего праязыка, путем подсчёта количества заменённых слов в каждом языке. Затем вычисляется приблизительное время появления этих языков.

Сгласно глоттохронологической гипотезе, в каждом языке особой стабильностью к изменениям во времени обладает некоторое количество одинаковых для всех языков понятий. Эти понятия относят к так называемой «ядерной», «базовой» лексике.

Список Сводеша

(Swadesh list) — инструмент для оценки степени родства между различными языками по признаку схожести наиболее устойчивого базового словаря. Стандартизированный перечень базовых лексем данного языка, приблизительно упорядоченный по убыванию их «базовости» или исторической устойчивости. Минимальный набор «стержневой» лексики содержится в 100-словном списке.

Имеет значение для исследования генеалогии языков, теории перевода и др. направлений.

Список Сводеша для русского языка

Список Сводеша для английского языка

Правила составления

В стандартный список включены слова с наиболее наиболее простыми, очевидными (основными) значениями, не архаизмы и доминанты синонимических рядов. Вопрос критериев.

Ядро словаря было выделено, для того чтобы охватить понятия, присущие каждому человеческому языку (личные местоимения, слова, обозначающие части тела, небесные тела, основные процессы, маркеры количества (один, два и т. п.). В ряде случаев рекомендуется сопровождать запись кратким уточнением значения.

Исключаются понятия, специфические для какой-либо культуры или какого-либо периода времени.

Такой идеал фактически невозможен, а набор значений необходимо соотносить со сравниваемыми языками. Полностью исключить синонимию невозможно, и синонимы неизбежно попадают в список.

Проблема точности выделения списка.

Интерпретация списков

Первоначальная гипотеза: ядро словаря изменяется с почти постоянной скоростью во всех языках и, значит, может применяться для измерения отрезков времени. язык и история.

В списках вычисляется процент родственных слов (слов, имеющих общее происхождение). Чем больше процент родственных слов, тем меньше времени назад предположительно разделились два сравниваемых языка.

К вопросу об оригинальном языковой материале

Опасные проблемы компаративиста. Сравнение генетически неродственных элементов (по С. Старостину):

случайные совпадения (англ. woman – др.-яп. womina, женщина);

слова-идеофоны (кукушка – англ. cuckoo);

прямые заимствования.

Развитие, критика и отрицание метода

Было выяснено, что глоттохронология работает в случае индоевропейских языков, объясняя 87 % всех различий. Также установлено, что она работает для хамито-семитских языков, китайского и некоторых других.

Лишь определённое количество слов может подвергаться подсчёту.

Традиционная глоттохронология предполагала, что язык изменяется с постоянной скоростью.

Вероятность изменения является различной для отдельных слов или выражений).

Языковые изменения происходят из-за социальных и исторических событий, которые не поддаются строгому анализу.

Развитие метода (концепция С. Старостина)

Систематически заимствуемые слова являются нарушающим фактором и должны быть исключены из вычислений. По-настоящему значимым является только «родное» замещение единиц единицами того же языка.

Скорость изменения, в действительности, не постоянна, но зависит от периода времени, в течение которого слово существует в языке (то есть вероятность замены лексемы X лексемой Y возрастает прямо пропорционально прошедшему времени — так называемому «старению слов», эмпирически понимаемому как постепенное «разрушение» первоначального значения слов под весом приобретённых вторичных значений.

Отдельные единицы в 100-словном списке имеют разный уровень стабильности (например, для слова «я» обычно вероятность замены намного ниже, чем для слова «жёлтый» и т. д.).

С. Старостин: постулаты «корневой» глоттохронологии

В каждом языке имеется набор исконных корневых морфем (2-3 тыс.).

Они характеризуются различной частотностью.

Частотность корневой морфемы в языке в данным момент времени есть стабильная величина, не зависящая от характера выбираемого текста.

Все корневые морфемы обладают свойством «старения», т. е. постепенного снижения частоты до нуля, после чего исчезают. Скорость выпадения различных корней не одинакова.

Корневой состав языка распадается с равномерной скоростью (из определенного набора корней за определенный промежуток времени выпадает фиксированное количество).

С. Старостин: выводы по «корневой» глоттохронологии

«Устойчивость корней не зависит от «устойчивости» производных слов.

При отсутствии текстов список Сводеша может быть использован в качестве текста.

Математический аппарат классической лексической глоттохронологии может быть перенесен на корневые морфемы.

Развитие глоттохронологии

При всей критике и отрицании глоттохронологических идей метод сегодня существует и развивается.

Циклические процессы в языке

Модель жизненного цикла языкового знака

Модель жизненного цикла языкового знака (А. А. Поликарпов): общие положения

В основе развития языка лежат циклические микропроцессы, т.е. процессы, происходящие в истории каждой из его единиц – от её зарождения, направленного развития и до вымирания.

Под «жизненным циклом» подразумеваются закономерные изменения, свойственные в виде тенденции каждому языковому знаку – от его рождения до смерти.

Изменения связаны с тем, что знак обладает некоторым потенциалом развития, который постепенно исчерпывается в ходе его коммуникативного обращения.

Набор значений языковых знаков отображает набор смыслов, присутствующих во внутренних мирах носителей конкретного языка.

В связи с традиционными лингвистическими наблюдениями над языком и современными статистическими исследованиями словарей и корпусов можно сформулировать ряд положений (тенденций), связанных с циклическим характером языкового генезиса.

Три параметра языкового знака, связанные с его жизненным циклом

Ассоциативно-семантический потенциал (АСП): общее число значений, которое может быть порождено в течение жизни знака.

Активность: скорость порождения значений.

Стабильность: степень долгожительства значений, которые появляются у знака.

Некоторые положения модели жизненного цикла: полисемия

Тенденция к разрастанию со временем смысловой области каждого значения и к появлению новых значений у знака как частный случай скачкообразного расширения смысловой области материнского значения и автономизации её частей.

Тенденция к абстрактивизации значений знаков в их истории как следствие расширения их смыслового объёма.

Тенденция к повышению относительной частоты употребления каждого последующего значения в истории знака.

Чем каждое последующее значение знака оказывается относительно более абстрактно, тем оно должно быть (в среднем) менее активно в порождении от него последующих значений.

Существует тенденция к постепенному истощению ассоциативно-семантического потенциала любого значения знака и перераспределению этого потенциала между производными значениями знака.

Развитие полисемии: высокий (БТС)

1. Большой по протяжённости снизу вверх; находящийся далеко вверху; превосходящий обычную, среднюю высоту (противоп.: низкий). Вая гора. Вие облака. Вая трава. В. каблук. В. потолок. В. прыжок. В. лоб (большой и открытый).

2. Значительный по количеству, интенсивности, степени проявления и т.п.; превышающий средний уровень, среднюю норму. Вая активность. Вая производительность труда. В. урожай. Вие темпы. Вие цены.Вое напряжение, давление. Вая концентрация вещества. Вая чувствительность. В. уровень жизни. Вие требования.

3. Очень хороший; отличный. Вие оценки. Вие достоинства. Показать в. класс. Товары высокого качества. Быть высокого мнения о себе.

4. Выдающийся по значению; почётный, важный. Вая награда. В. пост. Вая честь. Вое звание. Вое общественное положение.Оправдать вое доверие. Приветствовать высокого гостя. Вращаться в высоких сферах.

5. Возвышенный, благородный, лишённый корыстных помыслов, чувств. В. порыв. Вое чувство. Вое искусство. В. идеал. Вая цель.

6. Приподнятый, торжественный (о языке, стиле). В. слог.

7. Вызываемый колебаниями большой частоты; тонкий и звонкий (о звуке, голосе). Вая нота. В. дискант.

Развитие полисемии: высокий (БТС)

1. Большой по протяжённости снизу вверх.

2. Значительный по количеству, интенсивности

3. Очень хороший; отличный

4. Выдающийся по значению

5. Возвышенный, благородный

6. Приподнятый, торжественный

7. Тонкий и звонкий (о звуке)

Разрастание смысловой области каждого значения.

Абстрактивизация значений.

Повышению частоты употребления каждого последующего значения.

Чем каждое последующее значение знака оказывается относительно более абстрактно, тем оно менее активно в порождении от него последующих значений.

Постепенное истощению ассоциативно-семантического потенциала любого значения знака и перераспределению этого потенциала между производными значениями знака.

Некоторые положения модели жизненного цикла: процесс развития полисемии

Наложение друг на друга двух процессов – (1) постепенно замедляющегося и останавливающегося в определённый момент процесса появления новых значений и (2) начинающегося позже и тоже постепенно замедляющегося процесса выпадения ранее появившихся значений – приводит к формированию асимметричной кривой развития полисемии знака, с пиком развития полисемии, сдвинутым к началу жизненного цикла знака (см. далее).

Кривая жизненного цикла языкового знака (А. А. Поликарпов, В. В. Поддубный)

Кривая x1(t) — процесс роста числа значений знака, x2(t) — процесс выпадения значений знака из употребления, x(t) = x1(t) − x2(t) — процесс развития активной полисемии знака, t — условное время.

Некоторые положения модели жизненного цикла: длина слова и омонимия

Обратнопропорциональная зависимость между частотой употребления знака и его длиной была замечена Джорджем Ципфом Эта зависимость позволяет носителям языка общаться относительно экономно, затрачивая на производство каждого из самых употребительных знаков относительно меньше усилий.

В связи с ростом частоты употребления знаков в ходе их жизненного цикла и падением их длины должна нарастать вероятность их омонимизации – совпадения по звучанию и/или написанию.

Разрыв связей между значениями слова – источник развития омонимии в языке (среда – среда). Начальные значения знака относительно более конкретны, чем последующие. Вероятность разрыва полисемической цепи (из-за выпадения значения) в начальный период жизни знака существенно выше, чем в каждый последующий. Пик образования лексических омонимов на основе разрыва полисемических связей сдвинут к началу жизни знака.

Некоторые положения модели жизненного цикла: синонимия и антонимия

В связи с абстрактивизацией значений вследствие их старения (и старения знаков в целом) может быть выдвинут и прогноз о повышении, в среднем, вероятности синонимизации значений слов с увеличением их возраста. Ср. синонимию высокий – интенсивный, отличный, важный, тонкий и т. д. на уровне разных значений.

Аналогичная логика позволяет прогнозировать и более активное вхождение в антонимические отношения значений слов с увеличением их возраста. Ср. антонимию высокий – низкий на уровне разных значений.

Некоторые положения модели жизненного цикла: устойчивость лексики

Тип значения: Слова более признаковых частей речи (например, прилагательных и глаголов) в силу более широких значений должны быть более устойчивыми во времени.

Количество значений: Относительно более полисемичные слова также успешнее сохраняются во времени.

Возраст слова: Чем слово древнее, тем, в среднем, более абстрактная семантика свойственна его значениям, и тем большая стабильность свойственна этому слову. Этот, казалось бы, парадоксальный вывод («чем древнее слово сейчас, тем у него больше шансов сохраниться в языке в какой-то момент в будущем в сравнении с более молодыми словами») базируется на факте асимметричного соотношения знаков в человеческих языках по их способности к длительности жизни той или иной степени. Больше всего в каждый данный период в языке рождается слов-однодневок (ср.: кошмарить), несколько меньше тех, что способны к несколько более длительному существованию и т. д. до очень узкой группы слов-долгожителей (вспомним лист Сводеша).

Словообразовательная ступень: Тенденция к меньшей сохранности слов всё более отдалённых ступеней деривации. Лист – листва – лиственный – лиственница – лиственничный.

Некоторые положения модели жизненного цикла: фразеологизация

Тенденция к росту, а потом падению активности свободных значений слов к порождению от них фразеологически связанных значений. С ростом степени абстрактности значений слов всё более значительного возраста, увеличивается широта контекстов употребления каждого из таких значений. В результате в каких-то из этих контекстов слово в одном из таких значений начинает употребляться в особенности часто, что и ведёт в итоге к формированию новой устойчиво употребляемой и далее идиоматизирующейся комбинации слов, фразеологической единицы.

Война: гражданская, мировая, отечественная, холодная, крымская, русско-японская, японская, империалистическая, новая, великая, последняя, ядерная, настоящая, партизанская, франко-прусская, священная, звездная (-ые), тридцатилетняя, большая, минувшая… … гибридная, латентная…

Некоторые положения модели жизненного цикла: замещение лексики

Тенденция к переходу от обозначения частотного смысла словосочетанием к его обозначению словом (сложным, аффиксальным производным, заимствованным, аббревиатурой): зачетная книжка – зачетка, кабинет министров – кабмин, электронное устройство (а теперь и любое приспособление) – гаджет.

Системные тенденции процесса образования новых суффиксально-производных слов [в русском языке] как продолжение системных тенденций лексико-семантических процессов.

Некоторые положения модели жизненного цикла: деэтимологизация

Тенденция к деэтимологизации, семантическому и морфемному опрощению структуры слова. В ходе возможного дальнейшего роста употребительности производного слова носители языка могут утратить, забыть мотивацию морфемного состава слова (после десемантизации некоторых морфем и утраты независимого употребления служебными или предметными словами, генетически соответствующими некоторым морфемам). Т. е. может произойти деэтимологизация, семантическое опрощение, переосмысление некоторой группы морфем в пределах слова как одной морфемы, и, как следствие, опрощение его морфемной структуры.

Примеры: находить, подушка, забыть, зонтик (голл. zondek)…

Апробация модели

Экспериментальные данные, подтверждающие часть этих прогнозов, получены на материале синхронных и диахронических словарей, а также корпусов русского языка.

Ряд фактов нуждается в дополнительной проверке.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]