- •Прикладная и математическая лингвистика. Лексикостатистика.
- •Основные понятия квантитативной лингвистики и статистики речи.
- •4. Максимальная лексическая система и генеральная совокупность текстов.
- •Лексическая подсистема языка и внутренний лексикон
- •6. Слово в словаре и тексте. Употребительность слова в речи.
- •Частотные словари: структура, функции, составление.
- •Закон Ципфа и его интерпретации. Частотно-ранговые распределения.
- •Квантитативные исследования в области стилистики.
- •Возраст слова и языковая диахрония. Глоттохронология.
- •Лингвистическая статистика
4. Максимальная лексическая система и генеральная совокупность текстов.
Лексическая система – подсистема языка, уровень языка, занимает центральное положение.
Бесконечность в составлении предложений
По данным словарей языков индо-европейской семьи, славянской группы макс. Лекс. Сист. 500000-1000000ед.
От 20 до 80 –фонем
От 1000 – морфем
Для англ.яз 1000 000 лексем
Слово или лексема – основная единица языка. Основная единица речи – словоформа. Running words – lexeme, tokens – type
Текстовое слово – лексема
Существует форма и словоупотребление (сколько раз встречается в данной выборке)
Максимальная лексическая система – словарь
Количество слов максимальной лексической системы русского языка превышает 1 млн. Отсутствие такого словника объясняет исключительно влиянием факторов экстралингвистических. Внутри этого словника идеального универсального словаря выделяется лексика литературного языка в широком смысле, основной отличительной особенностью которого в противоположность литературному языку в общепринятом понимании (по нашему пониманию, литературному в узком смысле) является присутствие в нём всех терминологий естественных, общественных и технических наук, всех отраслей промышленности, сельского хозяйства, транспорта, связи, торговли, сферы обслуживания и т.д.
Профессиональное просторечие и профессиональные жаргоны как явления внелитературной речи при этом исключаются. Лексика литературного языка в широком смысле содержит менее 1 млн. слов, но явно больше 300.000 слов (см. Схему). МАКСИМАЛЬНАЯ ЛЕКСИЧЕСКАЯ СИСТЕМА
(
Лексика литературного языка в широком
смысле
(<1 млн. и >300.000 слов)
Лексика литературного языка в узком
смысле
(общеупотребительная лексика
≤ 300.000 слов)
лeксическое ядро языка (индивидуальный
запас личности); основа лексических
минимумов (≤30.000 слов)
Внелитературная лексика
специальные термины
Максимальная лексическая система, включающая в свой состав свыше 1 млн. слов, реализуется в генеральной совокупности текстов.
Ввиду того что максимальная лексическая система (термин П.Н. Денисова) практически не может быть воплощена в одном издании, необходима взаимосвязанная система справочных словар ноэнциклопедических изданий, которая была бы задумана таким образом, чтобы все издания этой серии как бы взаимно дополняли друг друга, а каждое в отдельности отражало бы существенную часть максимальной лексической системы, т.е. какуюнибудь само стоятельную лексическую систему, достаточно большую, чтобы заслужить отдельное описание.
Генеральная совокупность текстов – речь - ???
Генеральная совокупность (от лат. generis — общий, родовой) (в англ. терминологии — population) — совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы.
Генеральная совокупность состоит из всех объектов, которые имеют качества, свойства, интересующие исследователя.
Генеральная совокупность – совокупность всех текстов данного автора или данного функционального стиля или отдельного подъязыка науки (лингвистика, экономика, архитектура и проч.). Можно провести исследование всей данной совокупности, но это потребует больших временных и материальных затрат. В связи с этим из генеральной совокупности выбирают ограниченное число объектов, которые подвергаются изучению.
