Глава II. Лексический уровень
Лексический уровень является следующим по сложности уровнем языковой иерархии после фоно-графического и морфологического. Важность слова для всей жизни и деятельности человека невозможно переоценить. Не называя все окружающие нас предметы, процессы, явления, понятия, мы не можем существовать как общество. Ученые нередко называют язык языком слов. Этим подчеркивается первостепенная значимость слова как основной единицы языка, которая обеспечивает усвоение, хранение и переработку всей информации о внешнем мире, поступающей в мозг человека. Словом обозначаются все объекты, процессы, явления, окружающие нас: без слова немыслима коммуникативная деятельность. Мы часто упоминаем такие понятия, как «язык танца», «язык жеста», или нам многое «говорит» музыка или живопись, и это действительно так: самые разнообразные виды информации можно закодировать и передать без помощи слов. Однако, не говоря уже о крайне ограниченных возможностях передачи логической информации названными и подобными им (не языковыми) знаковыми системами, следует подчеркнуть, что слово включается и в их использование на каком-то этапе их функционирования. В целом ряде случаев в переносных выражениях понятие «слово» означает речь вообще. Так, мы говорим о «художниках слова», о «мастерском владении словом», о «всемогуществе слова, которое и ранить, и убить может». Эта роль слова в жизни общества вызывает повышенный интерес филологов и мыслителей всех времен и народов к организованному собранию слов языка — словарю.
Наполняемость словаря разных языков неодинакова. Например, язык индейцев Мейнаку из Южной Бразилии содержит всего
29
1000 слов. В это же время толковые словари развитых языков мира насчитывают около полумиллиона словарных статей. Если учесть, что большинство зарегистрированных слов неоднозначны, эту цифру можно увеличить в два-три раза. Но даже если считать только по количеству зафиксированных самостоятельных единиц (лексем), окажется, что этот гигантский фонд для человека слишком велик и он успевает освоить в течение жизни лишь 12—13 °/оэтого состава, причем только 10—15 °/о указанного количества (5500— 7500 единиц) — активно. Например, курс математики можно слушать, обладая запасом в 125 слов, физики — 150 слов '. При этом, однако, отмечается, что «человечество становится все говорливее. На десять библейских заповедей ушло 300 слов. Американская декларация независимости потребовала 1500 слов. Сообщение же о повышении цен на уголь в одной из капиталистических стран потребовало 26811 слов»2.
В своей коммуникативной деятельности мы обходимся вполне обозримым количеством слов, многократно повторяя их в разных ситуациях. Для выявления того, как используется в речи имеющийся словарный потенциал, был создан особый тип словаря — частотный словарь. Именно он доказательно обнаружил несоответствие того места, которое слово занимает в списочном составе (словнике) всех лексических единиц текста (текстов), тому месту, которое оно занимает, повторяясь, в тексте. В словнике, так же как и в привычных типах алфавитных словарей, все слова равноправны и каждому отведена одна позиция. Так, в словнике из ста слов определенный артикль "the" и, например, лексема "assignment" занимают каждый по одному проценту списка. Иное дело текст (речь). Здесь они повторяются с разной частотой. Те, что повторяются чаще других, возглавляют частотный список и образуют его высокочастотную зону.
Составление частотных словарей — дело очень трудоемкое: нужно расписать на отдельные карточки все словоупотребления текста, потом свести их вместе и представить в виде соответствующей словоформы. Потом все словоформы сводятся в единую лексему с общей абсолютной частотой (Fa), которая и служит основанием для определения места (ранга — R) данной лексемы в общем списке лексических единиц, обнаруженных в тексте.
Для выявления частоты слова, характерной для речи вообще, берется материал из разных текстов и функциональных стилей. Чем длиннее такая выборка, тем достовернее результаты. Большинство имеющихся крупных частотных словарей исходят из выборки, приблизительно равной одному миллиону словоупотреблений. Расписывание этого огромного количества слов занимает столь долгое время, что лексикографы перешли на машинное составле-
1 См. Иностранные языки в школе.—М., 1965.— № 2.— С. 81.
2 Зубков Б. Пишу, печатаю, диктую // Знание — сила,— М., 1976.— № 8.— G. 49.
30
нце частотных словарей. Процедура работы многократно убыстряется, хотя результатом машинной обработки чаще является список словоформ, а не лексем. Сведение словоформ в лексемы естественно изменит порядок их следования. Вот, например, начала трех частотных списков. Первый дает частотность словоформ, другие — лексем.
ранг |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
Словарь' |
|||||||||||||||
Carrol |
the |
of |
and |
a |
to |
in |
is |
you |
that |
it |
he |
for |
was |
on |
are |
Fr. Kuc |
the |
be |
of |
and |
a |
in |
he |
to (inf) |
have |
to (prp) |
it |
for |
I |
they |
with |
Засор. |
в (во) |
и |
не |
на |
я |
быть |
что |
он |
с (со) |
a |
как |
это |
вы |
ты |
к(по) |
1 Carrol i. American Heritage Word Frequency Book.— N. Y., 1971. Nelson W. Francis and Henry Kucera. Frequency Analysis of English Usage.— Boston, 1982.
Частотный словарь русского языка/Под ред. Л. Н. Засориной.— М., 1977.
Можно привлечь для сравнения другие словари этих же или других языков. Абсолютные частоты (т. е. сколько раз встретилось каждое слово во всей выборке) в них могут различаться, что зависит от объема выборки: чем она длиннее, тем вероятнее повторяемость слова. У. Фрэнсис, например, пишет, что выборка в 1 000 000 словоупотреблений дала 50 000 разных словоформ, т. е. отношение количества слов к количеству их употреблений составило 1 : 20. Увеличение выборки в 5 раз — до 5 000 000 словоупотреблений — дало прирост новых слов на 74 °/о (87 000 единиц), т. е. более чем вдвое изменило соотношение — 1 :57'.