Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Часть первая.doc
Скачиваний:
11
Добавлен:
13.09.2019
Размер:
456.7 Кб
Скачать

Глава II. Лексический уровень

Лексический уровень является следующим по сложности уров­нем языковой иерархии после фоно-графического и морфологичес­кого. Важность слова для всей жизни и деятельности человека невозможно переоценить. Не называя все окружающие нас пред­меты, процессы, явления, понятия, мы не можем существовать как общество. Ученые нередко называют язык языком слов. Этим под­черкивается первостепенная значимость слова как основной еди­ницы языка, которая обеспечивает усвоение, хранение и переработ­ку всей информации о внешнем мире, поступающей в мозг чело­века. Словом обозначаются все объекты, процессы, явления, окру­жающие нас: без слова немыслима коммуникативная деятель­ность. Мы часто упоминаем такие понятия, как «язык танца», «язык жеста», или нам многое «говорит» музыка или живопись, и это действительно так: самые разнообразные виды информации можно закодировать и передать без помощи слов. Однако, не го­воря уже о крайне ограниченных возможностях передачи ло­гической информации названными и подобными им (не языковы­ми) знаковыми системами, следует подчеркнуть, что слово включа­ется и в их использование на каком-то этапе их функционирования. В целом ряде случаев в переносных выражениях понятие «слово» означает речь вообще. Так, мы говорим о «художниках слова», о «мастерском владении словом», о «всемогуществе слова, которое и ранить, и убить может». Эта роль слова в жизни общества вызы­вает повышенный интерес филологов и мыслителей всех времен и народов к организованному собранию слов языка — словарю.

Наполняемость словаря разных языков неодинакова. Напри­мер, язык индейцев Мейнаку из Южной Бразилии содержит всего

29

1000 слов. В это же время толковые словари развитых языков мира насчитывают около полумиллиона словарных статей. Если учесть, что большинство зарегистрированных слов неоднозначны, эту циф­ру можно увеличить в два-три раза. Но даже если считать только по количеству зафиксированных самостоятельных единиц (лек­сем), окажется, что этот гигантский фонд для человека слишком велик и он успевает освоить в течение жизни лишь 12—13 °/оэтого состава, причем только 10—15 °/о указанного количества (5500— 7500 единиц) — активно. Например, курс математики можно слушать, обладая запасом в 125 слов, физики — 150 слов '. При этом, однако, отмечается, что «человечество становится все говор­ливее. На десять библейских заповедей ушло 300 слов. Американ­ская декларация независимости потребовала 1500 слов. Сообщение же о повышении цен на уголь в одной из капиталистических стран потребовало 26811 слов»2.

В своей коммуникативной деятельности мы обходимся вполне обозримым количеством слов, многократно повторяя их в разных ситуациях. Для выявления того, как используется в речи имею­щийся словарный потенциал, был создан особый тип словаря — частотный словарь. Именно он доказательно обнаружил не­соответствие того места, которое слово занимает в списочном сос­таве (словнике) всех лексических единиц текста (текстов), тому месту, которое оно занимает, повторяясь, в тексте. В словнике, так же как и в привычных типах алфавитных словарей, все слова равноправны и каждому отведена одна позиция. Так, в словнике из ста слов определенный артикль "the" и, например, лексема "as­signment" занимают каждый по одному проценту списка. Иное дело текст (речь). Здесь они повторяются с разной частотой. Те, что повторяются чаще других, возглавляют частотный список и об­разуют его высокочастотную зону.

Составление частотных словарей — дело очень трудоемкое: ну­жно расписать на отдельные карточки все словоупотребления тек­ста, потом свести их вместе и представить в виде соответствующей словоформы. Потом все словоформы сводятся в единую лексему с общей абсолютной частотой (Fa), которая и служит основанием для определения места (ранга — R) данной лексемы в общем спис­ке лексических единиц, обнаруженных в тексте.

Для выявления частоты слова, характерной для речи вообще, берется материал из разных текстов и функциональных стилей. Чем длиннее такая выборка, тем достовернее результаты. Больши­нство имеющихся крупных частотных словарей исходят из выбор­ки, приблизительно равной одному миллиону словоупотреблений. Расписывание этого огромного количества слов занимает столь долгое время, что лексикографы перешли на машинное составле-

1 См. Иностранные языки в школе.—М., 1965.— № 2.— С. 81.

2 Зубков Б. Пишу, печатаю, диктую // Знание — сила,— М., 1976.— № 8.— G. 49.

30

нце частотных словарей. Процедура работы многократно убыстря­ется, хотя результатом машинной обработки чаще является список словоформ, а не лексем. Сведение словоформ в лексемы естествен­но изменит порядок их следования. Вот, например, начала трех частотных списков. Первый дает частотность словоформ, другие — лексем.

ранг

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Словарь'

Carrol

the

of

and

a

to

in

is

you

that

it

he

for

was

on

are

Fr. Kuc

the

be

of

and

a

in

he

to (inf)

have

to (prp)

it

for

I

they

with

Засор.

в (во)

и

не

на

я

быть

что

он

с (со)

a

как

это

вы

ты

к(по)

1 Carrol i. American Heritage Word Frequency Book.— N. Y., 1971. Nelson W. Francis and Henry Kucera. Frequency Analysis of English Usage.— Boston, 1982.

Частотный словарь русского языка/Под ред. Л. Н. Засориной.— М., 1977.

Можно привлечь для сравнения другие словари этих же или других языков. Абсолютные частоты (т. е. сколько раз встретилось каждое слово во всей выборке) в них могут различаться, что зави­сит от объема выборки: чем она длиннее, тем вероятнее повто­ряемость слова. У. Фрэнсис, например, пишет, что выборка в 1 000 000 словоупотреблений дала 50 000 разных словоформ, т. е. отношение количества слов к количеству их употреблений соста­вило 1 : 20. Увеличение выборки в 5 раз — до 5 000 000 словоупо­треблений — дало прирост новых слов на 74 °/о (87 000 единиц), т. е. более чем вдвое изменило соотношение — 1 :57'.