Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

khrolenko_a_t_bondaletov_v_d_teoriya_yazyka

.pdf
Скачиваний:
336
Добавлен:
29.10.2019
Размер:
2.21 Mб
Скачать

жественных текстах Ф.М. Достоевского, А.Н. Баранов гипер трофированную частотность по крайней мере объясняет твор ческой позицией Достоевского, осознающего всю сложность и противоречивость окружающего мира. Книжное по мень! шей мере, будучи более точным и определенным, требует оп ределенности и в суждениях о мире [Баранов 1998: 134].

Шире всего количественные методики используются при описании лексического уровня языковой системы. Лингвисты убеждены,чтолексемныйяруссистемен,ноегосистемностьосо бого рода. В лексике целостность и устойчивость системы соче тается с автономностью частей (подсистем). В ней заметна мас совость и случайность и одновременно господствует необходи мость. Всё это характерно для вероятностных систем. Известен выводБ.Н.Головина:«Языквероятностен,речьчастотна».Кван титативная лингвистика возможна потому, что для речи харак терна относительная стабильность частот отдельных элементов или групп элементов и устойчивое распределение элементов, выражающее наличие внутренней упорядоченности в системе. Единицами и уровнями квантитативного анализа являются сло воформы, лексема и словоупотребление [Тулдава 1987].

Практическим результатом статистического изучения лек сики являются частотные словари, отличающиеся от обычных лингвистических (толковых, орфографических и других) тем, что словарные единицы располагаются в них не только в ал фавитном порядке, но и в порядке убывающей частотности. В первом случае это будет алфавитный частотный словарь, а во втором — ранговый частотный словарь. Частотные слова ри характеризуются следующими параметрами: объём тек ста (число словоупотреблений), объём словаря словоформ, объём словаря лексем.

Первым частотным словарём был словарь Кединга (1898). За девяносто лет XX столетия было составлено несколько сот частотных словарей и частотных списков для нескольких де сятков языков. Первым частотным словарём русского языка был словарь Г. Йоссельсона (США, Детройт, 1953). В нашей стране первый частотный словарь русского языка был состав лен Э. Штейнфельд (1963). Интересны материалы к частот ному словарю языка Пушкина (1963). В 1977 г. вышел в свет

471

«Частотный словарь русского языка» под редакцией Л.Н. За сориной. Создавался он на основе выборки в один миллион словоупотреблений из четырёх жанров (художественная про за, драматургия, научная публицистика, газетно журнальные материалы). В нём около 40 тыс. слов. Самое частотное слово — предлог в (во) далее идут служебные слова и местоимения (и, не, на, я, быть, что, он, с, а, как, это). Самое частотное суще ствительное — год.

В 90 х гг. XX в. в Швеции вышел в свет «Частотный сло варь современного русского языка» (Уппсала, 1993).

Идея частотных словарей возникла из практической по требности решения ряда вопросов: 1) создание рациональной методики изучения родного и иностранного языков; 2) усо вершенствование различных кодовых систем; 3) выявление специфики разных стилей литературных памятников или языка отдельных авторов. Вслед за частотными списками слов появляются словари, отражающие частоты морфем и грам матических форм.

Частотные словари позволили обнаружить целый ряд ко личественных закономерностей в лексическом составе язы ка. Первые 1500 слов частотного словаря для любого языка составляют примерно 80% всех словоупотреблений. Причём 12 самых частотных слов — артикли и предлоги — из 20 тыс. слов (словарь Эсту) составляют примерно 40% всех словоу потреблений. По Г. Йоссельсону, в русском языке наречия, предлоги, союзы, частицы составляют 13,9% всего текста. Сделан общий вывод, что первые 50 слов охватывают грам матический словарь любого языка.

Нет сомнения, что частотные словари окажутся мощным инструментом теоретического и практического языкознания. Они могут дать корректные в научном смысле выводы о струк туре общенародной лексики и количественном соотношении её различных пластов, помогут решить проблему языковой нормы и строго определить понятие функционального стиля.

Характерно, что математические методы обладают следу ющими возможностями:

— делают точными суждения, основанные на количествен но частотных соображениях;

472

указывают на такие обстоятельства функционирования языка или диалекта, которые иными способами не обнаружи ваются;

позволяют глубже и всесторонне понять причины и результаты языковой эволюции, длительность эволюционных процессов и их хронологию, и даже прогнозировать будущее языковое развитие;

расширяют сферу прикладного использования языкоз нания [Русинов 1983: 42].

Количественная методика стала более эффективной с по явлением вычислительной техники.

Определение авторства с помощью формально количе ственных и статистических методов стимулировало поиск и выявление характерных структур авторского языка. На этом строятся многообразные методики, представленные в книге «От Нестора до Фонвизина. Новые методы определения ав торства» (М., 1994).

Два специалиста исследовали несколько простых парамет ров авторского стиля и на базе большого количества произ ведений писателей XVIII—XX вв. статистически доказали, что доля всех служебных слов в данном прозаическом произве дении является авторским инвариантом [Фоменко В.П., Фо менко Т.Г. 1996]. Д.В. Хмелев, опираясь на модель цепей

А.А.Маркова, предложил методику определения авторства, основанную на том, что по произведениям автора, которые достоверно им созданы, вычисляется матрица переходных час тот употреблений пар букв. Затем такие матрицы строятся для каждого из авторов, «подозреваемых» в написании анонимно го текста, и для каждого автора оценивается вероятность того, что именно он написал анонимный фрагмент текста. В резуль тате автором анонимного текста полагается тот, у которого вычисленная оценка вероятности больше [Хмелев 2000].

В многолетний спор по поводу того, кто является истин ным автором романа «Тихий Дон», в свое время включились скандинавские ученые, норвежско шведский коллектив под руководством Г. Хьетсо. Они взяли тексты, бесспорно при надлежащие М. Шолохову, и тексты донского писателя Ф. Крюкова, которому приписывалось авторство великого ро

473

мана, и проанализировали их, выявляя особенности писательс кой манеры каждого. Учёные сравнили длину предложений, распределения длины предложений по количеству слов, распре деление частей речи, сочетание частей речи в начале и в конце предложения, частоту применения союзов в начале предложе ний, лексические спектры, повторяемость словарного запаса по богатству. Естественно, сделать это оказалось возможным толь ко с помощью мощной вычислительной техники. Математи ческая статистика при контрольной выборке на ЭВМ 12 тыс. фраз при 164 637 словах представлена в 250 таблицах, форму лах и графиках [Книжное обозрение. — 1999. № 18—19. С. 6]. Вывод однозначен: из двух претендентов на авторство «Ти хого Дона» Крюков явно обладает наименьшим правом. «...Применение математической статистики позволяет нам исключить возможность того, что роман написан Крюковым, тогда как авторство Шолохова исключить невозможно». Най денная сравнительно недавно рукопись великого романа (885 рукописных страниц, 605 из которых написаны рукой самого Шолохова, а 285 страниц — женой писателя и её сестрой) окончательно утвердила авторство М.А. Шолохова и правоту скандинавских ученых [Наука и жизнь. 2000. № 1. С. 24—25].

В Эдинбурге (Англия) разработан аналитический метод, основывающийся на учёте зависимости частоты употребляе мого слова и длины предложения, в котором оно появляется. Этот метод получил название «диаграммы накапливающих ся сумм». С его помощью установлено, что каждому человеку свойствен прочно укоренившийся, неизменный стиль, кото рый не поддаётся имитации. Например, стиль Т. Харди в «Руке Этельберты» (1876) убедительно совпадает со стилем «Джуда Неизвестного». Анализ показал, что авторы приобретают и сохраняют постоянный стиль, как бы ни сложилась их жизнь. Например, стиль В. Скотта в «Антикварии» (1816) полностью совпадает с его стилем в «Замке опасностей», написанном после того, как знаменитый английский писатель перенёс три инсульта, один из которых лишил его речи и нарушил двига тельные способности. Метод выявляет в тексте инородные вставки, обнаруживает попытки подделать авторский стиль. Английская писательница Джейн Остин не окончила повесть

474

«Сандиция», которая обрывается на семьдесят третьем пред ложении одиннадцатой главы. Повесть была дописана другой писательницей. При чтении невозможно определить, где за канчивается текст Д. Остин, а метод позволяет точно найти инородную часть повести [За рубежом. 1990. № 44. С. 20—21].

Тот факт, что объём активного лексикона Шекспира со ставляет от 15 до 24 тыс. слов и что количество новых слов, введенных в язык Шекспиром, превышает 3200 единиц, сви детельствует в пользу тех, кто считает, что Шекспир — это псев доним, под которым творил не один человек. У Ф. Бэкона, кото рому некоторые приписывают авторство пьес и сонетов Шекс пира, лексикон составлял 9—10 тыс. слов (у современного англичанина с высшим образованием словарный запас вклю чает 4 тыс. лексем) [Знание — сила. 2000. № 2. С. 109].

Специалисты говорят о безусловной возможности и це лесообразности постановки на ЭВМ исследований по любой лингвистической теме. Реальная перспектива — глобальная ин форматизация языкознания — от сбора данных до выхода на учныхтрудов из печати [Хант 1993; Использование ЭВМ 1990].

Использование количественных методик в языкознании не означает, что наука о языке стала одной из математичес ких дисциплин. Устойчиво мнение о том, что язык как целое не является подходящим объектом для эффективной матема тической обработки. Как заметил А.Ф. Лосев, в языке нет никакой однородности и никакого постоянства. Родительных падежей столько же, сколько и тех контекстов, в которых они встречаются; и отношений между членами предложений фак тически столько же, сколько и самих предложений. Матема тика же имеет дело с сущностями устойчивыми [Лосев 1983], даже с омертвевшими, как полагал философ и культуролог О. Шпенглер. «Становление «не имеет отношения к числу». Только безжизненное можно сосчитать, измерить, разложить. Чистое становление, жизнь не имеет границ в этом смысле. Оно лежит вне границ области причины и действия, закона и меры»; «Средством для понимания мертвых форм служит математический закон» [Шпенглер 1993: 35, 112]. Математик М. Клайн заметил, что количественное описание может дать о богатом и разнообразном опыте не более полное представ

475

ление, чем рост человека о человеке, а специалист в области вычислительной математики Р. Хэммингтон говаривал, что цель расчетов — понимание, а не числа. Всё более популяр ной становится мысль о том, что в науке островки рациональ ных рассуждений соединены мостами иррациональных озаре ний.Отмечаетсятенденцияк«дематематизации»физики,кпре вращению её (как и химии) в качественную физику, которая в отличиеотклассическойфизики,опирающейсянаизощренный математический аппарат, стремится отразить в своих понятиях интуициюисследователя практика,достигающегонеобходимых результатов без излишних вычислений, опираясь на один толь ко здравый смысл (Из доклада акад. Д.А. Поспелова. См.: [Фи лософские науки. 1995. № 2—4. С. 233]).

Сущностные характеристики языка могут быть исследо ваны только с помощью целого ряда методов и методик, сре ди которых своё место занимают и количественные методи ки. Они являются хорошим вспомогательным средством глу бокого проникновения в суть языка. Лингвистика остаётся единой наукой, сочетающей качественные и количественные методики для более адекватного описания системы языка и характеристики его функций.

Лингвистике в союзе с математикой ещё предстоит про верить истинность утверждения, что все слова в языке име ют суммарные численности меры, подчиняющиеся строгой закономерности, что слова синонимы имеют одну и ту же сумму чисел, что в древних языках слово одного смысла име ют одинаковую числовую меру [Мартынов 1989: 122].

Петербургский поэт и переводчик «Слова о полку Игоре ве» Андрей Чернов нашёл, что построение стихов загадочно го древнерусского памятника подчиняется определенным математическим закономерностям, а именно — формуле «се ребряного сечения». А. Чернов сделал заключение о том, что «Слово о полку Игореве» имеет девять песен и что в основу текста легла круговая композиция. Если в композиции «Сло ва» лежит круг, то у него должен быть «диаметр» и некая ма тематическая закономерность. Число стихов во всех трёх ча стях «Слова» (их 804) А. Чернов разделил на число стихов в

476

первой (или последней) части (256), в итоге получил 3,14, т.е. число «пи» с точностью до третьего знака. Эту же закономер ность А. Чернов выявил при изучении «Медного всадника» Пушкина, в котором использована круговая композиция, а также храма Софии Полоцкой. Исследователь сделал вывод: математический модуль автор «Слова» использовал интуитив но, неся внутри себя образ древнерусских архитектурных па мятников. В те времена храм являл собой всеобъемлющий ху дожественный идеал, оказывающий влияние на композицию и ритмику стихосложения.

Исследователь назвал обнаруженную им закономерность в построении древнерусского литературного памятника и древнерусских храмов принципом «серебряного сечения» [Известия. 1995. 1 февр. С. 7].

Точность в общественных науках определяется степенью адекватности отражения предмета и далеко не всегда выра жается языком математики. Не количество математических формул на странице научного труда, а степень строгости оп ределения элементарных структур и явлений, которые харак теризуют данную область исследования, определяют точность научного поиска. «Точность достигается культурой специаль ных и точных исследований. Ни одна из точных наук не раз вивается путём создания общих курсов и монографий, а пу тём кропотливых, математически чётких частных исследова ний». «Точность нужна в той мере, в какой она допускается природой материала. Излишняя точность может оказаться помехой для развития науки и понимания существа дела» [Ли хачёв 1981: 196—197]. Не голые цифры и не наукообразные формулы, а культура математического мышления нужна прежде всего гуманитарным наукам и языкознанию в част ности. И вообще существо математики никоим образом не определяется числом (М. Хайдеггер).

Языкознание, по существу, занимает среди гуманитарных наук особое место, дав классические образцы научной точ ности. Так, по мнению учёных, сравнительно историческое языкознание до сих пор остаётся примером точного лингвис тического исследования. Не случайно установленные линг

477

вистикой факты широко используются историками, литера туроведами и представителями других смежных обществен ных наук. «Нет анализа более точного, чем языковой. В са мые смутные вопросы лингвистика нередко вносит матема тическую прозрачность» [Осетров 1970: 23]. Из множества примеров воспользуемся одним. Так, лингвостатистический анализ был использован в исследовании «Илиады» Гомера. Чтобы доказать, что Гомера не существовало и все 24 песни «Илиады» — по происхождению самостоятельные произве дения, соединенные в эпос позднее без особой переработки с целью унификации, была использована статистика отноше ний внутри синонимических пар (имен собственных, просто лексических пар, формул и т.п.).

По мнению автора исследования Л.С. Клейна, наиболее полные возможности для классификации текстов представ ляют главные этнонимы греков (ахейцы, данаи и аргивяне): они все три синонимичны, массовы (употребляемость исчис ляется сотнями), и они неравномерно и неодинаково распре деляются по книгам «Илиады». Окончательно вывод иссле дователя состоит в том, что разная употребительность имен, а также предлогов и частиц говорит о том, что это (песни. — А.Х.) были не просто и не только источники, а самостоятель ные вклады, ставшие составными частями поэмы; сохран ность в окончательном тексте первоначально выбранных эт нонимов, топонимов, теонимов и служебных слов (и это при наличии других синонимов) говорит о том, что переработка поэтической ткани при объединении самостоятельных песен в поэму была незначительной [Клейн 1998: 18, 96, 112, 436]. Как показано исследователем, фольклорные песни, состав ленные в разных местах древнегреческого мира, воспевали подвиги разных героев — участников и троянской войны, и прочих мифических кампаний. Песни приспосабливались к ранее существующим сюжетам, взаимопересекаясь, часто противоречили друг другу. «Стыки» разных песен были об наружены вдумчивым и тонко проведенным анализом.

Слова Гёте «Я уважаю математику как самую возвышен ную, полезную науку, поскольку её применяют там, где она

478

уместна, но не могу одобрить, чтобы ею злоупотребляли, при меняя её к вещам, которые не входят в её область и которые превращают благородную науку в бессмыслицу», — чрезвы чайно актуальны и в наше время — время взаимопроникно вения наук.

Дополнительная литература

Арапов М.В. Квантитативная лингвистика. — М., 1988.

Арапов М.В., Херц М.М. Математические методы в исторической лингвистике. — М., 1974.

Головин Б.Н. Язык и статистика. — М., 1971.

Журавлев А.Ф. Лексикостатистическое моделирование системы славянского языкового родства. — М., 1994.

Клейн Л.С. Анатомия «Илиады». — СПб., 1998.

Крейдлин Г.Е., Шмелев А.Д. Математика помогает лингвистике: Кн. для учащихся. — М., 1994.

Носенко И.А. Начала статистики для лингвистов. — М., 1981.

От Нестора до Фонвизина: Новые методы определения авторства. — М., 1994.

Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. — М., 1977.

Сухотин Б.В. Исследование грамматики числовыми методами. — М., 1990.

Хант Дж. Вычислительная лингвистика в Летнем Институте лингвистики // Вопросы языкознания. 1993. № 6. С. 114—125.

Частотный словарь русского языка / Ред. Л.Н. Засорина. — М., 1977. Шайкевич А.Я. Дифференциальные частотные словари и изучение языка Достоевского (на примере романа «Идиот») // Слово Дос-

тоевского. Сб. статей. — М., 1996. С. 195—253.

І

479

ВМЕСТО ЗАКЛЮЧЕНИЯ

Наука о языке в системе человеческого знания

Учитель словесник нередко слышит полувопрос полуут верждение ученика: «Русский язык — разве это наука? Вот физика, химия...» Действительно, то, что представлено в школьных учебниках по русскому и иностранному языку, трудно назвать наукой, по крайней мере, по внешним при знакам. Это, скорее, набор определений, правил, исключений из них, кратких комментариев и упражнений с заданиями. И даже многим хорошим учителям не удаётся переубедить мо лодого скептика, ибо сам учитель не всегда представляет цели, задачи, теоретические и практические возможности науки о языке, общенаучной и обыденной ценности её. Уважитель ное отношение обучаемых к лингвистике можно воспитать, осознавая её как важную и интересную область человечес кого познания, зная место лингвистики в системе наук и об щественной практики.

Познание материального мира не было равномерным. В каждую отдельную эпоху различные науки как составные интеллектуального освоения мира обладали неодинаковой степенью актуальности. Неравномерность развития каждой науки и значительное колебание её престижа в обществен ном сознании обусловливается различными причинами, глав ной из которых является развитие производительных сил и производственных отношений.

История лингвистики показывает, как меняется роль на уки в различные периоды жизни общества. Сложившись в недрах филологии, языкознание постепенно становится са мостоятельной наукой. В XIX в. оно переживает расцвет, пи тает плодотворными идеями и методами другие науки, усва

480