Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
семантика м.а..docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
558.07 Кб
Скачать

5.6. Квантитативные методы исследования семантики

    Естественные языки в отличие от искусственных, информационных не являются по своему устройству жесткими, логическими системами, поскольку между единицами естественного языка существуют не только связи, отражающие логико-предметные отношения реалий, но и вероятностные,

183

градуальные связи. Определение языка и его плана содержания как вероятностной системы требует для их объективного познания квантитативных методов, связанных с исследованием частотных, вероятностных, градуальных и других нелогических характеристик языка.

    Среди квантитативных методов, используемых в языкознании, следует различать количественные и статистические. С помощью количественных методов специалисты учитывают и регистрируют частоты встречающихся в текстах или в речи фактов благодаря их дискретности и повторяемости. Статистические методы используются для исследования фактов в их массовых проявлениях, с целью вскрыть закономерности (правила) появления этих фактов при функционировании языка. Статистические методы включают в себя разнообразные формулы, применяемые для выявления правил распределения языковых единиц в речи, для измерения различных как формальных, так и качественных явлений языка, для установления тех или иных тенденций в развитии и функционировании языка, для определения значимости исследуемых семантических явлений, установления зависимости между качественными и количественными, характеристиками языка. При употреблении квантитативных методов следует всегда придерживаться их основного назначения - исследовать качественное (семантическое) своеобразие рассматриваемого явления, степень интенсивности его свойств, поскольку связь между количественными и качественными показателями - один из основных законов диалектики.

    Неодинаковая интенсивность различных языковых явлений, настоятельно требующая количественных исследований, наиболее зримо видна именно при реализации разнообразных семантических свойств языковых единиц, что неоднократно подчеркивал И. А. Бодуэн де Куртенэ: "Значение напряжения и интенсивности некоторых элементов языкового мышления выступает наиболее выразительно в области семантики, как со стороны интеллектуальной, умственной, внечувственной, так и, прежде всего, с чувственной стороны. Некоторые ассоциации внеязыковых представлений с представлениями языковыми надо считать с этой точки зрения особенно сильными, выпуклыми, выпивающими, а в определенных условиях общественной жизни даже взрывающимися" (Бодуэн де Куртенэ 1963, т. 2: 323).

    Количественная оценка и характеристика качественных явлений языка представляет собой составную часть исследования сущности рассматриваемого языкового факта.

184

    Важно только правильно установить, что считать, зачем считать и как считать, а после произведенных подсчетов верно интерпретировать полученные количественные данные.

    Квантитативные методы могут иметь самостоятельную ценность при исследовании языка и его плана содержания и могут входить составной частью в другие методы.

    Статистические закономерности лежат в основе организации словаря любого языка и текста. Так, согласно закону Ципфа, впоследствии уточненному, отношение ранга слова в частотном словаре к частотности слова в языке составляет постоянную величину, константу r-f=c (где r-ранг слова в частотном словаре, f - частота слова, с - постоянная величина). Эта закономерность отражает в себе свойство организации человеческой памяти, которая, как правило, оперирует более частотными единицами языка во всех случаях спонтанного применения речи. С широтой использования слов связан закон Крушевского-Куриловича, согласно которому, чем шире сфера употребления слова, тем беднее его содержание (Курилович 1962: 11). Это соответствие уже непосредственно выводит зависимость между количественными и семантическими свойствами слова.

    Статистическая закономерность организации любого связного текста проявляется в том, что покрываемость текста разными словами подчиняется следующему правилу: в начале любого текста неповторяющихся (разных) слов встречается больше, а по мере продвижения в глубь текста их встречается все меньше, т. е. чем дальше от начала рассматриваемого текста мы находимся, тем меньше встречается в нем неповторяющихся ранее слов (Пап 1961).

    Статистическая активность слова в тексте - показатель его семантической активности в языке. Частотность слова представляет собой не только его важную словарную или текстовую характеристику, но и оказывает решающее влияние на позицию слова в человеческой памяти. Об этом можно судить по ответам носителей языка, когда они, не задумываясь, называют первые пришедшие им в голову слова при таком, например, задании, как Назовите домашнюю птицу, Назовите плод фруктового дерева и т. п. Можно не сомневаться, что самыми регулярными ответами будут курица, яблоко и т. п. Именно потому, что эти слова занимают более высокий ранг и в частотном словаре, и в памяти человека. Подчеркнем, что между частотными характеристиками слова в памяти и в словаре существует устойчивая связь (Фрумкина 1971: 14 и ел.). Изменение частотности языковых единиц в диахронии, как правило, свидетельствует о су-

185

щественном семантическом изменении статуса этой единицы в языке и об изменении той роли, которую играет обозначаемый данной единицей предмет или явление в жизни людей. Неодинаковое распределение слов разных частей речи в научном и художественном текстах (в языке науки гораздо чаще используются существительные) служит показателем большей предметности языка научных текстов по сравнению с художественными.

    Различной интенсивности проявления конкретного семантического свойства соответствует связанная с ним квантитативная характеристика форм тех языковых единиц, которые выражают это свойство при своем употреблении в речи. Задача языковеда в данном случае заключается только в том, чтобы вскрыть, какая языковая форма выражает рассматриваемое языковое значение, а это зачастую требует от исследователя изобретательности и наблюдательности, разработки специальных лингвистических процедур для обнаружения этих форм, поскольку количественные формы проявления различных аспектов значения не всегда лежат на поверхности языка, во многих случаях они завуалированы, скрыты и реализуются только в определенных ситуациях использования языка.

    Одна из задач исследования плана содержания языка сводится к осуществлению соответствующих измерений, вытекающих из имплицитно присущей ему неодинаковой степени проявления семантических свойств, различной силы семантической связи между значениями языковых единиц, неодинаковой семантической роли, выполняемой ими в языке, и т. д. Измерения могут быть неколичественными и количественными. В первом случае языковеды используют неконкретные количественные оценки, формулируют лишь общие закономерности, проявляющиеся скорее как тенденция, а не как строгое правило, связи количественных и качественных характеристик языковых единиц. Отметим, что неконкретные количественные оценки, данные, измерения, основанные на интуитивном знании языка исследователями, содержатся практически в большинстве лингвистических работ, независимо от того, как относится языковед к использованию квантитативных методов в целом.

    Неопределенные количественные оценки используются лингвистами при описании семантических явлений в виде выражений чаще, употребительнее, синонимичное, как правило, по всей вероятности, реже и т. п. (Головин 1971: 11; Altmann 1972: 5) или в виде формулировок некоторых пра-

186

вил, основанных на количественных пропорциях, соотношениях, взаимозависимостях и т. п. Например: "чем лучше известен смысл слова, тем ассоциации, основывающиеся на фактах мысли, интенсивнее стремятся вытеснить ассоциации, вызываемые формой слова; и наоборот: чем менее прочны ассоциации, основывающиеся на фактах мысли, тем ассоциации, вызываемые формой слова или даже его материальным звуковым обликом, интенсивнее стремятся выйти на первый план в сознании говорящего" (Балли 1961: 52- 53); "чем сильнее мы абстрагируемся от конкретных предметов, тем неопределеннее становятся границы значения" (Baldinger 1957: 23); "чем сложнее содержание (слова.- Б. П.), т. е. чем больше элементов содержится в нем, тем древнее оно" (Kronasser 1952: 50) и т. д.

    Конкретные оценки и измерения соответствующих семантических явлений отмечаются в тех случаях, когда взаимосвязь между содержанием языковой единицы и формой выражения этого содержания характеризуется определенными числами. Например, семантическое расстояние между словами в осмысленном предложении можно измерять путем учета количества прямых и опосредованных грамматических связей, имеющихся у каждого члена предложения с другими его членами. Напомним, что грамматическая связь есть, в сущности, формальное выражение семантических отношений между сочетающимися словами. Если слову, а затем словосочетанию, которые в пределах рассматриваемого предложения грамматически подчиняются другим словам и словосочетаниям, последовательно приписывать по одному баллу (по единице), а словам и словосочетаниям, подчиняющим себе другие слова и словосочетания, по нулю, то расстояние между словами в конкретном предложении, например Этот студент регулярно читает научные журналы, можно выразить и подсчитать по схеме (рис. 15).

    На схеме стрелками указаны подчинительные связи, знаком Х соединены группы подлежащего и сказуемого, которым приписывается по одному баллу, цифрами выражены расстояния между словами: чем больше количество баллов у слов данной пары, тем больше расстояние между ними в пределах данного предложения. Так, наибольшее расстояние на материале приведенного примера выражается числом 5 и отмечается между словами этот и научные (по кратчайшему пути, соединяющему эти два слова, насчитывается 5 единиц), а наименьшее расстояние выражается единицей и наблюдается между словами, соединенными прямой грамматической связью (Gammon 1963).

187

    Более сложные измерения расстояния между заданными словами используются в тех случаях, когда языковед опирается на количественные показатели, характеризующие определенный признак слов. Такими показателями могут служить количественные данные о тех грамматических формах существительных, которыми управляют исследуемые глаголы. Так, но данным обследованных текстов (Апресян 1966: 141-144), сочетаемость некоторых глаголов русского

языка с существительными в определенных падежах может быть представлена в виде таблицы.

    Цифры обозначают вычисленную вероятность встречи существительных в указанном падеже с приведенными глаголами.

    Расстояние, между глаголами каждой пары вычисляется по формуле

где а, Ь - заданные глаголы, р -. расстояние, 2 - сумма чисел, S - числовые значения (цифры в таблице).

188

    Вычисленные расстояния между рассматриваемыми глаголами можно представить в виде следующей матрицы:

    Как видно из приведенных данных, наиболее близкое расстояние отмечено между глаголами построить и производить (0,03), производить и создавать (0,09), а самое большое расстояние зафиксировано между глаголами беседовать и изменить (2,00), беседовать и построить (1,95). Подчеркнем, что эти количественные расстояния в какой-то мере отражают и семантическую близость рассматриваемых глаголов.

    Для разнообразных измерений семантических явлений языка в современной лингвистике используются и другие статистические формулы (коэффициент ранговой корреляции, коэффициент корреляции, коэффициент ассоциации и др.), "сырьем" для которых служат эмпирические данные о тех семантических свойствах языковых единиц, что фиксируются при их употреблении в речи. Применяются также разности между теоретически ожидаемыми показателями и эмпирическими данными, отклонения от средних .и т. д.

    Отметим, что даже элементарные количественные сведения о значимых единицах языка содержат существенную информацию о качественной стороне этих единиц. Так, данные частотных словарей необходимо использовать для оптимизации учебного процесса, в частности при изучении иностранных языков, поскольку известно, что 1000 самых частых слов покрывают около 80%¦ письменного текстами, естественно, именно на эти слова надо обращать первоочередное внимание при изучении лексики (Tesitelova 1974).

    Мера информационной значимости языковых единиц связана с частотой этих единиц. К измерению количества информации, которую несет с собой определенная языковая единица, можно подходить с двух точек зрения: инженерно-кибернетической и лингвистической. С первой точки зрения мера информационной значимости считается тем выше, чем реже встречается языковой знак, а сама информация изме-

189

ряется посредством логарифма числа тех знаков, которые могут быть выбраны из имеющегося набора, т. е.

   Н = nlogS,

где Н - количество информации, п - количество выбранных знаков, S - количество всех знаков, имеющихся в наборе. Такой подход к измерению информации разработан К. Шенноном (Шеннон 1963) и практически применяется в технике связи и кибернетике. Знаком здесь считается всякий сигнал, будь то буква, слово или предложение, а понятие информационной значимости не связано с конкретным смыслом, который выражают передаваемые по каналу связи сигналы. С лингвистической точки зрения, учитывая непосредственные значения слов, специалисты, напротив, связывают с наиболее частыми словами и большую значимость (Blanke 1973: 159). Так, чем частотнее слово в языке, тем, как правило, больше значений оно имеет (Гиро 1976: 62), т. е. по сути тем информативнее оно по содержанию. Значит, если с кибернетической стороны информация языкового знака рассматривается как мера его ожидаемости, то с лингвистической стороны - как мера осмысленности текста, в котором употребляются эти знаки.

    Использование статистических методов и количественных данных при изучении семантических явлений языка расширяет возможности описания и представления результатов лингвистических исследований, поскольку результаты квантитативного анализа способны оформляться разнообразными невербальными способами: графиками, таблицами, диаграммами, схемами, гистограммами и т. д. Иначе говоря, квантитативные методы обогащают метаязыковые средства описания семантики, что делает сами эти описания, с одной стороны, более строгими и адекватными, а с другой, более наглядными и разносторонними. В свою очередь, чем многообразнее способы представления объекта, тем глубже он познается и тем легче усваивается его сущность. Научная ценность квантитативных данных при исследовании-семантики определяется тем, что они могут быть воспроизведены и проверены. Трудоемкость использования их на большом эмпирическом материале компенсируется, во-первых, нетривиальностью и надежностью получаемых при этом результа-. тов и, во-вторых, благоприятной перспективой практически полностью передать количественные исследования современным ЭВМ, которые уже в настоящее время применяются для статистического анализа текстов, составления частотных словарей, автоматического перевода и т. д.

190