Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Вопросы функциональной грамматики Сборник научных трудов. Выпуск 4

.pdf
Скачиваний:
109
Добавлен:
24.05.2014
Размер:
1.09 Mб
Скачать

не только в данной тематической группе, но также и в группе глаголов, обозначающих непрофессиональную деятельность лица без отрицательной оценки. Например:

меценат →

меценатствовать

меценатство

быть меценатом заниматься меценатством

è:

вести себя как меценат поступать подобно меценату;

Таким образом, все номинативные ряды, в состав которых вклю- чается: а) глагол без соотносительных с ним деривационных сочетаний исполнять обязанности кого, работать кем, а также лексических элементов должность, работа, промысел, дело и т.д. б) соотносительное с глаголом деривационное сочетание заниматься чем, выражающее значение глагольного форманта, в) имя действия со зна- чением ‘деятельность, поведение, образ действий, поступки, свойственные лицу’, объединяются в одну группу номинативных рядов глаголов, обозначающих поведение лица. Различие между входящими в эту группу номинативными рядами заключается в формальном выражении производного значения и наличием/ отсутствием в их составе деривационных сочетаний заниматься чем и проявлять что, коррелирующих как с глаголом, так и с другими единицами ряда. Как правило, деривационное слово проявлять сочетается с мотивирующими существительными, обозначающими качества, свойственные лицу (проявлять сентиментальность, проявлять великодушие, проявлять легкомыслие), деривационное слово заниматься – с существительными, обозначающими действия, поступки лица (заниматься подхалимством, заниматься сводничеством, заниматься развратом); эти зна- чения могут совпадать с дефиницией отвлеченного имени.

Приведем несколько примеров. Номинативный ряд глагола

холопствовать: 1) словарная дефиниция: ‘проявлять холопство’; 2) вести себя/держать себя как холоп (холопом, по-холопски); 3) поступать как холоп. Номинативный ряд глагола самодурствовать: 1) словарная дефиниция: ‘проявлять самодурство, вести себя как самодур’; 2) быть самодуром; 3) поступать как самодур; 4) заниматься самодурством. Номинативный ряд глагола сводничать: 1) словарная дефиниция: ‘заниматься сводничеством’; 2) быть сводником; 3) поступать как сводник; номинативный ряд глагола склочничать: 1) словарная дефиниция: ‘устраивать склоки, заниматься склоками; интриговать’; 2) быть склочным; 3) быть склоч- ником; 4) поступать как склочник; 5) проявлять склочничество; 6) проявлять склочность.

171

Общая семантика деятельности лица как поведения выражается, кроме деривационных сочетаний, сочетаниями с лексической дифференциацией частных значений (разыгрывать из себя, прикидываться, говорить, выказывать, предаваться, играть, злоупотреблять и

т.д.). Номинативные ряды глаголов с лексически конкретизированными компонентами, которые имплицитно присутствуют в глаголе и эксплицируются в деривационных сочетаний, реализуют производное значение с дополнительными компонентами, например, нежничать ‘быть излишне нежным в обращении или говорить нежности’.

IV. К предыдущей группе глаголов тесно примыкает группа глаголов, обозначающих деятельность лица как состояние, бытие, существование субъекта. Главный семантический компонент глаголов выражен семами ‘состояние’, ‘жизнь’. Производные значения ‘быть = жить кем’, ‘находиться в (каком) состоянии’, ‘находиться/ пребывать в состоянии кого’ получают выражение в составе номинативного ряда: глагол + быть кем/каким/ жить как/ кем + пребывать в чем + вести жизнь кого + вести образ жизни кого/ + жить где/ проводить время где/ как (+ указанные выше единицы, которые включаются в номинативный ряд как дефиниции глагола): пустынник – пустынничать/ вести жизнь пустынника; пустодом – пустодомничать/ вести образ жизни пустодома; путешественник – путешествовать/ быть путешественником/ проводить время в путешествиях; нахлебничать – жить/ являться нахлебником, паразитничать – быть паразитом, вести жизнь паразита, роскошествовать – жить в роскоши, благоденствовать – жить в благоденствии и т.д. Приведем пример номинативного ряда: сиротствовать/ быть сиротой/ жить сиротой/ находиться в состоянии сироты/ пребывать в сиротстве.

Группа глаголов, обозначающих состояние лица, пополняется за счет глаголов, обозначающих деятельность должностных лиц и деятельность как действия, поведение, поступки лица. Такие глаголы имеют дополнительный семантический компонент ‘пребывать в чем’ и/ или ‘жить кем’ (профессорствовать – пребывать в должности профессора, монашествовать – пребывать в монашеском чине, барствовать – жить барином), если значение глагола является производным от значения наименования ‘лицо, носящее этот титул, звание, имеющее эту должность, этот чин’, а также если это значение выражено в словарной дефиниции. Производное зна- чение состояния может включать дополнительные компоненты: казачить ‘быть казаком, вести вольную жизнь казака’.

В целом, производное значение ‘деятельность лица’ конкретно реализуется в деривационной системе русского языка на разных уровнях – способом синтетизма (словообразовательная номинация) и спо-

172

собом аналитизма (несловообразовательная номинация). Данные способы связаны с реализацией отношений производности между наименованием лица и наименованием деятельности лица разной тематики как компонентами номинативного ряда глаголов. В основе моделирования номинативных рядов глаголов, обозначающих деятельность лица, лежит деривационная модель ‘лицо деятельность лица’. Определение статуса данной модели связано с фактом установления в ее структуре деривационных отношений между ее компонентами.

1.Кубрякова Е.С. О разноструктурных единицах номинации и месте производного слова среди этих единиц // Slowotworstwo a inne sposoby nominacji: Materialy z 4 konferencji Komisji Slowotworstwa przy Miedzynarodowym Komitecie Slawistow. – Katowice, 2000.

2.Зд. и далее все определения приводятся по: Словарь современного русского литературного языка: В 17-òè ò. – Ì.-Ë., 1956-1964.

3.Никитевич А.В. Деривационное поле деятельности в русском языке: Автореф. дис. ... канд. филол. наук. – М., 1990.

The article contains the results of the research devoted to the nominative sets of verbs denoting the activity of a person in the Russian language. Modelling of the sets is accompanied by the preliminary definition analysis of the components in the derivative model ‘person ® activity of a person’. The derivative semantics ‘activity of a person’ determines the syntagmatics and paradigmatics of the nominative sets, and is realized in the derivative system of the Russian language on different levels – the means of synthetism (nomination by means of word-formation) and the means of analytism (nomination by means other than word-formation).

Овчинникова Алла Николаевна, преподаватель кафедры русского языка ГрГУ им. Я.Купалы.

ÓÄÊ 801.3 : 681.3 (043)

А.Ю.СТАНКЕВИЧ

СЕМАНТИЧЕСКАЯ МОДЕЛЬ СТЕРЕОТИПНЫХ ТЕМ НАУЧНОГО ТЕКСТА: ПРЕДСТАВЛЕНИЕ НЕГАЦИИ

В статье описана семантическая модель представления знаний о стереотипных темах научного текста. Назначение модели – поддержка автоматического анализа письменного научного текста для получения автореферата. Рассмотрена реа-

лизация грамматической категории отрицания в пределах данной модели.

Общим местом статей по искусственному интеллекту стал пассаж о необходимости автоматизировать обработку возрастающего потока текстовой информации. Среди классов интеллектуальных систем, решающих эту задачу с привлечением лингвистического аппарата, можно назвать информационно-поисковые системы, ориентированные на естественно-языковой диалог с пользователем;

173

системы полуавтоматического приобретения знаний из текста; системы извлечения текстовой информации (аннотирование и реферирование) и т.д. Обычно лингвистическая база знаний (ЛБЗ) таких систем обеспечивает три последовательных этапа обработки текста: 1) морфологический; 2) синтаксический; 3) семантический. ЛБЗ может иметь выход в базы знаний конкретной предметной области (ПО): к примеру, такой выход имеют модули ЛБЗ «Словарь аббревиатур и сокращений ограниченной ПО» и «Словарь синонимов ограниченной ПО» (ЛБЗ представлена в [1]). Перспективными считаются подходы к обработке текста, не предполагающие предварительных знаний о ПО (см., например, [2]). Наше исследование направлено на разработку не специализированной по отношению к ПО ЛБЗ, позволяющей миновать этапы морфологического и поверхностного синтаксического анализа при автореферировании научных текстов.

1.1. Семантическая модель стереотипных тем научного текста: общее описание

Âсодержании научного текста разделяем собственно информацию и способы подачи информации через универсальные, не специализированные по отношению к узким предметным областям фигуры «внутрисистемных» по [3, с. 20] значений. Выделяем три типа внутрисистемных значений: значение негации; компле- ментарно-антонимичное значение; положительное значение.

Предполагаем, что поиск фигуры внутрисистемных значений

âнекотором научном тексте и извлечение содержащих ее текстовых фрагментов позволяет получить тезис реферата.

Âоснове предлагаемого подхода лежат следующие идеи:

1)для научных текстов существует конечное число стереотипных тем; фрагменты текста, содержащие неполный набор этих тем, достаточны для реферата 1;

2)стереотипная тема эксплицируется фигурой внутрисистемных значений, число внутрисистемных значений конечно; фигуру понимаем как набор определенным образом соположенных единиц;

3)всякое разложимое внутрисистемное значение разложимо на как минимум два внутрисистемных значения; всякое разложимое внутрисистемное значение может быть эксплицировано либо синтетически и аналитически, либо только аналитически;

1 Исходной точкой для такого предположения послужила идея о конечности набора отношений на множестве понятий естественного языка. Эта идея часто эксплуатируется в исследованиях по формализации естественного языка. По [4], число таких отношений не превышает 200; в результате работы проекта «Интерактивное выявление семантических структур из текста (рук.: Д.А.Поспелов; URL: http://www.botik.ru/ PSI/AIReC/Projects/Pospelov.ru.html)» выявлено всего 35 типов семантических связей.

174

4) в тексте расстояние между экспликаторами аналитически представленного внутрисистемного значения не должно превышать число Ингве фразовых отрезков.

Как упоминалось выше, внутрисистемное значение может быть: значением негации; комплементарно-антонимичным значе- нием; положительным значением.

Внутрисистемное значение негации должно быть материально выраженным. Предлагаемая нами семантическая модель разли- чает как негацию такие элементы, которые с точки зрения языка относятся к лексическим или грамматическим средствам выражения категории отрицания. При этом в пределах модели одно и то же внутрисистемное значение может реализовываться на элементах, разных с точки зрения морфологии: например, не различаются не-частица и не в составе союза. Вне определений семантической модели остаются образования с элементом {íè, íè −} : ни как частица, ни в составе союзов, отрицательные местоимения с префиксом ни- (т.е. языковые средства усиления выраженного через другие элементы отрицания [5, с. 88 - 90]).

Свойство комплементарной антонимичности есть свойство значения, при котором значению обязательно противопоставлено значение . Как следствие, в условиях1 отрицания значения взаимообращаются2. Под условиями отрицания для комплементарно-антони- мичного внутрисистемного значения имеем в виду наличие на расстоянии Ингве слов друг от друга реализацийn экспликаторов негации и экспликаторов комплементарно-антонимичного значения n . Слово понимаем как последовательность букв от пробела до пробела.

Соотношение пары комплементарно-антонимичных друг другу внутрисистемных значений1,2 представляем так:

значение1 : внутрисистемный компонент лексического значе- ния1 с заполненным или вынесенным (аналитическим) отрицательным импликационалом 2 + негация;

2 Термин «отрицательный импликационал» понимаем по М.В.Никитину [6]. Импликационал понимается как совокупность семантических признаков, необходимо или с некоторой вероятностью определенных интенсионалом, и подразделяется на сильный, слабый, отрицательный импликационалы. В сильный импликационал входят высоковероятностные признаки денотата (например, в сильный импликационал денотата ðåêà войдут семантические признаки ‘перепад высоты’, ‘увлажненность поймы’ и т.д.). Слабый импликационал составляют семантические признаки, основания которых заложены интенсионалом как семантические валентности, причем «интенсионал не предопределяет, какое именно значение это основание может конкретно предпринять» [6, с. 63]. Так, в слабый импликационал денотата ðåêà входят признаки ‘узкая~широкая’, ‘быстро~медленно текущая’. Наконец, отрицательный импликационал составляют семантические признаки, несовместимые с импликационалом или совместимые с ним маловероятно (например, признаки денотата ðåêà ‘непроточность’, ‘горючесть’, ‘газообразность’).

175

значение 2 : внутрисистемный компонент лексического значения2 с заполненным или вынесенным (аналитическим) отрицательным импликационалом, причем для системы реферирования внутрисистемные компоненты лексических значений1,2 абсолютно синонимич- ны, хотя с точки зрения языка могут различаться оттенками.

Положительным значением называем внутрисистемный компонент лексического значения с пустым отрицательным импликационалом.

Экспликатором некоторого внутрисистемного значения принимаем маску – именованное множество фиксированных по длине и местоположению буквенных кодов. Экспликатором некоторой фигуры внутрисистемных значений принимаем правило R . Оговоримся, что в составе правил работают не маски как таковые, а семантико-функциональные классы масок. Семантико-функцио- нальный класс включает в себя маски с одной и той же базисной функцией (см. п. 1.2), сходные по внутрисистемному значению, но дополнительно-дистрибутивные друг другу относительно вхождения в состав двух и более правил.

Всякое правило R можно представить в виде эквивалентных правой и левой частей, содержащих соответственно синтетическое и аналитическое выражения некоторой фигуры внутрисистемных

отношений:

An

=

An− 1 ,Cn

, ãäå

An ,

An− 1 , Cn - имена семанти-

ко-функциональных классов масок; левая часть правила

An

 

è ïðà-

âàÿ An− 1 ,Cn

- альтернативные ссылки на текстовые реализации

правила R

, причем класс A

может быть левой частью правила

 

 

n

 

 

 

 

 

n− 1

 

 

 

 

 

 

 

 

 

 

Rn− 1 , âèäà

 

A

=

A

 

,C

n− 1

, класс

A

может быть первым ком-

 

 

 

n− 1

 

n− 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

понентом правой части правила R

 

âèäà A

=

A

,C

n+

 

.

 

 

 

 

 

 

 

 

 

 

n+ 1

 

n+ 1

 

n

 

1

 

Правила имеют свою иерархию. Правило Rn

называем вклю-

ченным

â

правило

Rn+ 1 , åñëè

имеем: A

=

A ,C

n+ 1

è

 

 

 

 

 

 

 

 

 

 

 

 

 

n+ 1

 

 

n

 

 

An =

An− 1 ,Cn

. Правило Rn

называем корневым, если не суще-

ствует включенного в него Rn− 1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

176

 

 

 

 

 

 

 

 

 

Относительно корневых правил вводим глубины включения d .

Глубина включения d всякого корневого правила R0 равна 0. Правило Rn называем блоком, если оно не включено ни в ка-

êîå Rn+ 1 . Т.е. блоком называем правило Rmax с наибольшей глубиной включения dmax . В блок включено равное dmax число правил.

Для любого блока Rmax существует одно и более не включенных в него правил.

Интенсионалы значений, эксплицированных левой и правой частями правила Rn , равны. Интенсионал значения, эксплицированного через Rn− 1 , находится в пределах интенсионала значения, эксплицированного через Rn . Интенсионал значения, эксплицированного через Rmax , устанавливает границы на интенсионалы

значений, эксплицированных через включенные в Rmax правила. Тезисом реферата считаем такой фрагмент текста, на котором

успешно маскируется блок Rmax . Маскирование блока Rmax сводится к поиску текстовых реализаций включенных в блок правил. Иерархия правил задана до маскирования.

Маскирование некоторого блока Rmax идет от включенного в него корневого правила R0 .

Для правила R0 принимаем: маскирование начинается с пра-

вой части; маскирование по правой части A ,C0

начинается с

класса A и неуспешно при отсутствии его реализаций или реали-

заций класса C0 . Входное условие на маскирование по левой час-

òè A0 есть неуспех маскирования по правой части

A ,C0 .

177

 

Для правила Rd с глубиной 0 < d < dmax принимаем: входное

условие на маскирование по правой части Ad − 1 ,Cd есть успеш-

ное маскирование R

d − 1

; маскирование по правой части Ad − 1 ,Cd

 

 

начинается с класса Cd

и неуспешно при отсутствии его реализа-

ций; входное условие на маскирование по левой части Ad есть неуспех маскирования по правой и левой частям Rd − 1 или неуспех

маскирования по правой части Rd .

Фразовым отрезком называем расстояние между любыми двумя сочетаниями знаков из набора {«.#»,»;#»,»!#»,»?#»}, где символом # обозначаем пробел. Любой графический объект занимает один фразовый отрезок.

Маскирование по правой части правила R0 производится в пределах одного фразового отрезка. Маскирование по правой час-

ти правила Rd с глубиной 0 < d < dmax производится в пределах числа Ингве (9) фразовых отрезков. Маскирование включенных

â Rmax правил производится в пределах 9 фразовых отрезков от кор-

невого правила R0 .

При маскировании некоторого блока Rmax из текста извлекаются все фрагменты, содержащие реализации правил этого блока. Входные условия на маскирование правил блока определены так, что в общем случае предпочтение отдается маскированию по правым частям правил блока. В таком определении входных условий мы исходили из тенденции подъязыка науки допускать операции со сложными, не имеющими однословного выражения понятиями. Как следствие, с увеличением глубины правила возрастает вероятность того, что левая (синтетическая) часть правила будет пустой.

Автореферат, полученный через поиск блоков правил, представляет собой никак не отредактированные купюры исходного текста. Купюры не согласовываются между собой, и представляются в виде групп всех текстовых фрагментов, извлеченных по

178

очередному блоку правил; внутри такой группы купюры следуют по мере их встречаемости в исходном тексте 3.

Правила ориентированы на семантику, поиск через правила не требует подключения модулей морфологического и поверхностного синтаксического анализа. Лингвистическая база знаний системы состоит из словаря масок и словаря блоков правил.

1.2. Семантико-функциональные классы масок По своим функциям в правилах все объявленные маски систе-

мы делятся на два базисных класса: классы функции ядро (класс функции простое ядро, класс функции комплементарно-антони- мичное ядро) и классы функции поддержка (класс функции отрицатель , класс функции отрицатель ).

Классы1 функции ядро входят в состав2 преимущественно одного правила. Класс функции простое ядро состоит из двух подмножеств масок, пустого и непустого с положительным внутрисистемным значением. Класс функции комплементарно-антонимичное ядро состоит из двух непустых подмножеств масок, комплементар- но-антонимичных друг другу по внутрисистемному значению (т.е. подмножества взаимообращаются в условиях отрицания). Маски классов функции простое ядро эксплицируют положительные внутрисистемные значения. Маски первых подмножеств классов функции комплементарно-антонимичное ядро эксплицируют компле- ментарно-антонимичные внутрисистемные значения и внутрисистемные значения негации; маски вторых подмножеств классов функции комплементарно-антонимичное ядро эксплицируют только комплементарно-антонимичные внутрисистемные значения.

Классы функции поддержка входят в состав любого правила с классом функции комплементарно-антонимичное ядро. Классы функции поддержка маскируются только после простановки классов функции комплементарно-антонимичное ядро в пределах зоны поддержки, а именно: ‘вверх от класса функции компле-

3 Ср. описание вида автореферата в анализаторе текста TextAnalyst (НПИЦ «Микросистемы»; URL: http://www.analyst.ru): «Формируемый реферат содержит список наиболее информативных предложений текстов, отражающих основные смысловые связи между главными понятиями семантической сети. Конечно, это не реферат в привычном понимании – тезисы не связаны между собой стилистически, а попросту взяты из текста и расположены в порядке их встречаемости. Однако и такой «подстрочник» оказывается достаточно информативным, чтобы составить общее представление о тексте и уяснить его основные идеи. Кроме того, все предложения реферата снабжены отсылками к соответствующим местам исходных текстов, что позволяет просмотреть контекст интересующего тезиса».

179

ментарно-антонимичное ядро до начала фразового отрезка или до первого знака препинания на число Ингве слов (9)’, ‘вниз от класса функции комплементарно-антонимичное ядро до первого знака препинания на число Ингве слов (9)’. Маски классов функции поддержка эксплицируют внутрисистемные значения негации.

Свойства масок, входящих в классы функции отрицатель :

1)внутрисистемное значение таких масок есть значение1 негации;

2)такие маски всегда работают при маскировании правил с классом функции комплементарно-антонимичное ядро.

Свойства масок, входящих в классы функции отрицатель :

1)внутрисистемное значение таких масок есть значение нега2 - ции (хотя буквенный код негации не содержит);

2)такие маски не всегда работают при маскировании правил

ñклассом функции комплементарно-антонимичное ядро.

Классы функции отрицатель вводим, если необходимо задать буквенным кодом ссылку на словоизменительную2 парадигму слов по модели: «пробел – нет или есть маска с внутрисистемным значением негации – любая буквенная последовательность с неинформативным для реферата значением – две маски с внутрисистемным значением негации – пробел» (например, небезошибочный). В значении слов, соответствующих такой модели, информативным для реферата считаем только значение негации. Поэтому парадигмы слов безошибочный, неошибочный не маскируются вообще.

Классы функции поддержка состоят из двух подмножеств масок: непустого с негацией и пустого для функции отрицатель ;

пустого и непустого с негацией для функции отрицатель .

1

 

2

 

 

В пределах данной статьи маски представляем в таблицах вида:

 

 

 

 

 

 

 

Символ слева

Тело маски

Символ справа

 

 

 

 

 

 

 

 

Заголовок таблицы содержит имя маски, столбец «Тело маски» – соответствующие этому имени буквенные коды (далее БК).

Столбец «Символ слева» может содержать один из трех знаков:

1)«*», означающий «любой символ»;

2)«#», означающий «символ пробела»;

3)«!БК», означающий «эксплицируется негация, если словореализатор маски начинается с БК».

Столбец «Символ справа» может содержать один из двух знаков:

1)«*», означающий «любой символ»;

2)«#», означающий «символ пробела».

Классы обозначаем набором имен масок, разделенных на подмножества знаком «|».

180

Соседние файлы в предмете Лингвистика