Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Hrolenko_A._Osnovi_sovremennoy_filologii

.pdf
Скачиваний:
498
Добавлен:
30.05.2017
Размер:
1.11 Mб
Скачать

го языка Ф. Кединга (Берлин, 1898). За девяносто лет нашего столетия было составлено несколько сот частотных словарей и частотных списков для нескольких десятков языков. Первым частотным словарём русского языка был словарь Г. Йоссельсона (США, Детройт, 1953).

Внашей стране первый частотный словарь русского языка был составлен Э. Штейнфельд (1963). Известны материалы к частотному словарю языка Пушкина (1963). В 1977 г. вышел в свет «Частотный словарь русского языка» под редакцией Л.Н. Засориной. Он создавался на основе выборки в один миллион словоупотреблений из четырёх жанров (художественная проза, драматургия, научная публицистика, газетно-журнальные материалы), в нём около 40 тысяч слов. Самое частотное слово — предлог в (во), далее идут служебные слова и местоимения (и, не, на, я, быть, что, он, с, а, как, это). Самое частотное существительное — год.

В90-х годах XX в. в Швеции на базе корпуса современных русских текстов, созданного в Институте славистики Уппсальского университета, под ред. Леннарта Лённгрена вышел в свет «Частотный словарь современного русского языка» (Уппсала, 1993).

Вконце XX в. актуальной стала идея и практика создания частотных словарей идиолектов выдающихся языковых личностей. Примером может служить «Статистический словарь языка Достоевского», разработанный группой лексикографов в ИРЯ РАН.

Это уникальный в мировой практике лексикографический проект, опирающийся на корпус текстов в 2,9 млн словоупотреблений, представляет всю лексику — 43 тыс. разных слов — трёх основных жанров писателя: художественной литературы, публицистики и писем. Отличается словарь степенью лингвистической дифференциации: в таблицах Словаря лексика Ф.М. Достоевского представлена в распределении по основным жанрам

ипо периодам творчества [Шайкевич 2003]. Авторы проекта, характеризуя своё детище, специально останавливаются на вопросе о перспективах Словаря. Один из составителей исследует возможность проекта в изучении языка писателя на примере романа Достоевского «Идиот» [Шайкевич 1996].

250

Выясняется, что у частотных словарей имеется большой познавательный, эвристический потенциал. В последнее время об этом заговорили философы и филологи. В статье М. Эпштейна «Предлог “В” как философема. Частотный словарь и основной вопрос философии» имеется многозначительный подзаголовок «Частотный словарь как картина мира» [Эпштейн 2003: 86]. Автор полагает, что из всех видов словарей частотный словарь наиболее приближен к речевой практике, поскольку он описывает именно частоту вхождения языковых единиц в поток речи, степень их востребованности всеми говорящими. Частотный порядок слов, отмечает философ, — это «всенародная», стихийнодемократическая система понятий, которую не может игнорировать философия [Эпштейн 2003: 87].

В частотных словарях выделяется головная часть, в которой сосредоточены самые употребительные в том или ином тексте

251

или корпусе текстов слова. Эта часть — предмет доминантного анализа, методика которого основывается на предположении, что среди наиболее частотных лексем присутствуют слова, обозначающие доминанты концептуальной картины этноса, социальной группы или индивида. Доминантный анализ ориентирован на выявление, изучение и описание наиболее частотных слов в аспекте языковой картины мира с дальнейшим движением анализа от доминантных слов — к доминирующим концептам.

Разрабатывая основы фольклорной диалектологии, курский лингвофольклорист С.П. Праведников составил частотные словари южных (курских) и северных (архангельских) народных лирических песен, сопоставил их и пришёл к выводу, что головные части составленных частотных списков заметно различаются и свидетельствуют о территориальной дифференцированности языка русского фольклора [Праведников 2010].

Изучение авторского идиостиля. С помощью формальноколичественных методов изучается авторский идиостиль, под которым понимается взаимосвязь между языковыми средствами и особенностями творческой позиции писателя, его взгляда на мир, окружающую действительность.

Определение авторства с помощью формально-количествен- ных и статистических методов стимулировало поиск и выявление характерных структур авторского языка. На этом строятся многообразные методики, представленные в книге «От Нестора до Фонвизина. Новые методы определения авторства» (М., 1994). Специалисты исследовали несколько простых параметров авторского стиля и на базе большого количества произведений писателей XVIII–XX вв. статистически доказали, что доля всех служебных слов в данном прозаическом произведении является авторским инвариантом.

Один из авторов, опираясь на модель цепей А.А. Маркова, предложил методику определения авторства, основанную на том, что по произведениям автора, которые достоверно им созданы, вычисляется матрица переходных частот употреблений пар букв. Затем такие матрицы строятся для каждого из авторов,

252

«подозреваемых» в написании анонимного текста, и оценивается вероятность того, что именно он написал анонимный фрагмент текста. В результате автором анонимного текста полагается тот, у которого вычисленная оценка вероятности больше.

Используя квантитативные методики идентификации текстов, авторы рассматриваемой коллективной монографии пытаются ответить на вопрос, кто был автором «Повести временных лет», и приходят к выводу, что автором первой редакции «Повести…» мог быть Нестор, древнерусский писатель, летописец XI — начала XII в., монах Киево-Печерского монастыря, автор житий князей Бориса и Глеба, Феодосия Печерского, один из крупнейших историков Средневековья.

Знаменитый шедевр древнерусской словесности XII в. «Слово о полку Игореве», уникальность которого скептиками ставится под сомнение, был подвергнут жёсткой формальноколичественной ревизии. Применение анализа частот парной встречаемости грамматических классов слов позволило наглядно доказать, что глубинная структура «Слова» — это структура языка XI в. Этот формально-количественный анализ не отверг гипотезу историка Б.А. Рыбакова о боярине Петре Бориславиче как авторе «Слова о полку Игореве». Возможно, отчасти она и подтверждена. Однако, полагают исследователи, необходимо ещё более детальное исследование текстов, которое будет проведено в ближайшее время [От Нестора… 1994: 340].

Анализ нескольких «Слов…», принадлежащих Кириллу Туровскому (1130–1182), древнерусскому писателю, проповеднику, епископу г. Туров, дал основание авторам главы «Кирилл Туровский: творец или компилятор?!» отнести тексты епископа к разряду неоригинальных как пересказ сочинений других авторов.

Атрибуция «Писем к Фалалею», анонимного памятника публицистической литературы последней трети XVIII в., потребовала сопоставления текстов трёх претендентов на авторство — М.И. Попова, Н.И. Новикова и Д.И. Фонвизина. Исследователи подтвердили, что автором «Писем» был Д.И. Фонвизин, пред-

253

ставший не только талантливым драматургом, но и талантливым публицистом.

В конце XVIII столетия популярностью пользовалась своеобразная крестьянская энциклопедия «Деревенское зеркало, или Общенародная книга». В сугубо популярной форме изложения в ней шла речь о том, как крестьянину можно достигнуть успехов в своей жизни и труде. Существовало мнение, что автором этой анонимной крестьянской энциклопедии был учёный-минеролог В.М. Северин. Привлечённые тексты других возможных авторов и использование квантитативной методики привели к убедительному выводу: автором книги является Андрей Тимофеевич Болотов (1738–1833), естествоиспытатель, один из основоположников отечественной агрономической науки, писатель.

Количественные методики стали более эффективными с появлением вычислительной техники, прежде всего персональных компьютеров.

Петербургский поэт и переводчик «Слова о полку Игореве» Андрей Чернов нашёл, что построение стихов загадочного древнерусского памятника подчиняется определенным математическим закономерностям, а именно — формуле «серебряного сечения». А. Чернов сделал заключение о том, что «Слово о полку Игореве» имеет девять песен и что в основу текста легла круговая композиция. Если в композиции «Слова» лежит круг, то у него должен быть «диаметр» и некая математическая закономерность. Число стихов во всех трёх частях «Слова» (их 804) А. Чернов разделил на число стихов в первой (или последней) части (256), в итоге получил 3,14, т.е. число «пи» с точностью до третьего знака. Эта же закономерность выявилась при изучении «Медного всадника» Пушкина, в котором использована круговая композиция, и храма Софии Полоцкой. А. Чернов сделал вывод: математический модуль автор «Слова» использовал интуитивно, неся внутри себя образ древнерусских архитектурных памятников. В те времена храм являл собой всеобъемлющий художественный идеал, оказывающий влияние на композицию и ритмику стихосложения. Исследователь назвал обнаруженную им закономерность в построении древнерусского литературного

254

памятника и древнерусских храмов принципом «серебряного сечения» [Краюхин 1995: 7].

Вмноголетний спор по поводу того, кто является истинным автором романа «Тихий Дон», в свое время включились скандинавские ученые, норвежско-шведский коллектив под руководством Г. Хьетсо. Они взяли тексты, бесспорно принадлежащие

М.Шолохову, и тексты донского писателя Ф. Крюкова, которому приписывалось авторство великого романа, и проанализировали их, выявляя особенности писательской манеры каждого. Учёные сравнили длину предложений, распределения длины предложений по количеству слов, распределение частей речи, сочетание частей речи в начале и в конце предложения, частоту применения союзов — в начале предложений, лексические спектры, повторяемость словарного запаса по богатству. Естественно, сделать это оказалось возможным только с помощью мощной вычислительной техники. Математическая статистика при контрольной выборке на ЭВМ 12 тыс. фраз при 164 637 словах представлена в 250 таблицах, формулах и графиках [Осипов 1999: 6]. Их вывод однозначен: из двух претендентов на авторство «Тихого Дона» Крюков явно обладает наименьшим правом. «…Применение математической статистики позволяет нам исключить возможность того, что роман написан Крюковым, тогда как авторство Шолохова исключить невозможно». Недавно найденная рукопись великого романа (885 рукописных страниц, 605 из которых написаны рукой самого Шолохова, а 285 страниц — женой писателя и её сестрой) окончательно утвердила авторство М.А. Шолохова и правоту скандинавских ученых [Ушаков 2000: 24–25].

ВЭдинбурге (Шотландия) разработан аналитический метод, основывающийся на учёте зависимости частоты употребляемого слова и длины предложения, в котором оно появляется. Этот метод получил название «диаграммы накапливающихся сумм». С его помощью установлено, что каждому человеку свойствен прочно укоренившийся, неизменный стиль, который не поддаётся имитации. Например, стиль Т. Харди в «Руке Этельберты» (1876) убедительно совпадает со стилем «Джуда Неизвестного». Анализ показал, что авторы приобретают и сохраняют посто-

255

янный стиль, как бы ни сложилась их жизнь. Например, стиль В. Скотта в «Антикварии» (1816) полностью совпадает с его стилем в «Замке опасностей», написанном после того, как знаменитый английский писатель перенёс три инсульта, один из которых лишил его дара речи и нарушил двигательные способности. Метод выявляет в тексте инородные вставки, обнаруживает попытки подделать авторский стиль.

Английская писательница Джейн Остин не окончила повесть «Сандиция», которая обрывается на семьдесят третьем предложении одиннадцатой главы. Повесть была дописана другой писательницей. При чтении невозможно определить, где заканчивается текст Д. Остин, а метод позволяет точно найти инородную часть повести [Хоукс 1990: 20–21].

Тот факт, что объём активного лексикона Шекспира составляет от 15 до 24 тыс. слов и что количество новых слов, введенных в язык Шекспиром, превышает 3200 единиц, как будто свидетельствует в пользу тех, кто считает, что Шекспир — это псевдоним, под которым творил не один человек. У Ф. Бэкона, которому иногда приписывают авторство пьес и сонетов Шекспира, лексикон составлял 9–10 тыс. слов (у современного англичанина с высшим образованием словарный запас включает 4 тыс. лексем) [Бельская 2000: 109].

Д.С. Лихачёв, авторитетнейший отечественный текстолог, тоже размышлял о месте квантитативных методик в филологии, в частности в ситуации определения авторства: «Пастор Эндрю Мортон в Эдинбурге применил компьютер для установления авторства. Простой подсчёт слов ничего не дал, и не мог дать. Дало только подсчитывание пар слов, целых идиоматических выражений, сочетаний слов. Так, например, ему удалось доказать, что Бэкон не мог быть автором пьес Шекспира. Такие же бесспорные результаты достигнуты им в установлении авторства других произведений. Даже благодаря его подсчётам был оправдан в суде один из обвиняемых (четыре наиболее преступных письма оказались не его)» [Лихачёв 2006: 3: 504].

Лингвостатистический анализ был использован в исследовании «Илиады» Гомера. Чтобы доказать, что Гомера не было, и

256

все 24 песни «Илиады» по происхождению — самостоятельные произведения, соединённые в эпос позднее без особой переработки с целью унификации, была использована статистика отношений внутри синонимических пар (имён собственных, просто лексических пар, формул и т.п.). По мнению автора исследования Л.С. Клейна, наиболее полные возможности для классификации текстов представляют главные этнонимы греков (ахейцы, данаи и аргивяне): они все три синонимичны, массовы (употребляемость исчисляется сотнями), неравномерно и неодинаково распределяются по книгам «Илиады». Окончательный вывод исследователя состоит в том, что разная употребительность имён, а также предлогов и частиц говорит о том, что это (песни. — А.Х.) были не просто и не только источники, а самостоятельные вклады, ставшие составными частями поэмы; сохранность в окончательном тексте первоначально выбранных этнонимов, топонимов, теонимов и служебных слов (и это при наличии других синонимов) говорит о том, что переработка поэтической ткани при объединении самостоятельных песен в поэму была незначительной [Клейн 1998: 18, 96, 112, 436]. Как показано исследователем, фольклорные песни, составленные в разных местах древнегреческого мира, воспевали подвиги разных героев — участников и троянской войны, и прочих мифических кампаний. Песни приспосабливались к ранее существующим сюжетам, взаимопересекаясь, часто противоречили друг другу. «Стыки» разных песен были обнаружены вдумчивым и тонко проведенным анализом.

В «New Journal of Physics» (2009, № 11) была опубликована статья трёх шведских учёных «Мета-книга и зависящие от длины текста особенности индивидуального литературного письма». На материале текстов трёх англоязычных романистов Мелвилла, Харди и Лоуренса исследователи подсчитывали, как растёт количество новых слов у данного автора по мере удлинения текста. С одной стороны, суммарное число новых слов растёт, с другой, растёт и число повторения для уже употреблённых слов. Возникает вопрос: с каким темпом будут расти эти числа по мере удлинения текста? Совершенно очевидно, что «числовые» характеристики языка зависят от уровня культуры и образованно-

257

сти автора, от богатства его словаря, от умения активизировать этот словарь, от индивидуальных пристрастий и степени сознательной склонности к словесным повторениям. Выяснилось, что характер нарастания новых слов и повтора прежних и, следовательно, вид кривых, изображающих это нарастание по мере удлинения текста, различен для разных писателей. Шведские учёные определили, что если проанализировать любой короткий текст автора, например, рассказ, и сравнить его с другим текстом той же длины, выделенным из целого романа, статистические характеристики (темп нарастания новых слов и повторов) будут одинаковы. Различие столь индивидуально устойчиво, что можно «численно опознать» того или иного автора, а также опознавать авторов анонимных произведений [Стариков 2010].

Вопрос применения математических методик в филологии дискутируется до сих пор. Любопытно сопоставить статьи филолога [Шапир 2005] и математика [Гладкий 2007], которые опубликованы в журнале «Вопросы языкознания». Полемика оказалась односторонней. Так получилось, что филолог трагически погиб и статьи математика не читал, а математик на статью весьма уважительно, но критически отреагировал.

М.И. Шапир, по словам знавших его, — человек исключительной филологической одарённости, в статье «“Тебе числа и меры нет”: О возможностях и границах “точных методов” в гуманитарных науках» утверждает, что точные методы в гуманитарных исследованиях не могут дать значимых результатов. Математизированная теория текста как такового неосуществима, поскольку каждый объект, будучи повторимым в самых разных своих деталях уникален как единство смысла во всей своей полноте и в любых тонкостях его материального воплощения в чувственно воспринимаемой форме. Подобная уникальность приводит к пропасти между естественными и гуманитарными науками. Очевиден парадокс: повторяемость языка и неповторимость мысли.

Статья А.В. Гладкого «О точных и математических методах в лингвистике и других гуманитарных науках» начинается с констатации ошибочных мнений гуманитариев, полагающих,

258

что законы, господствующие в мире человеческого духа, принципиально отличаются от законов природы, что точные методы тождественны математическим, что число — главный предмет математики. Автор настаивает на том, что науки о человеческом духе и человеческом обществе могут и должны стремиться к точности и объективности так же, как науки о природе. «Главный признак точности в научном исследовании — не использование математического аппарата, а чёткое, не допускающее различных толкований определение понятий» [Гладкий 2007: 29]. В качестве примера автор статьи ссылается на исследовательский опыт лингвиста А.А. Зализняка, книги которого могут служить образцом лингвистического описания нового типа — описания, основанного на системе точных понятий [Там же: 25].

Использование точных понятий и строгая дисциплина мысли — такой должна стать филология. И в этой связи А.В. Гладкий утверждает: «…“профильное образование” в средней школе, уже в детстве разделяющее способных и интересующихся людей на “факультеты” и приучающее их гордиться невежеством в “чужих” науках — может очень сильно воспрепятствовать дальнейшему сближению естественных и гуманитарных наук, настоятельно необходимому для нормального развития тех и других» [Там же: 27]. Статья завершается словами Карла Поппера: «Рост знания зависит от существования разногласий».

Дискуссия на этом не завершилась. В 2009 г. была опубликована статья лингвиста Н.В. Перцова «О точности филологии», написанная в связи со статьями М.И. Шапира и А.В. Гладкого, в которой автор взял на себя роль третейского судьи. Пафос статьи: сдержанная оценка М.И. Шапиром перспектив математики в области построения общей теории в гуманитарных областях плодотворна, а «естественно-научный» оптимизм А.В. Гладкого по этому поводу сомнителен. В целом автор на стороне М.И. Шапира и считает, что «общую математизированную теорию текста как такового» построить невозможно.

Н.В. Перцов исходит из того, что точность — это фундаментальный принцип всякой — естественной или гуманитарной — науки. Обсуждается вопрос о специфике предметов гуманитар-

259

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]