Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
6-10.doc
Скачиваний:
19
Добавлен:
14.08.2019
Размер:
98.82 Кб
Скачать

10. Проблемы количественных методов атрибуции текста.

К настоящему времени накоплен большой опыт в применении ста­тистического метода для решения проблемы спорного авторства (ат­рибуции) текстов; в сущности, этот метод стал хрестоматийным, причем не только в филологии (текстологии, источниковедении, сти­листике), но и в криминалистике, медицинской диагностике, соци­альной психологии.

Атрибуция текстов – установление авторства текста, к-й является анонимным или псевдонимным(чат).

Авторизация включает как литературную, так и лингви­стическую составляющую. Традиционные приемы, разработанные филологией: приемы содержательно-стилистического анализа, тк основные показатели – содержание и стилистика.

  • Может ли данный человек написать текст такого содержания?

  • В этом содержании имеются ли конкретные факты которые можно сопоставить с биогр данного автора?

  • Общий стиль. Использует ли он различные ритор приемы – вопрос, антитеза, к-е можно обнаружить в данном тексте. Есть ли типичные для него обороты речи.

В. В. Виноградов в книге «Проблема авторства и теория стилей» сформулировал типологию факторов атрибуции текста. К субъективным факторам он относит: а) субъективно-коммерческие; б) субъективно-конъюнктурные; в) субъективно-эстети­ческие; г) субъективно-психологические; д) субъективно-идеологические факторы. Есть и объективные факторы: а) документально-рукописные (археологические); б) исторические (биографии, свидетельства совре­менников); в) историко-идеологические и сопоставительно-идеологи­ческие; г) историко-стилистические; д) художественно-стилистические; е) лингвостилистические. Однако чисто филологическое направление авторизации не позволяет построить объективные кри­терии анализа и атрибуции текста. Разные эксперты, используя одни и те же факторы, могут сделать совершенно различные выводы.

Перспектива объективизации экспертного знания была обнаруже­на в использовании количественных, статистических методов анализа текста.

Способы, используемые в прикл линг-ке, строгие, допускают формализацию. Самые частые колчественные исслед-я опираются на знание статистических норм или вероятностных характеристик текста.

1. Частотные словари (словоформ, лемм – нач форм). Устанавливается абсолютная частота(количество вхождений единицы в текст) и относительная частота(отношение абсолютной частоты единицы к общему объему текста). Относительная частота – нормализация количественной характеристики.

Каждый частотный словарь делится на неск-ко зон:

1. Самые частотные. (как правило, служебные, самые короткие)

2. Частые знаменательные слова

3. Редкие слова(1-2 р в тексте)

Точно так же могут быть получены вероятностные оценки частоты последовательностей букв, синтаксических структур, предложений разной длины.

Сопоставляется спорный текст и уже имеющий атрибуцию. Впервые – 1880е гг Диттенбергер, атрибуция «диалогов» Платона. Он исследовал частоты служебных слов в подлиннике и спорных текстах. Тк частоты служебных слов зависят не от тематики текста, а от общего стиля текста.

1915- работа Морозова посвященная частотности ед-ц языка в текстах и возм-ти их использовать для атрибуции.

Атрибуция Тихого Дона – самая известная атрибуция, 89 г.

признаки:

  1. Осуществление выборки с одной стороны из нескольких произведений Шолохова и автора чье авторство подозревалось – Ф. Крюков.

  2. В этих выборках не должны были встречаться эл-ты прямой речи

  3. Нельзя использовать не «собственно прямую речь» - где автор передает мысли, чувства героев, совмещая свою речь с речью персонажей.

  4. При выборках исп-ся разные части текстов – начало, средняя, заключительная

  5. Организация выборки – либо случайным образом, либо структурированной выборкой – чтобы в нее обязательно вошли разные части текста.

Что сравнивали:

  1. Длина предложений, количество символов, число текстоформ, число слогов

  2. Длина слов в символах

  3. Статистика классов слов, те частей речи.

  4. Частоты разных начал и концов текста.

Вся выборка – 1000 предложений. Выводы: по всем частотным показателям тексты Тиххого Дона ближе к Шолоховским.

Длина предложения: Крюков – 13, 9

Шолохов – 12,9

Тихий Дон – 12,4