§ 5. Дистрибутивно-статистический анализ

Только что описанная нами в предыдущем параграфе методика хорошо коррелирует с применением статистики, а следовательно, и с другими отраслями прикладной лингвистики, а не только с лексикографией.

Лингвистическая статистика - отрасль языкознания, занимающаяся изучением методов раскрытия закономерностей, свойственных большим совокупностям однородных объектов на основании их выборочного обследования. Свои важнейшие понятия лингвистическая статистика заимствует у математической статистики. Существенно обратить внимание на то, что просто количественный подсчет того или иного явления в нескольких или даже в большом числе текстов статистическим не является. Корректное применение статистики требует серьезного с ней ознакомления.

Основным методом применения статистики в сочетании с дистрибутивным анализом следует признать дистрибутивно-статистический анализ, как он представлен в трудах А.Я. Шайкевича и Ю.Д. Апресяна. Их методика имеет много общего с валентностным анализом, как он разработан Г. Хельбигом, а в Ленинграде —

Б.М. Лейкиной. Валентностному анализу будет в дальнейшем посвящен специальный параграф, а здесь достаточно указать, что термин «валентность» тоже означает сочетательную способность лингвистического элемента.

Дистрибутивно-статистический анализ в том виде, как его разработал и применяет А.Я. Шайкевич, «есть сумма формальных алгоритмических процедур, направленных на описание языка и опирающихся только на распределение (дистрибуцию) заданных элементов в тексте. Под заданными элементами могут пониматься буквы (и другие графические символы), цепочки букв между пробелами (слова), цепочки слов между более крупными пробелами (высказывания), короче —любые объекты в тексте, непосредственно доступные нашему восприятию. Сам анализ при этом носит не жестко-детерминистский, а статистический характер, постоянно использует количественную информацию о встречаемости элементов в тексте» (Шайкевич, 1976:355).

Важно подчеркнуть, что в своем анализе А.Я. Шайкевич убедительно показывает следующее: скрытое или явное предположение о том, что текст или какие-то явления в тексте можно представить как случайный процесс, для лингвостатистики неплодотворно. Шайкевич доказывает, что основные перспективы лингвостатистики, если она хочет исследовать особенности структуры текста или структуры языка, связаны с поисками расхождений между теоретическими данными (чаще всего они сравниваются с нормальным распределением, или распределением Пуассона) и эмпирическими данными.

Объяснять здесь сущность этих понятий мы не сможем за недостатком места. Это слишком отвлекло бы нас от основного изложения. Но тому, кто будет пользоваться методикой дистрибутивно-статистического анализа, необходимо проработать не только работы самого Шайкевича, но и какой-либо из современных учебников по статистике.

Здесь мы ограничимся конкретным примером, иллюстрирующим предложенную методику. Шайкевич исследовал распределение относительной частоты неопределенного артикля в речи персонажей У. Шекспира и показал неоднородность этого распределения для двух, выделившихся именно благодаря этому анализу, групп персонажей. У слуг, горожан и носителей комического начала (шутов, остряков, глупцов) отмечено повышение частоты неопределенного артикля. И напротив, у героев «серьезных» и высоко стоящих на социальной лестнице частота неопределенного артикля понижается. 42

Таким образом, метод может быть использован в стилистике, но, разумеется, пригоден и для других целей. В информатике, например, его применяют для выделения ключевых слов.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 4012 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
20.09.201949.66 Кб6Антон Павлович Чехов.doc
#
01.07.2025404.99 Кб0Апории Зенона. Статьи..doc
#
01.05.2025138.24 Кб0Аппликация.doc
#
04.11.201857.34 Кб46Аристотель - Гораций - Буало - Лессинг.doc
#
02.05.201970.52 Кб9Аристотель.docx
#
01.07.2025996.35 Кб0Арнольд Основы научн.исс-й 1991.doc
#
19.03.201534.63 Mб245АРС2.doc
#
15.07.2019104.96 Кб4Артёмов Артём(Гиму1-2).doc
#
20.11.2019267.26 Кб49Архитектура ЭВМ.doc
#
01.05.20252.14 Mб0Ассеева УМКД Мат.мет. в экон. оконч.вар. (2)дз.doc
#
05.09.2019119.81 Кб21Астенический характер.doc