Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ТВ и МС.docx
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
2.79 Mб
Скачать

4 .Логнормальное распределение

Реальные распределения случайных лингвистических единиц не всегда хорошо описываются нормальным законом, обладая правосторонней асимметрией. В связи с этим делаются попытки моделировать эти эмпирические распределения. С этой точки зрения наибольший интерес представляет логарифмически нормальное (логнормальное) распределение. В этом случае нормально распределена не сама СВХ, а её логарифм. Функция плотности вероятности логнормального распределения имеет вид

, где .

Функция плотности вероятности логнормального распределения характеризуется островершинностью, и имеет правостороннюю (положительную) скошенность.

Г. Хердан («Квантитативная лингвистика», Лондон, 1964г.) использует логнормальное распределение для математической экспликации вероятностного построения словаря языка и его реализации в тексте. По его мнению, логнормальность словаря и текста отражает присущий естественному языку принцип оптимального кодирования информации.

3.6. Вероятность попадания нсв х в заданный промежуток

или

(по определению и свойствам функции F(x) и f(x)).

Если НСВ Х распределена по нормальному закону Х~N(a;σ), вероятность попадания Х в интервал (α;β) вычисляется по формуле

где – функция Лапласа (значения табулированы)

Свойства :

а) - функция Лапласа нечётная. б) ; в)

Пример. СВ Х распределена по нормальному закону с параметрами a=2; σ=4: Х~N(-2;4).Найти вероятность того, что СВХ попадёт в промежуток: а)(0;3),б) (4; ∞), в) (-∞;1).

Решение. а) Р(0<X<3)= =Φ(0,25)Φ(0,5)=Φ(0,25)+Φ(0,5) = 0,0987+0,1915=0,29;

б) Р(Х>4) = Р(4<X<∞)= = Φ() - Φ(0,5)= 0,5-0,1915=0,31;

в) Р(X<1)=Р(-∞<X<3)= =Φ(0,25)+Φ()=0,0987+0,5=0,60

Иногда для решения лингвистической задачи необязательно находить вероятности появления данного события 0,1,2,…N раз, а достаточно указать наивероятнейшее число появления этого события х0, которое определяется по формуле

Лекция 4.

4.1. Система двух дискретных случайных величин (двумерная дискретная св)

В науке о языке часто рассматриваются вопросы о совместном функционировании случайных лингвистических величин, их взаимодействии и зависимости. Например, лингвистов интересует вопрос о существовании зависимости между частотой употребления частей речи в текстах, между длиной предложения и количеством букв в словах этого предложения, и т.п. В этом случае случайные величины рассматриваются совместно, т. е в системе. Мы рассмотрим систему двух СВ, свойства которой можной можно использовать при изучении систем с большим количеством случайных величин.

Начальные понятия.

1) Упорядоченная пара (Х;Y) случайных величин Х и Y называется системой двух СВ или двумерной СВ.

2) Закон распределения двумерной СВ – соответствие между значениями (Х ; Y) и их вероятностями.

3) СВ Х и Y называются независимыми, если закон распределения каждой из них не зависит от того, какое значение приняла другая.

4) Две СВ Х и Y называются функционально зависимыми, если зная значение одной из них, можно точно указать значение другой.

5) СВ Х и Y связаны стохастической зависимостью, если зная значение одной из них, можно указать закон распределения, а не точное значение другой.

Примеры: пары случайных величин Х – «рост человека», Y – « вес этого же человека»; U – «количество существительных в отрывке текста определённой длины», и V – «количество наречий в том же отрывке текста» связаны стохастической зависимостью;

Операции над независимыми случайными величинами

1) умножение на число: значения случайных величин умножаются на это число, а их вероятности не изменяются;

2) возведение в натуральную степень: значения случайных величин возводятся в степень, а вероятности не изменяются;

3) сложение, вычитание, умножение – значения попарно складываются, а соответствующие вероятности перемножаются.

Пример. Независимые дискретные случайные величины Х и Y заданы законами распределения:

Y

-1

0

1

Р

0,1

0,4

0,5

Х

0

2

Р

0,7

0,3


Найти закон распределения СВ Z=2X+Y

-2

0

2

Р

0,1

0,4

0,5

Решение. Воспользуемся правилом (1) для нахождения закона распределения случайной величины 2Х

2Х\Y

0

2

-2

0,07

0,03

0

0,28

0,12

2

0,35

0,15

По правилу (3) найдем вероятности значений

СВ Z (вероятности СВ 2Х и Y перемножаются).

Проверка: 0,07+0,03+0,28+0,12+0,35+0,15=1

Z

-2

0

2

4

Р

0,07

0,03+0,28

0,12+0,35

0,15

Закон распределения СВ Z имеет вид:

(значения СВ 2Х и Y складываются)

Z

-2

0

2

4

Р

0,07

0,31

0,47

0,15


0,07+0,31+0,47+0,15=1