Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ТВ и МС.docx
Скачиваний:
3
Добавлен:
01.07.2025
Размер:
2.79 Mб
Скачать

3.5. Виды законов распределения случайных величин

Сходные случайные величины объединяют в группы по видам распределения. Выделяя общие черты этих СВ, находят общие более простые формулы для нахождения их числовых характеристик. Например, случайные величины «число предлогов в фрагменте текста, длиной 10 словоформ», «число сложноподчинённых предложений в тексте из 20 предложений», «число выпавших 6 при подбрасывании кубика 15раз», «количество орлов при 5-кратном подбрасывании монеты», распределены одинаково, т.к. вероятности появления их значений определяются по формуле Бернулли. Это распределение называется биномиальным. Биномиальное распределение и распределение Пуассона - законы распределения ДСВ, которые могли бы выступать в качестве наиболее адекватных математических моделей порождения текста и составляющих его языковых единиц.

1. Биномиальный закон распределения

Дискретная случайная величина Х распределена по биномиальному закону, если она может принимать значения 0, 1, 2, …, n

с вероятностями, которые находятся по формуле Бернулли:

; где

Пример. Пусть производится произвольное извлечение трех словоформ из научно-технического текста. Считая, что вероятность употребления существительного в научно-техническом тексте равна 0,4, для СВ Х «число выбраных существительных», найти математическое ожидание М(Х) и дисперсию D(Х).

Решение. СВ Х распределена по биномиальному закону, так как испытания являются независимыми, а вероятность появления существительного в каждом из трёх испытаний постоянна.

Здесь n=3, р=0,4, q=1-р=0,6. Тогда М(Х)=n р=3 0,4=1,2; D(Х)=n р q= 3 0,4 0,6=0,72.

Биномиальное распределение СВ используется при описании употребления фонем, графем и их классов, а так же при описании грамматических категорий, при условии, что n – количество испытаний и m - число появлений события А, невелико. В конкретных лингвистических задачах это условие не всегда соблюдается. Например, вероятность появления словоформы ветер в большом тексте мала. Для описания редких лингвистических событий используется распределение Пуассона.

2. Закон Пуассона

Дискретная случайная величина Х распределена по закону Пуассона, если она может принимать значения 0, 1, 2, …, n

с вероятностями, которые находятся по формуле Пуассона:

где

Пример. Вероятность появления опечатки на каждой странице текта, содержащего 200 страниц, равна 0,01. Определить:

а) вероятность появления трёх опечаток в тексте;

б) математическое ожидание М(Х) и дисперсию D(X) СВ Х= «количество опечаток в тексте».

Решение. Так как опечатка – редкое событие (р=0,01), то воспользуемся формулой Пуассона для нахождения вероятностей редких событий: где р=0,01, n=200, а= n р=0,01 200=2.

Тогда

б) Случайная величина Х – «количество опечаток в тексте» распределена по закону Пуассона, для которого М(Х)=D(X)=а=0,2.

3. Нормальное распределение (закон Гаусса)

Распределение непрерывных СВ описывается специальными законами, среди которых, наиболее важным является нормальное распределение (закон Гаусса). Нормальное распределение выступает в качестве предельного закона, к которому при определённых условиях приближаются другие теоретические распределения.

НСВ Х распределена по нормальному закону Х~N(a;σ), если её функция плотности распределения имеет вид:

где а и σ>0 – параметры нормального распределения.

Свойства функции плотности вероятности f(x)

нормального распределения

а) f(x)>0, график расположен выше оси х.

б) прямая х=а – ось симметрии графика f(x).

в) – единственная точка экстремума функции f(x).

г) – точки перегиба графика f(x).

Г рафик f(x) - кривая нормального распределения (кривая Гаусса)

- имеет идеально симметричную форму,

коэффициенты асимметрии и эксцесса

для нормального распределения равны нулю.

Функция распределения СВ Х~N(a;σ) находится по формуле: , где - функция Лапласа.

При а=0 и σ=1, нормальное распределение называется стандартным.

Плотность вероятности стандартной СВ имеет вид:

Стандартное нормальное распределение часто используется в статистических исследованиях, поэтому значения функции Лапласа табулированы.

Пример. Случайная величина Х задана функцией плотности вероятности:

Доказать, что СВ Х распределена по нормальному закону

Найти М(х), D(х), σ(x). Построить схематически график f(x).

Решение. Функция f(x) имеет вид функции плотности вероятности для нормального распределения с параметрами, а=1 и σ=4. Для нормально распределённой СВ Х М(х)= а=1, D(х)=σ2=16, σ(x)=σ=4.

Д ля построения графика f(x) найдём координаты вершины графика и точек перегиба f(x)

; 0,06

х

1

5

-3

f(x)

0,1

0,06

0,06

– 1 х

точки перегиба графика): f(5= f(-3)=0,06