- •Часть 1. Конспекты лекций
- •Правила комбинаторики
- •Основные понятия комбинаторики
- •1.2. Основные понятия теории вероятностей
- •Начальные понятия теории вероятностей
- •Определения вероятности событий
- •Лекция 2. Основные теоремы теории вероятностей случайных событий
- •2.1. Действия над событиями
- •2.2. Вероятность суммы событий
- •Следствия из теоремы сложения
- •2.3. Вероятность произведения событий
- •2.4. Формула полной вероятности. Формула Байеса.
- •2.5. Теорема Бернулли
- •2.6. Предельные теоремы в схеме Бернулли.
- •3. Интегральная теорема Муавра-Лапласа
- •3.1. Начальные понятия
- •3.2. Функция распределения свх f(X) (интегральная функция распределения)
- •3.3. Функция плотности вероятности нсв f(X)
- •3.4. Числовые характеристики случайных величин
- •3.5. Виды законов распределения случайных величин
- •1. Биномиальный закон распределения
- •2. Закон Пуассона
- •3. Нормальное распределение (закон Гаусса)
- •4 .Логнормальное распределение
- •3.6. Вероятность попадания нсв х в заданный промежуток
- •4.1. Система двух дискретных случайных величин (двумерная дискретная св)
- •Начальные понятия.
- •Числовые характеристики системы двух св
- •4.2. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •5.1.Предмет математической статистики. Генеральная и выборочная совокупность.
- •5.2. Статистическое распределение выборки и его графическое изображение
- •5.3. Числовые характеристики статистического распределения
- •6.1. Оценка параметров генеральной совокупности по выборке
- •Свойства статистических оценок
- •Точечные оценки математического ожидания, дисперсии и вероятности.
- •Интервальное оценивание параметров.
- •Доверительные интервалы для параметров нормального распределения
- •Интервальная оценка параметров генеральной лингвистической совокупности.
- •Число степеней свободы
- •Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- •6.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез
- •Проверка лингвистических гипотез с помощью параметрических критериев
- •Проверка гипотез с помощью непараметрических критериев
- •Критерий Пирсона
- •Часть 2. Вопросы и задания для практических работ.
- •1. Элементы комбинаторики
- •Часть 3. Задания для самостоятельной работы
- •1. Графический способ.
- •2. Критерий асимметрии и эксцесса.
- •3. Критерий Колмогорова-Смирнова.
- •4. Критерий Пирсона
- •Приложение 1.1. Значения интегральной функции Лапласа
- •2.Место модуля в структуре ооп:
- •3.Краткое содержание модуля тв и мс.
- •4. Компетенции обучающегося, формируемые в результате освоения модуля тв и мс дисциплины «Основы математической обработки информации»
- •5. Структура и содержание модуля тв и мс дисциплины «Основы математической обработки информации»
3.5. Виды законов распределения случайных величин
Сходные случайные величины объединяют в группы по видам распределения. Выделяя общие черты этих СВ, находят общие более простые формулы для нахождения их числовых характеристик. Например, случайные величины «число предлогов в фрагменте текста, длиной 10 словоформ», «число сложноподчинённых предложений в тексте из 20 предложений», «число выпавших 6 при подбрасывании кубика 15раз», «количество орлов при 5-кратном подбрасывании монеты», распределены одинаково, т.к. вероятности появления их значений определяются по формуле Бернулли. Это распределение называется биномиальным. Биномиальное распределение и распределение Пуассона - законы распределения ДСВ, которые могли бы выступать в качестве наиболее адекватных математических моделей порождения текста и составляющих его языковых единиц.
1. Биномиальный закон распределения
Дискретная случайная величина Х распределена по биномиальному закону, если она может принимать значения 0, 1, 2, …, n
с вероятностями, которые находятся по формуле Бернулли:
; где
Пример. Пусть производится произвольное извлечение трех словоформ из научно-технического текста. Считая, что вероятность употребления существительного в научно-техническом тексте равна 0,4, для СВ Х ‑ «число выбраных существительных», найти математическое ожидание М(Х) и дисперсию D(Х).
Решение. СВ Х распределена по биномиальному закону, так как испытания являются независимыми, а вероятность появления существительного в каждом из трёх испытаний постоянна.
Здесь n=3, р=0,4, q=1-р=0,6. Тогда М(Х)=n р=3 0,4=1,2; D(Х)=n р q= 3 0,4 0,6=0,72.
Биномиальное распределение СВ используется при описании употребления фонем, графем и их классов, а так же при описании грамматических категорий, при условии, что n – количество испытаний и m - число появлений события А, невелико. В конкретных лингвистических задачах это условие не всегда соблюдается. Например, вероятность появления словоформы ветер в большом тексте мала. Для описания редких лингвистических событий используется распределение Пуассона.
2. Закон Пуассона
Дискретная случайная величина Х распределена по закону Пуассона, если она может принимать значения 0, 1, 2, …, n
с вероятностями, которые находятся по формуле Пуассона:
где
Пример. Вероятность появления опечатки на каждой странице текта, содержащего 200 страниц, равна 0,01. Определить:
а) вероятность появления трёх опечаток в тексте;
б) математическое ожидание М(Х) и дисперсию D(X) СВ Х= «количество опечаток в тексте».
Решение. Так как опечатка – редкое событие (р=0,01), то воспользуемся формулой Пуассона для нахождения вероятностей редких событий: где р=0,01, n=200, а= n р=0,01 200=2.
Тогда
б) Случайная величина Х – «количество опечаток в тексте» распределена по закону Пуассона, для которого М(Х)=D(X)=а=0,2.
3. Нормальное распределение (закон Гаусса)
Распределение непрерывных СВ описывается специальными законами, среди которых, наиболее важным является нормальное распределение (закон Гаусса). Нормальное распределение выступает в качестве предельного закона, к которому при определённых условиях приближаются другие теоретические распределения.
НСВ Х распределена по нормальному закону Х~N(a;σ), если её функция плотности распределения имеет вид:
где а и σ>0 – параметры нормального распределения.
Свойства функции плотности вероятности f(x)
нормального распределения
а) f(x)>0, график расположен выше оси х.
б) прямая х=а – ось симметрии графика f(x).
в)
–
единственная
точка экстремума функции f(x).
г)
–
точки перегиба графика f(x).
Г
рафик
f(x)
- кривая
нормального распределения (кривая
Гаусса)
- имеет идеально симметричную форму,
коэффициенты асимметрии и эксцесса
для нормального распределения равны нулю.
Функция
распределения СВ Х~N(a;σ)
находится по формуле:
,
где
- функция Лапласа.
При а=0 и σ=1, нормальное распределение называется стандартным.
Плотность
вероятности стандартной СВ имеет вид:
Стандартное нормальное распределение часто используется в статистических исследованиях, поэтому значения функции Лапласа табулированы.
Пример.
Случайная величина Х задана функцией
плотности вероятности:
Доказать, что СВ Х распределена по нормальному закону
Найти М(х), D(х), σ(x). Построить схематически график f(x).
Решение. Функция f(x) имеет вид функции плотности вероятности для нормального распределения с параметрами, а=1 и σ=4. Для нормально распределённой СВ Х М(х)= а=1, D(х)=σ2=16, σ(x)=σ=4.
Д
ля
построения графика f(x)
найдём координаты вершины графика и
точек перегиба f(x)
;
0,06
х |
1 |
5 |
-3 |
f(x) |
0,1 |
0,06 |
0,06 |
– 1 х
точки перегиба графика): f(5= f(-3)=0,06
