
- •Часть 1. Конспекты лекций
- •Правила комбинаторики
- •Основные понятия комбинаторики
- •1.2. Основные понятия теории вероятностей
- •Начальные понятия теории вероятностей
- •Определения вероятности событий
- •Лекция 2. Основные теоремы теории вероятностей случайных событий
- •2.1. Действия над событиями
- •2.2. Вероятность суммы событий
- •Следствия из теоремы сложения
- •2.3. Вероятность произведения событий
- •2.4. Формула полной вероятности. Формула Байеса.
- •2.5. Теорема Бернулли
- •2.6. Предельные теоремы в схеме Бернулли.
- •3. Интегральная теорема Муавра-Лапласа
- •3.1. Начальные понятия
- •3.2. Функция распределения свх f(X) (интегральная функция распределения)
- •3.3. Функция плотности вероятности нсв f(X)
- •3.4. Числовые характеристики случайных величин
- •3.5. Виды законов распределения случайных величин
- •1. Биномиальный закон распределения
- •2. Закон Пуассона
- •3. Нормальное распределение (закон Гаусса)
- •4 .Логнормальное распределение
- •3.6. Вероятность попадания нсв х в заданный промежуток
- •4.1. Система двух дискретных случайных величин (двумерная дискретная св)
- •Начальные понятия.
- •Числовые характеристики системы двух св
- •4.2. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •5.1.Предмет математической статистики. Генеральная и выборочная совокупность.
- •5.2. Статистическое распределение выборки и его графическое изображение
- •5.3. Числовые характеристики статистического распределения
- •6.1. Оценка параметров генеральной совокупности по выборке
- •Свойства статистических оценок
- •Точечные оценки математического ожидания, дисперсии и вероятности.
- •Интервальное оценивание параметров.
- •Доверительные интервалы для параметров нормального распределения
- •Интервальная оценка параметров генеральной лингвистической совокупности.
- •Число степеней свободы
- •Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- •6.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез
- •Проверка лингвистических гипотез с помощью параметрических критериев
- •Проверка гипотез с помощью непараметрических критериев
- •Критерий Пирсона
- •Часть 2. Вопросы и задания для практических работ.
- •1. Элементы комбинаторики
- •Часть 3. Задания для самостоятельной работы
- •1. Графический способ.
- •2. Критерий асимметрии и эксцесса.
- •3. Критерий Колмогорова-Смирнова.
- •4. Критерий Пирсона
- •Приложение 1.1. Значения интегральной функции Лапласа
- •2.Место модуля в структуре ооп:
- •3.Краткое содержание модуля тв и мс.
- •4. Компетенции обучающегося, формируемые в результате освоения модуля тв и мс дисциплины «Основы математической обработки информации»
- •5. Структура и содержание модуля тв и мс дисциплины «Основы математической обработки информации»
2.6. Предельные теоремы в схеме Бернулли.
Часто в лингвистических исследованиях приходится проводить большое число независимых испытаний n. При этом величина n может быть велика, что делает вычисление по формуле Бернулли слишком трудоёмким. В таких случаях применяют асимптотические формулы для вычисления биномиальной вероятности при n→∞.
1.
Формула
Пуассона
,
где параметр
.
Формула применяется при большом количестве испытаний n (n≥100) и малой вероятности события А р (p≤0,1). При этом а≤10.
Если
количество испытаний n
велико, а вероятность р
не близка к нулю, то для нахождения
вероятности
используются
теоремы Муавра - Лапласа .
2. Локальная теорема Муавра-Лапласа
,
применяется при больших n и р≠0; р≠1.
Выражение
называется функцией Гаусса, значения
которой можно найти в таблице
(табулированы).
При
равенство дает удовлетворительное
приближение.
3. Интегральная теорема Муавра-Лапласа
,
где
-
функция
Лапласа, значения которой табулированы,
Теорема
применяется в тех случаях, когда требуется
вычислить вероятность, что в n
независимых
испытаниях событие А появится от
до
раз
включительно, при больших n
и р≠0; р≠1 (
).
Примеры.
1) Вероятность появления числительного в художественной речи равна 0, 01 [Головин, 1971, с.123]. Исследуется текст, длиной 500 знаменательных слов. Найти вероятность, что в данном тексте окажется… а) 3 числительных; б) более 3 числительных.
Решение:
a)
так как вероятность появления каждого
числительного мала, а число слов
(количество испытаний) велико, то применим
формулу Пуассона. Здесь n=500,
p=0,01,
a=500
0,01=5;
m=3;
0,14.
б) обозначим событие А – «в тексте более 3 числительных», тогда событие – «в тексте не более 3 (т.е 0, 1, 2 или 3) числительных».
2)
Вероятность появления существительного
в русской художественной речи равна
0,40 [Головин, 1971, с.123]. Исследуется текст,
длиной 200 знаменательных слов. Найти
вероятность, что в данном тексте окажется
а) 70 существительных; б) от 70 до 90
существительных.
Решение: так как n – велико (n=200), а вероятность р не близка к нулю (p=0,4; q=1-p=0,6), то для нахождения искомых вероятностей используется теоремы Муавра – Лапласа: локальная и интегральная.
а)
.
Значение
функции Гаусса
при
х=-1,44 равно 0,14 ;
б)
.
Φ(2,89)=0,498; Φ(1,44)=0,425;
0,073.
Лекция 3. Случайная величина
Случайное лингвистическое событие – результат лингвистического испытания и является качественной его характеристикой. Количественная характеристика результата опыта есть случайная величина. Например, случайная величина «число букв в слове» может принимать значения 1; 2; 3;…, а случайная величина «число гласных букв в слове» может принимать значения 1; 2; 3; …; 11. Появление одного из значений случайной величины – это случайное событие, появление всех значений случайной величины – совокупность случайных событий, образующих полную группу. Сумма вероятностей всех этих событий равна единице.
3.1. Начальные понятия
1) Случайная величина (СВ )– величина, которая может принимать определённые числовые значения в зависимости от исхода опыта. Обозначается заглавной буквой латинского алфавита. Например, СВ Х= «число сложноподчинённых предложений в тексте объёмом 500 словоформ».
2) Дискретная случайная величина (ДСВ) может принимать только отделённые друг от друга значения. Число значений дискретной случайной величины конечно или счётно.
Например, ДСВ Y = «количество глаголов в отрывке текста «Евгений Онегин», длиной 500 словоупотреблений».
3) Непрерывная случайная величина (НСВ) может принимать все значения из некоторого числового промежутка.
Например, HСВ Z= «высота звука человеческой речи»;
V = «интенсивность звука человеческой речи».
4) Случайная лингвистическая величина: длина слова, количество гласных и согласных фонем, число словоупотреблений в предложении и т.д. Когда фонолог, лексиколог или грамматист исследует структуру планов содержания или выражения, то он всегда имеет дело с дискретными СВ. Обращаясь к фонетическим или семантическим исследованиям лингвист должен оперировать непрерывными СВ.
5) Семантическая интерпретация непрерывной СВ
Между некоторыми родственными универсальными значениями нет чётких границ, и между ними всегда можно найти бесконечное число переходных смысловых оттенков. Особенно наглядно эта ситуация прослеживается в непрерывности цветового спектра. В каждом языке можно найти средства для обозначения тонких и ещё более тонких оттенков цветов, т.е. семантические интервалы цветового спектра сужаются. Если считать непрерывной СВ некоторое цветовое значение, то окажется, что СВ обязательно примет одно из своих возможных значений при извлечении предложения из соответствующего текста, хотя при многократном повторении опыта это значение будет появляться очень редко [Пиотровский, 1977, с.144].
6) Закон распределения СВ – правило, связывающее значения СВ и соответствующие им вероятности. Для ДСВ закон распределения можно представить в виде таблицы:
Х |
|
|
… |
|
P |
|
|
… |
|

pi
7) Многоугольник распределения –
л оманая линия, последовательно хi
соединяющая точки с координатами