- •Часть 1. Конспекты лекций
- •Правила комбинаторики
- •Основные понятия комбинаторики
- •1.2. Основные понятия теории вероятностей
- •Начальные понятия теории вероятностей
- •Определения вероятности событий
- •Лекция 2. Основные теоремы теории вероятностей случайных событий
- •2.1. Действия над событиями
- •2.2. Вероятность суммы событий
- •Следствия из теоремы сложения
- •2.3. Вероятность произведения событий
- •2.4. Формула полной вероятности. Формула Байеса.
- •2.5. Теорема Бернулли
- •2.6. Предельные теоремы в схеме Бернулли.
- •3. Интегральная теорема Муавра-Лапласа
- •3.1. Начальные понятия
- •3.2. Функция распределения свх f(X) (интегральная функция распределения)
- •3.3. Функция плотности вероятности нсв f(X)
- •3.4. Числовые характеристики случайных величин
- •3.5. Виды законов распределения случайных величин
- •1. Биномиальный закон распределения
- •2. Закон Пуассона
- •3. Нормальное распределение (закон Гаусса)
- •4 .Логнормальное распределение
- •3.6. Вероятность попадания нсв х в заданный промежуток
- •4.1. Система двух дискретных случайных величин (двумерная дискретная св)
- •Начальные понятия.
- •Числовые характеристики системы двух св
- •4.2. Предельные теоремы теории вероятностей
- •Закон больших чисел
- •5.1.Предмет математической статистики. Генеральная и выборочная совокупность.
- •5.2. Статистическое распределение выборки и его графическое изображение
- •5.3. Числовые характеристики статистического распределения
- •6.1. Оценка параметров генеральной совокупности по выборке
- •Свойства статистических оценок
- •Точечные оценки математического ожидания, дисперсии и вероятности.
- •Интервальное оценивание параметров.
- •Доверительные интервалы для параметров нормального распределения
- •Интервальная оценка параметров генеральной лингвистической совокупности.
- •Число степеней свободы
- •Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- •6.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез
- •Проверка лингвистических гипотез с помощью параметрических критериев
- •Проверка гипотез с помощью непараметрических критериев
- •Критерий Пирсона
- •Часть 2. Вопросы и задания для практических работ.
- •1. Элементы комбинаторики
- •Часть 3. Задания для самостоятельной работы
- •1. Графический способ.
- •2. Критерий асимметрии и эксцесса.
- •3. Критерий Колмогорова-Смирнова.
- •4. Критерий Пирсона
- •Приложение 1.1. Значения интегральной функции Лапласа
- •2.Место модуля в структуре ооп:
- •3.Краткое содержание модуля тв и мс.
- •4. Компетенции обучающегося, формируемые в результате освоения модуля тв и мс дисциплины «Основы математической обработки информации»
- •5. Структура и содержание модуля тв и мс дисциплины «Основы математической обработки информации»
6.1. Оценка параметров генеральной совокупности по выборке
Статистическая
оценка
– приближённое значение параметра
,
найденное по выборке:
Свойства статистических оценок
Несмещённость.
Статистическая
оценка
называется
несмещённой, если
(не делается систематической ошибки в
сторону завышения или занижения)
Состоятельность.
Статистическая
оценка
называется
состоятельной, если при увеличении
числа опытов оценка
приближается (сходится по вероятности)
к параметру
:
Эффективность.
Статистическая
оценка
называется
эффективной, если она обладает наименьшей
дисперсией из всех несмещённых оценок
параметра
,
вычисленных по выборкам одинакового
объёма:
Точечные оценки математического ожидания, дисперсии и вероятности.
Точечная оценка – оценка , которую используют в качестве приближённого значения параметра
Пусть
– выборка, полученная в результате n
независимых наблюдений за СВ Х (чтобы
подчеркнуть случайный характер, значения
выборки обозначаются прописными
буквами). Случайные величины
можно рассматривать как n
одинаково распределенных случайных
величин, поэтому все СВ имеют одинаковые
М(Х) и дисперсии:
Тогда:
– среднее выборочное есть несмещённая и состоятельная оценка математического ожидания М(Х) генеральной совокупности;
– исправленная
выборочная дисперсия
есть несмещённая и состоятельная оценка
дисперсии D(X)
генеральной совокупности.
- относительная частота появления события А в n независимых испытаниях есть несмещённая, состоятельная и эффективная оценка вероятности события А.
Задача 3. Для анализа лингвистических терминологических систем взято 7 фрагментов по 250 терминоупотреблений из русских лингвистических текстов. После подсчёта в каждом фрагменте числа употреблений слова «лицо» получен следующий вариационный ряд: 1,1,3,4,9,10,12.
1. Определите по выборке несмещённую и состоятельную оценку математического ожидания М(Х) и дисперсии D(X) случайной величины Х - «число употреблений слова «лицо» в русских лингвистических текстах.
2. Найдите несмещённую, состоятельную и эффективную оценку вероятности события А= «слово лицо использовано более 5 раз».
Решение
1.Несмещённая и состоятельная оценка
М(Х) есть среднее выборочное
.
Несмещённая и состоятельная оценка D(X) есть исправленная выборочная дисперсия:
2.
Несмещённой, состоятельной и эффективной
оценкой вероятности события А= «слово
лицо
использовано более 5 раз» является
частота этого события: Р(А):
Интервальное оценивание параметров.
Интервал
,
покрывающий с вероятностью γ
истинное значение параметра
,
называется доверительным интервалом,
где γ - доверительная вероятность или надёжность оценки.
1- γ =α – уровень значимости, вероятность того, что истинное значение параметра окажется вне доверительного интервала.
Ч асто доверительный интервал выбирается симметричным относительно несмещённой оценки параметра :
Доверительные интервалы для параметров нормального распределения
1. Доверительный интервал для неизвестного М(Х)=а при известной дисперсии
Х~N(a;σ); σ – известна; γ – доверительная вероятность – задана.
-
доверительный интервал;
t
определяется
из равенства
,
где
-
функция Лапласа
2. Доверительный интервал для неизвестного М(Х)=а при неизвестной дисперсии
Х~N(a;σ);
σ
– неизвестна;
γ
– доверительная вероятность.
-
доверительный интервал,
где S – исправленное среднее квадратическое отклонение;
-
определяется по таблице квантилей
распределения Стьюдента, α=1-
γ
– уровень значимости; k=n-1
– число
степеней свободы.
3.
Доверительный интервал для неизвестного
при
неизвестном математическом ожидании
М(Х).
Х~N(a;σ); a и σ – неизвестны; γ – доверительная вероятность (задана).
доверительный
интервал,
где
;
и
находятся
по таблице
, k
=n-1
– число степеней свободы.
4. Доверительный интервал для оценки вероятности успеха при большом числе испытаний Бернулли.
