
- •Часть1. Тематический план дисциплины
- •Часть 2. Конспекты лекций 8
- •Часть 3. Вопросы и задания для практических работ. 79
- •Часть 4. Задания для самостоятельной работы 92
- •Часть 5. Лабораторные работы 97
- •Часть1. Тематический план дисциплины «Основы математической обработки информации»
- •Часть 2. Конспекты лекций
- •1.1. Исторические периоды развития математики.
- •1.2. Основы теории множеств
- •1.2.1. Начальные понятия теории множеств.
- •2.1.3. Основные понятия комбинаторики
- •2) Перестановка из n элементов – это размещение из n элементов по n.
- •2.2. Начальные понятия теории вероятностей
- •2.2.2. Определения вероятности событий
- •3.1. Действия над событиями
- •3.2. Вероятность суммы событий
- •3.3. Вероятность произведения событий.
- •3.4. Вычисление вероятности цепочек языковых элементов.
- •3.5. Формула полной вероятности. Формула Байеса.
- •1 H2) Формула полной вероятности.
- •3.6. Теорема Бернулли
- •3.7. Вероятностное моделирование порождения текста.
- •3.8. Предельные теоремы в схеме Бернулли
- •4.1. Случайная величина (св). Начальные понятия.
- •4.2. Функция распределения св (интегральная функция распределения) f(X)
- •4.3. Функция плотности вероятности нсв f(X)
- •4.4. Числовые характеристики св
- •4.5. Законы распределения случайных величин.
- •1) Биномиальный закон распределения.
- •2) Закон Пуассона
- •3) Нормальное распределение (закон Гаусса)
- •6. Вероятность попадания нсв х в заданный промежуток
- •7. Логнормальное распределение
- •5.1. Система двух случайных величин (двумерная св) (1 час)
- •5.1.1. Начальные понятия.
- •5.1.2. Операции над независимыми случайными величинами
- •5.1.3. Числовые характеристики системы двух св
- •5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- •5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- •6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- •6.2. Статистическое распределение выборки и его графическое изображение
- •6.2.1. Дискретный статистический ряд
- •6.2.2. Интервальный статистический ряд
- •6.3. Числовые характеристики статистического распределения
- •Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- •7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- •7.1.1. Свойства статистических оценок:
- •7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- •7.1.3. Интервальное оценивание параметров.
- •7.1.4. Доверительные интервалы для параметров нормального распределения
- •7.1.5. Число степеней свободы
- •7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- •7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- •7.2. Проверка статистических гипотез.
- •7.2.1. Статистические гипотезы.
- •7.2.2. Статистический критерий
- •4.2.3. Принцип проверки статистических гипотез
- •7.2.4. Ошибки при проверке гипотез
- •7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- •7.2.6. Проверка гипотез с помощью непараметрических критериев.
- •Часть 3. Вопросы и задания для практических работ.
- •I. Элементы комбинаторики.
- •Часть 4. Задания для самостоятельной работы
- •1. Графический способ.
- •2. Критерий асимметрии и эксцесса.
- •3. Критерий Колмогорова-Смирнова.
- •4. Критерий Пирсона
- •Приложение 1. Значения интегральной функции Лапласа
- •Приложение 2. Критические значения ( распределение Пирсона)
4.5. Законы распределения случайных величин.
Биномиальное распределение и распределение Пуассона - законы распределения ДСВ, которые могли бы выступать в качестве наиболее адекватных математических моделей порождения текста и составляющих его языковых единиц
1) Биномиальный закон распределения.
Дискретная случайная величина Х распределена по биномиальному закону, если она может принимать значения 0, 1, 2, …, n
с вероятностями, которые находятся по формуле Бернулли:
где
Пример. Составить закон распределения числа попаданий в цель при двух выстрелах, если вероятность попадания при одном выстреле равна 0,4. Найти М(x) и D(x).
Биномиальное распределение СВ используется при описании употребления фонем, графем и их классов, а так же при описании грамматических категорий, при условии, что n – количество испытаний и m - число появлений события А, невелико. В конкретных лингвистических задачах это условие не всегда соблюдается.
Будем рассматривать последовательные появления интересующей нас языковой единицы А в тексте в качестве потока лингвистических событий. Примерами такого потока могут служить последовательные появления в русском связном тексте словоформы «моря», или словосочетания «у самого синего моря» и т.п. Вероятность появления словоформы моря в большом тексте мала. Для описания редких лингвистических событий используется распределение Пуассона.
2) Закон Пуассона
Дискретная случайная величина Х распределена по закону Пуассона закону, если она может принимать значения 0, 1, 2, …, n
с вероятностями, которые находятся по формуле Пуассона:
Пример. Вероятность появления опечатки на определённой странице текта, содержащего 200 страниц, равна 0,01. Определить:
а) вероятность появления трёх опечаток в тексте;
б) вероятность того, что количество опечаток будет больше трёх;
в) М(Х) и D(X) СВ Х= «количество опечаток в тексте».
3) Нормальное распределение (закон Гаусса)
Распределение непрерывных СВ описывается специальными законами, среди которых , наиболее важным является нормальное распределение (закон Гаусса). Нормальное распределение выступает в качестве предельного закона, к которому при определённых условиях приближаются другие теоретические распределения.
НСВ Х распределена по нормальному закону Х~N(a;σ), если её функция плотности распределения имеет вид:
где а и σ>0 – параметры нормального распределения.
Свойства функции плотности вероятности f(x)
нормального распределения.
1) f(x)>0,
2) Прямая х=а – ось симметрии графика f(x);
3) - единственная точка экстремума функции
f(x);
4) -
точки перегиба графика f(x).
График f(x) - кривая нормального распределения (кривая Гаусса)
- имеет
идеально симметричную
форму,
коэффициенты асимметрии и эксцесса
для нормального распределения равны нулю.
При а=0 и σ=1, нормальное распределение называется стандартным. Плотность вероятностистандартной СВ имеет вид:
Функция распределения СВ Х~N(0;1) определяется по формуле:
и
называется функцией Лапласа.
Стандартное нормальное распределение часто используется в статистических исследованиях, поэтому значения функции Лапласа табулированы.
Пример:
Случайная величина Х задана дифференциальной
функцией распределения :
По какому закону распределена случайная величина?
Найти М(х), D(х), σ(x).
Построить схематически график f(x)