- •Часть1. Тематический план дисциплины
- •Часть 2. Конспекты лекций 8
- •Часть 3. Вопросы и задания для практических работ. 79
- •Часть 4. Задания для самостоятельной работы 92
- •Часть 5. Лабораторные работы 97
- •Часть1. Тематический план дисциплины «Основы математической обработки информации»
- •Часть 2. Конспекты лекций
- •1.1. Исторические периоды развития математики.
- •1.2. Основы теории множеств
- •1.2.1. Начальные понятия теории множеств.
- •2.1.3. Основные понятия комбинаторики
- •2) Перестановка из n элементов – это размещение из n элементов по n.
- •2.2. Начальные понятия теории вероятностей
- •2.2.2. Определения вероятности событий
- •3.1. Действия над событиями
- •3.2. Вероятность суммы событий
- •3.3. Вероятность произведения событий.
- •3.4. Вычисление вероятности цепочек языковых элементов.
- •3.5. Формула полной вероятности. Формула Байеса.
- •1 H2) Формула полной вероятности.
- •3.6. Теорема Бернулли
- •3.7. Вероятностное моделирование порождения текста.
- •3.8. Предельные теоремы в схеме Бернулли
- •4.1. Случайная величина (св). Начальные понятия.
- •4.2. Функция распределения св (интегральная функция распределения) f(X)
- •4.3. Функция плотности вероятности нсв f(X)
- •4.4. Числовые характеристики св
- •4.5. Законы распределения случайных величин.
- •1) Биномиальный закон распределения.
- •2) Закон Пуассона
- •3) Нормальное распределение (закон Гаусса)
- •6. Вероятность попадания нсв х в заданный промежуток
- •7. Логнормальное распределение
- •5.1. Система двух случайных величин (двумерная св) (1 час)
- •5.1.1. Начальные понятия.
- •5.1.2. Операции над независимыми случайными величинами
- •5.1.3. Числовые характеристики системы двух св
- •5.2. Предельные теоремы теории вероятностей: Закон больших чисел, Центральная предельная теорема и их значение для лингвистического эксперимента.(1 час)
- •5.2.1. Теорема Чебышева для среднего арифметического случайных величин.
- •6.1. Предмет математической статистики. Генеральная и выборочная совокупность.
- •6.2. Статистическое распределение выборки и его графическое изображение
- •6.2.1. Дискретный статистический ряд
- •6.2.2. Интервальный статистический ряд
- •6.3. Числовые характеристики статистического распределения
- •Лекция 7. Элементы теории статистических оценок и проверки гипотез.
- •7.1 Статистические оценки параметров распределения и их свойства. Оценка параметров генеральной совокупности по выборке
- •7.1.1. Свойства статистических оценок:
- •7.1.2. Точечные оценки математического ожидания, дисперсии и вероятности.
- •7.1.3. Интервальное оценивание параметров.
- •7.1.4. Доверительные интервалы для параметров нормального распределения
- •7.1.5. Число степеней свободы
- •7.1.7. Определение минимально достаточного объёма выборки в грамматических, фонетико-фонологических и лексикологических исследованиях.
- •7.2. Проверка статистических гипотез. Исследование вероятностных свойств языка и статистики текста с помощью метода гипотез.
- •7.2. Проверка статистических гипотез.
- •7.2.1. Статистические гипотезы.
- •7.2.2. Статистический критерий
- •4.2.3. Принцип проверки статистических гипотез
- •7.2.4. Ошибки при проверке гипотез
- •7.2.5. Проверка лингвистических гипотез с помощью параметрических критериев.
- •7.2.6. Проверка гипотез с помощью непараметрических критериев.
- •Часть 3. Вопросы и задания для практических работ.
- •I. Элементы комбинаторики.
- •Часть 4. Задания для самостоятельной работы
- •1. Графический способ.
- •2. Критерий асимметрии и эксцесса.
- •3. Критерий Колмогорова-Смирнова.
- •4. Критерий Пирсона
- •Приложение 1. Значения интегральной функции Лапласа
- •Приложение 2. Критические значения ( распределение Пирсона)
4.3. Функция плотности вероятности нсв f(X)
(дифференциальная функция распределения)
Плотностью вероятностиf(x) (или плотностью распределения) непрерывной СВ называется первая производная от функции распределения
f(x) характеризует плотность, с которой распределяются значения СВ в данной точке.
Свойства f(x):
f
S=1
(x)≥0, т.к. F(x) – неубывающая.При х→0 или х→∞, f(x) →0
П
х
лощадь фигуры между графиком
плотности вероятности и осью х равна 1.
4.4. Числовые характеристики св
1) Математическое ожидание M(X) - это среднее, наиболее ожидаемое значение СВ .
Для ДСВ
Свойства М(Х):
Математическое ожидание постоянной есть эта постоянная: М(С)=С .
Постоянную можно выносить за знак математического ожидания: М(С∙Х)=С∙М(Х).
Математическое ожидание суммы случайных величин равно сумме их математических ожиданий: М(Х+У)=М(Х)+М(У).
Математическое ожидание отклонения СВ от М(Х) равно нулю: М(Х- М(Х))=0.
Математическое ожидание произведения двух независимых случайных величин равно произведению их математических ожиданий: М(Х∙У)=М(Х)∙М(У).
2) Дисперсия D(X) - математическое ожидание квадрата отклонения значений СВ от её математического ожидания:
D(X) = М(Х-М(Х))2
Для ДСВD(X) находится по формуле: т.е.
Свойства D(X):
D(X)≥0 (дисперсия неотрицательна);
D(C)=0 (дисперсия постоянной равна нулю);
D(CX)=C2∙D(X) (постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат)
D(X+C) = D(X) (дисперсия не изменится, если к значениям случайной величины прибавить одно и то же постоянное число)
Более простая формула для вычисления дисперсии:
Доказательство: D(X) = М(Х-М(Х))2 = М(Х2-2Х∙ М(Х)+М2(Х))=
=М(Х2)-2М(Х∙М(Х))+М(М2(Х)))=
=М(Х2) – 2М(Х) М(М(Х))+ М(М2(Х)))=М(Х2)- 2М(Х) ∙М(Х)+ М2(Х) = =М(Х2) - 2М2(Х)+М2(Х)=М(Х2) - М2(Х) (по свойствам М(Х))
3)Среднее квадратическое отклонение σ(Х)
σ(Х) имеет те же единицы, что и М(Х).
4) Мода Мо(Х) - такое значение случайной величины Х, которое принимается с наибольшей вероятностью.
5) Медиана Ме (определяется для НСВ, функция распределения которой строго монотонна) - такое значение Х, для которого одинаково вероятно, что значения СВ окажутся меньше или больше его, т.е. Р(Х<Me)=P(X>Me)=1/2 .
6) Коэффициент асимметрии Аs (определяется для НСВ) - показатель асимметричности распределения, определяющий степень скошенности функции плотности вероятности этой величины.
7) Коэффициент эксцесса Еx (определяется для НСВ) – показатель, служащий мерой островершинности кривой функции плотности вероятности этой величины.
Пример: Воспользуемся данными примера, приведённого в Лк3.
Относительная частота появления существительных в подъязыке английской электроники близка к 1/3(априорная вероятность). Типовым синтаксически оформленным сегментом в английских научно-технических текстах является предложение длиной в 10 словоформ. Считая появление отдельных словоформ в этих сегментах независимыми событиями текста, для ДСВ Х - «количество существительных в типовых синтаксически оформленных сегментах»
- задать закон распределения СВХ;
- построить многоугольник распределения;
- определить числовые характеристики ДСВ;
- найти функцию распределения F(x) и построить её график.
Фунция распределения любой ДСВ всегда является разрывной ступенчатой функцией, скачки которой происходят в точках, соответствующих значениям СВ Х, длина скачка равна вероятности СВ в данной точке.
Для НСВ функция распределения F(x) непрерывна на R.