- •Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
- •Часть II
- •Введение
- •1. Закон больших чисел
- •1.2. Неравенства чебышева
- •1.3. Сходимость по вероятности
- •1.4.Теоремы чебышева
- •1.4.1.Первая теорема Чебышева.
- •1.4.2. Вторая теорема Чебышева:
- •1.5. Теорема бернулли
- •1.6. Центральная предельная теорема
- •1.7. Предельные теоремы
- •1.7.1. Локальная теорема Муавра-Лапласа.
- •1.7.2. Интегральная теорема Муавра-Лапласа.
- •2. Базовые понятия математической статистики
- •2.1. Эмпирическая функция распределения
- •2.2. Гистограмма
- •2.3. Оценки параметров распределения и их свойства
- •2.4. Оценки моментов и квантилей распределения
- •2.5. Точечная оценка параметров распределения
- •2.5.1. Сущность задачи точечного оценивания параметров
- •2.5.2. Метод максимального правдоподобия
- •2.5.3. Метод моментов
- •2.5.4. Метод квантилей
- •3. Проверка статистических гипотез
- •3.1. Сущность задачи проверки статистических гипотез
- •3.2. Типовые распределения
- •3.2.1. Нормальное распределение
- •3.2.2. Распределение χ2 (хи-квадрат)
- •3.2.3. Распределение Стьюдента
- •3.3.4. Распределение Фишера
- •3.3. Проверка гипотез о законе распределения
- •3.3.1. Критерий хи-квадрат к. Пирсона
- •3.3.2. Критерий а.Н. Колмогорова
- •3.3.3. Критерий р. Мизеса
- •4. Интервальная оценка параметров распределения
- •4.1. Сущность задачи интервального оценивания параметров
- •4.2. Общий метод построения доверительных интервалов
- •4.3. Доверительный интервал для математического ожидания
- •4.4. Доверительный интервал для дисперсии
- •4.5. Доверительный интервал для вероятности
- •5. Аппроксимация закона распределения экспериментальных данных
- •5.1. Задачи аппроксимации
- •5.2. Аппроксимация на основе типовых распределений
- •6. Обработка однотипных выборок
- •6.1. Однотипные выборки эд и задачи их обработки
- •6.2. Объединение выборок
- •6.2.1. Объединение однородных выборок
- •6.2.2. Объединение неоднородных выборок
- •6.3. Однофакторный дисперсионный анализ
- •6.3.1. Задачи дисперсионного анализа
- •6.3.2. Проверка однородности совокупности дисперсий
- •6.3.3. Сравнение факторной и остаточной дисперсий
- •7. Корреляционный и регрессионный анализ
- •7.1. Матрица данных
- •7.2. Корреляционный анализ
- •7.3. Регрессионный анализ
- •7.3.1. Постановка задачи
- •7.3.2. Выбор вида уравнения регрессии
- •7.3.4. Вычисление коэффициентов уравнения регрессии
Министерство образования Республики Беларусь
Учреждение образования «Белорусский государственный университет информатики и радиоэлектроники»
КАФЕДРА ИНФОРМАТИКИ
Автор Н.А. Волорова
Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
Часть II
Для студентов специальности
310304 «Информатика»
Минск 2006
Введение
Математической статистикой называется наука, занимающаяся методами обработки экспериментальных данных (ЭД), полученных в результате наблюдений над случайными явлениями.
Перед любой наукой ставятся следующие задачи:
Описание явлений;
Анализ и прогноз;
Выборка оптимальных решений.
Применительно к математической статистике пример задачи первого типа: пусть имеется статистический материал, представляющий собой случайные числа. Требуется его упростить, представить в виде таблиц и графиков, обеспечивающих наглядность и информативность представленного материала.
Пример задачи второго типа: оценка (хотя бы приблизительная) характеристик случайных величин, например, математического ожидания, дисперсии и т.д. Какова точность полученных оценок.
Одной из характерных задач третьего типа является задача проверки правдоподобия гипотез, которая формулируется следующим образом: можно ли предполагать, что имеющаяся совокупность случайных чисел не противоречит некоторой гипотезе (например о виде распределения, наличия корреляционной зависимости и т.д.).
В курсе рассматриваются задачи всех трех типов: способы описания результатов опыта, способы обработки опытных данных и оценки по ним характеристик случайного явления, способы выбора разумных решений.
1. Закон больших чисел
Пусть проводится опыт Е, в котором нас интересует признак Х, или СВ Х. При однократном проведении Е нельзя заранее сказать, какое значение примет Х. Но при n-кратном повторении «среднее» значение величины Х ( среднее арифметическое) теряет случайный характер и становится близким к некоторой константе.
Закон больших чисел – совокупность теорем, определяющих условия стремления средних арифметических значений случайных величин к некоторой константе, при увеличении числа опытов до бесконечности (n).
1.2. Неравенства чебышева
Теорема. Для любой случайной величины X с mx, Dx выполняется следующее неравенство где >0.
Доказательство:
1. Пусть величина Х – ДСВ. Изобразим значения Х и Мх в виде точек на числовой оси Ох
0 х1 А Мх В
Вычислим вероятность того, что при некотором величина Х отклонится от своего МО не меньше чем наε:
.
Это событие заключается в том, что точка Х не попадет на отрезок [mx-ε, mx+ε], т.е.
--
для тех значений x, которые лежат вне отрезка [mx-ε, mx+ε].
Рассмотрим дисперсию с.в. Х:
.
Т.к. все слагаемые – положительные числа, то если убрать слагаемые, соответствующую отрезку [mx-ε, mx+ε], то можно записать:
,
т.к. , то неравенство можно усилить
2. Для НСВ:
- это интегрирование по внешней части отрезка [mx-ε, mx+ε].
Применяя неравенство и подставляя его под знак интеграла, получаем
.
Откуда и вытекает неравенство Чебышева для НСВ.
Следствие. -это 2-е неравенство Чебышева.
Доказательство:Событияи- противоположны.
Лемма: Пусть Х –СВ, 0 – любое число. Тогда
Доказательство:
,
Т.к..
Следствие..
Д-во: Полагаем, вместо св Х – св Х-М(Х), т.к. М( Х-М(Х))2=D(X) и получаем неp-во.
Следствие: (правило трех сигм для произвольного распределения):
Полагаем в неравенстве Чебышева , имеем
.
Т.е. вероятность того, что отклонение св от ее МО выйдет за пределы трех СКО, не больше 1/9.
Неравенство Чебышева дает только верхнюю границ вероятности данного отклонения. Выше этой границы - значение не может быть ни при никаком распределении.