- •Лекции по дисциплине курса «Теория вероятностей и математическая статистика»
- •Часть II
- •Введение
- •1. Закон больших чисел
- •1.2. Неравенства чебышева
- •1.3. Сходимость по вероятности
- •1.4.Теоремы чебышева
- •1.4.1.Первая теорема Чебышева.
- •1.4.2. Вторая теорема Чебышева:
- •1.5. Теорема бернулли
- •1.6. Центральная предельная теорема
- •1.7. Предельные теоремы
- •1.7.1. Локальная теорема Муавра-Лапласа.
- •1.7.2. Интегральная теорема Муавра-Лапласа.
- •2. Базовые понятия математической статистики
- •2.1. Эмпирическая функция распределения
- •2.2. Гистограмма
- •2.3. Оценки параметров распределения и их свойства
- •2.4. Оценки моментов и квантилей распределения
- •2.5. Точечная оценка параметров распределения
- •2.5.1. Сущность задачи точечного оценивания параметров
- •2.5.2. Метод максимального правдоподобия
- •2.5.3. Метод моментов
- •2.5.4. Метод квантилей
- •3. Проверка статистических гипотез
- •3.1. Сущность задачи проверки статистических гипотез
- •3.2. Типовые распределения
- •3.2.1. Нормальное распределение
- •3.2.2. Распределение χ2 (хи-квадрат)
- •3.2.3. Распределение Стьюдента
- •3.3.4. Распределение Фишера
- •3.3. Проверка гипотез о законе распределения
- •3.3.1. Критерий хи-квадрат к. Пирсона
- •3.3.2. Критерий а.Н. Колмогорова
- •3.3.3. Критерий р. Мизеса
- •4. Интервальная оценка параметров распределения
- •4.1. Сущность задачи интервального оценивания параметров
- •4.2. Общий метод построения доверительных интервалов
- •4.3. Доверительный интервал для математического ожидания
- •4.4. Доверительный интервал для дисперсии
- •4.5. Доверительный интервал для вероятности
- •5. Аппроксимация закона распределения экспериментальных данных
- •5.1. Задачи аппроксимации
- •5.2. Аппроксимация на основе типовых распределений
- •6. Обработка однотипных выборок
- •6.1. Однотипные выборки эд и задачи их обработки
- •6.2. Объединение выборок
- •6.2.1. Объединение однородных выборок
- •6.2.2. Объединение неоднородных выборок
- •6.3. Однофакторный дисперсионный анализ
- •6.3.1. Задачи дисперсионного анализа
- •6.3.2. Проверка однородности совокупности дисперсий
- •6.3.3. Сравнение факторной и остаточной дисперсий
- •7. Корреляционный и регрессионный анализ
- •7.1. Матрица данных
- •7.2. Корреляционный анализ
- •7.3. Регрессионный анализ
- •7.3.1. Постановка задачи
- •7.3.2. Выбор вида уравнения регрессии
- •7.3.4. Вычисление коэффициентов уравнения регрессии
3.2. Типовые распределения
При проверке гипотез широкое применение находит ряд теоретических законов распределения. Наиболее важным из них является нормальное распределение. С ним связаны распределения χ2 (хи-квадрат), Стьюдента, Фишера, а также интеграл вероятностей. Для указанных законов функции распределения аналитически не представимы. Значения функций определяются по таблицам или с использованием стандартных процедур пакетов прикладных программ. Указанные таблицы обычно построены в целях удобства проверки статистических гипотез в ущерб теории распределений – они содержат не значения функций распределения, а критические значения аргумента z(α).
Для односторонней критической области z(α) = z1–a, т.е. критическое значение аргумента z(α)) соответствует квантили z1–a уровня 1– α, так как
,
Рис. 3.3. Односторонняя критическая область
Для двусторонней критической области, с уровнем значимости α, размер левой области α2, правой α1 (α1+ α2= α), рис. 3.4. Значения z(α2) и z(α1) связаны с квантилями распределения соотношениями
z(α1)=z1–a1, z(a2)=za2,
так как
Для симметричной функции плотности распределения f(z) критическую область выбирают из условия a1=a2=a/2 (обеспечивается наибольшая мощность критерия). В таком случае левая и правая границы будут равны |z(a/2)|.
Рис. 3.4. Двусторонняя критическая область
3.2.1. Нормальное распределение
Этот вид распределения является наиболее важным в связи с центральной предельной теоремой теории вероятностей: распределение суммы независимых случайных величин стремится к нормальному с увеличением их количества при произвольном законе распределения отдельных слагаемых, если слагаемые обладают конечной дисперсией. Кроме того, А.М. Ляпунов доказал, что распределение параметра стремится к нормальному, если на параметр оказывает влияние большое количество факторов и ни один из них не является превалирующим. Функция плотности нормального распределения
(3.1)
– унимодальная, симметричная, аргумент х может принимать любые действительные значения, рис. 3.5.
Рис. 3.5. Плотность нормального распределения
Функция плотности нормального распределения стандартизованной величины U имеет вид
.
Вычисление значений функции распределения Ф(u) для стандартизованного неотрицательного аргумента u (u,0) можно произвести с помощью полинома наилучшего приближения:
Ф(u) = 1– 0,5(1 + 0,196854u + 0,115194u2 + 0,000344u3 + 0,019527u4)– 4. (3.2)
Такая аппроксимация обеспечивает абсолютную ошибку не более 0,00025. Для вычисления Ф(u) в области отрицательных значений стандартизованного аргумента u (u<0) следует воспользоваться свойством симметрии нормального распределения
Ф(u) = 1 – Ф(–u).
Иногда в справочниках вместо значений функции Ф(u) приводят значения интеграла вероятностей (для u > 0)
(3.3)
Интеграл вероятностей связан с функцией нормального распределения стандартизованной величины u соотношением
Ф(u) = 0,5 + F(u).
3.2.2. Распределение χ2 (хи-квадрат)
Распределению хи-квадрат (χ2-распределению) с k степенями свободы соответствует распределение суммы квадратовn стандартизованных случайных величин ui, каждая из которых распределена по нормальному закону, причем k из них независимы, n>k. Функция плотности χ2-распределению с k степенями свободы
, x > 0, (3.4)
где х = χ 2, Г(k/2) – гамма-функция.
Число степеней свободы k определяет количество независимых слагаемых в выражении для χ 2. Функция плотности при k, равном одному или двум, – монотонная, а при k >2 – унимодальная, несимметричная, рис. 3.6.
Рис. 3.6. Плотность χ2-распределение
Математическое ожидание и дисперсия величины χ2 равны соответственно k и 2k. χ2-распределение является частным случаем более общего гамма-распределения, а величина, равная корню квадратному из χ2 с двумя степенями свободы, подчиняется распределению Рэлея.
С увеличением числа степеней свободы (k >30) χ2-распределение приближается к нормальному распределению с математическим ожиданием k и дисперсией 2k. В таких случаях критическое значение χ2(k;a) » u1– a(k,2k), где u1–a(k,2k) – квантиль нормального распределения. Погрешность аппроксимации не превышает нескольких процентов.