
- •Введение
- •1. Случайные события и вероятность
- •1.1. Пространство элементарных событий. Случайные события. Алгебра событий
- •1.2. Классическое определение вероятности. Статистическое определение вероятности
- •1.3. Элементы комбинаторики. Некоторые содержательные задачи
- •1.4. Аксиоматическое введение вероятности
- •1.5. Теоремы о вероятностях случайных событий
- •1.6. Формула полной вероятности и формула Байеса
- •1.7. Геометрические вероятности
- •1.8. Схема независимых испытаний Бернулли. Формула Бернулли. Формула Пуассона. Локальная и интегральная теоремы Муавра-Лапласа
- •Вопросы для самопроверки
- •2. Случайные величины
- •2.1. Случайные величины. Случайные величины дискретного типа. Ряд распределения. Функция распределения
- •2.2. Случайная величина непрерывного типа. Плотность вероятности распределения случайной величины
- •2.3. Числовые характеристики случайной величины. Математическое ожидание и дисперсия, их свойства
- •2.4. Пуассоновский поток событий
- •Вопросы для самопроверки
- •3. Системы случайных величин
- •3.1. Закон распределения системы двух случайных величин. Функция распределения, плотность распределения системы двух случайных величин
- •3.2. Условные законы распределения. Зависимые и независимые случайные величины
- •3.3. Числовые характеристики системы двух случайных величин. Корреляционный момент. Коэффициент корреляции
- •Вопросы для самопроверки
- •4. Функции случайных величин
- •4.1. Преобразование случайных величин (случай двух переменных)
- •4.2. Распределение суммы, разности, произведения и частного двух случайных величин
- •4.3. Преобразование случайных величин (случай одной переменной)
- •4.5. Распределение Стьюдента
- •Вопросы для самопроверки
- •5. Закон больших чисел
- •5.1. Неравенства Чебышева
- •5.2. Теорема Чебышева
- •5.3. Теорема Бернулли
- •5.4. Центральная предельная теорема
- •Вопросы для самопроверки
- •6. Случайные процессы. Марковские случайные процессы. Системы массового обслуживания
- •6.1. Случайные процессы
- •6.2. Марковские случайные процессы. Марковские цепи
- •6.3. Марковские процессы с дискретными состояниями и непрерывным временем. Уравнения Колмогорова
- •6.4. Процессы гибели и размножения
- •6.5. Потоки случайных событий
- •6.6. Приложения марковских процессов
- •6.7. Системы массового обслуживания
- •6.8. Системы массового обслуживания с отказами Одноканальная смо с отказами
- •6.9. Системы массового обслуживания с очередями
- •Вопросы для самопроверки
- •7. Математическая статистика
- •7.1. Генеральная совокупность и выборка. Статистический ряд. Статистическая функция распределения. Гистограмма
- •7.2. Точечные оценки параметров генеральной совокупности по выборочным совокупностям, их свойства. Точечные оценки для математического ожидания и дисперсии случайной величины
- •7.3. Интервальные оценки. Доверительный интервал. Нахождение доверительных интервалов для математического ожидания и дисперсии нормального распределения случайной величины
- •1. Доверительный интервал для оценки математического ожидания нормального распределения случайной величины с известным
- •2. Доверительный интервал для оценки математического ожидания нормального распределения с неизвестным
- •3. Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
- •7.4. Построение прямых линий регрессии по выборочным данным
- •1. Нахождение параметров выборочных уравнений прямой линии регрессии по несгруппированным данным
- •2. Нахождение параметров выборочных уравнений прямой линии регрессии по сгруппированным данным
- •7.5. Нахождение оценки для коэффициента корреляции двух случайных величин
- •7.6. Статистическая проверка гипотез. Статистическая гипотеза. Нулевая и конкурирующая гипотеза. Статистический критерий. Критическая область
- •7.7. Проверка гипотезы о значимости выборочного коэффициента корреляции
- •7.8. Проверка гипотезы о распределении генеральной совокупности. Критерий 2 Пирсона
- •7.10. Сравнение генеральных средних двух нормально распределенных случайных величин (малые независимые выборки)
- •7.11. Сравнение двух дисперсий нормальных генеральных совокупностей
- •7.12. Сравнение наблюдаемой относительной частоты с гипотетической вероятностью наступления события
- •Вопросы для самопроверки
- •8. Варианты контрольной paбoты № 1 по теории вероятностей вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •9. Варианты контрольной работы № 2 по случайным процессам и математической статистике вариант 1
- •Вариант 2
- •Вариант 3
- •Вариант 4
- •Вариант 5
- •Вариант 6
- •Вариант 7
- •Вариант 8
- •Вариант 9
- •Вариант 10
- •Приложение
- •Суммарные вероятности для распределения Пуассона
- •Критические точки распределения Стьюдента
- •Библиографический список
7.5. Нахождение оценки для коэффициента корреляции двух случайных величин
Пусть над системой случайных величин (X, Y) произведено в одинаковых условиях n независимых опытов. Результаты опытов:
(7.5.1)
являются независимыми системами случайных величин, математические ожидания, дисперсии и корреляционные моменты которых одинаковы, т.е.
.
Требуется на основании статистических данных (7.5.1) найти оценки этих числовых характеристик системы.
Для
математических ожиданий и дисперсий
компонент системы
имеем известные формулы для их оценок:
.
(7.5.2)
Так
как корреляционный момент равен
,
будем искать оценку для него
в виде
(7.5.3)
причем
в силу равноточности измерений
.
Неизвестный коэффициент
определяется из условия несмещенности
оценки (7.5.3):
.
После преобразования выражений, стоящих под знаком суммы, получим несмещенную, состоятельную оценку для корреляционного момента
(7.5.4)
Выборочный коэффициент корреляции определяется по формуле
. (7.5.5)
Вместо формул (7.5.4) и (7.5.5) для выборочного коэффициента корреляции полезно иметь расчетные формулы, использующие статистические данные (7.5.1).
Имеем
Таким образом, для выборочного коэффициента корреляции имеем следующую формулу:
. (7.5.6)
Если
использовать вместо “исправленных”
выборочных дисперсий
и
выборочные дисперсии
и
,
то с использованием формулы их связи
вместо формулы (7.5.6) получим:
. (7.5.7)
Если использовать сгруппированные статистические данные, несложно получить вместо (7.5.7) для выборочного коэффициента корреляции следующую расчетную формулу:
. (7.5.8)
Выборочный
коэффициент корреляции
является оценкой коэффициента корреляции
.
Задача 7.5.1. Используя данные задачи 7.4.1, найти выборочный коэффициент корреляции.
Решение.
По
полученным данным вспомогательной
таблицы решения задачи 7.4.1, найдем
сначала выборочные средние
,
а также выборочные дисперсии
:
.
Используя
формулу (7.5.7), имеем
.
7.6. Статистическая проверка гипотез. Статистическая гипотеза. Нулевая и конкурирующая гипотеза. Статистический критерий. Критическая область
При исследовании случайной величины X на основании статистических данных довольно часто необходимо знать закон распределения генеральной совокупности или, если закон распределения известен, его параметры. В этих случаях выдвигают гипотезы о виде предполагаемого распределения или о предполагаемой величине параметра известного распределения.
Статистической
называют гипотезу о виде неизвестного
распределения или о параметрах известных
распределений. Нулевой
(основной) называют выдвинутую гипотезу
.
Конкурирующей
(альтернативной)
называют гипотезу
,
которая противоречит основной.
Например,
если нулевая гипотеза состоит в
предположении, что математическое
ожидание
нормального распределения равна 5, то
конкурирующая гипотеза состоит в
предположении, что
.
Кратко это записывают так:
;
.
Проверку выдвинутой гипотезы осуществляют статистическими методами, поэтому ее называют статистической проверкой гипотез. В итоге статистической проверки гипотезы может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов:
1) ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза;
2) ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Правильное решение может быть принято также в двух случаях:
1) гипотеза принимается, причем она и в действительности правильная;
2) гипотеза отвергается, причем она и в действительности неверна.
Вероятность
совершить ошибку первого рода (отвергнуть
правильную гипотезу) принято обозначать
через
;
ее называют уровнем
значимости.
Наиболее часто уровень значимости
принимают равным 0,05 или 0,01. Если, например,
принят уровень значимости 0,01, то это
значит, что имеется риск отвергнуть
правильную гипотезу в одном случае из
ста.
Статистическим
критерием
(или просто критерием) называют случайную
величину
,
которая служит для проверки нулевой
гипотезы. Часто критерием служит
случайная величина, распределенная по
закону
2
или закону Стьюдента.
Наблюдаемым значением наб называют значение критерия, вычисленное по выборке, т.е. получают частное (наблюдаемое) значение критерия, вычисленное с помощью частных значений, входящих в критерий величин. После установления множество его значений разбивается на два пересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, другое – при которых она принимается.
Критической областью называют множество значений критерия, при которых нулевую гипотезу отвергают.
Областью допустимых значений (область принятия гипотезы) называют множество значений критерия, при которых нулевую гипотезу принимают.
Идея метода статистических гипотез состоит в следующем: если наблюдаемое значение критерия принадлежит критической области – нулевую гипотезу отвергают; если наблюдаемое значение принадлежит области допустимых значений – нулевую гипотезу принимают.
Критическая область и область принятия гипотезы представляют собой интервалы, поэтому существуют точки, которые их разделяют.
Критическими
точками
кр
называют точки, разделяющие критическую
область и область принятия гипотезы.
Различают односторонние критические области (правосторонние и левосторонние) и двусторонние.
Правосторонней
называют критическую область, определяемую
неравенством
кр,
где
кр
> 0 (рис. 7.6.1, а).
Л
Рис. 7.6.1
кр,
где
кр
< 0 (рис. 7.6.1,b).
Двусторонней
называют
критическую область, определяемую
неравенствами
,
где
.
В частности, если критические точки
симметричны, двусторонняя критическая
область определяется неравенствами
кр,
кр
или
кр
(рис. 7.6.1, c).
Нахождение правосторонней критической области
Как
известно, правосторонняя критическая
область определяется неравенством
кр.
Для нахождения критической точки
кр
задаем достаточно малую вероятность –
уровень значимости
.
Затем находим критическую точку исходя
из требования, чтобы при условии
справедливости нулевой гипотезы
вероятность того, что
кр.,
была равна
кр
=
.
(7.6.1)
Обоснование
равенства (7.6.1) заключается в следующем:
так как вероятность события
кр
мала (
–
малая вероятность), то при справедливости
нулевой гипотезы это событие не должно
наступить в единичном испытании; если
же оно произошло, т.е. наблюдаемое
значение критерия оказалось больше
кр,
то это можно объяснить тем, что нулевая
гипотеза ложна и должна быть отвергнута.
С другой стороны, наблюдаемое значение
может оказаться большим
кр
не потому, что нулевая гипотеза ложна,
а по другим причинам (малый объем выборки,
недостатки методики эксперимента и
др.). В этом случае, отвергнув нулевую
гипотезу совершают ошибку первого рода.
Вероятность этой ошибки равна уровню
значимости
.
Критическая точка кр находится по таблицам критических точек распределения критерия и заданному уровню значимости .
Если критическая точка кр уже найдена, по данным выборки вычисляют наблюдаемое значение критерия наб и, если окажется, что наб > кр - нулевую гипотезу отвергают; если же наб < кр – нет оснований отвергать нулевую гипотезу.
Нахождение левосторонней критической области
Левосторонняя критическая область определяется неравенством < кр( кр<0). Критическую точку кр находят исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий примет значение, меньшее кр, была равна принятому уровню значимости :
кр
.
(7.6.2)
Если
наб
кр
–
нулевая гипотеза отвергается, если
наб
> kкр
–
нет оснований отвергать нулевую гипотезу.
Нахождение двусторонней критической области
Двусторонняя
критическая область определяется
неравенствами
(
).
Задаем уровень значимости
.
Критические точки
и
находят исходя из требования, чтобы при
справедливости нулевой гипотезы
выполнялось равенство
.
(7.6.3)
Ясно,
что критические точки
и
могут быть выбраны бесконечным числом
способов. Если распределение
является симметричным относительно
,
выбирают симметричные критические
точки:
кр,
кр,
(
кр
> 0). В этом случае
кр)
кр),
и поэтому
кр)
.
(7.6.4)
Из
соотношения (7.6.4) определяют
кр.
После ее нахождения находят
наб
и, если
наб
кр
– нулевую гипотезу отвергают; если
наб
кр
– нет оснований отвергать нулевую
гипотезу.