- •Бийский технологический институт (филиал)
- •Теория вероятностей и математическая статистика
- •Введение
- •События. Классификация событий. Классическое определение вероятности
- •Статистическое определение вероятности
- •Геометрическая вероятность
- •Контрольные вопросы
- •Контрольные задания
- •4. Операции над событиями. Соотношения между событиями
- •5.Теорема сложения вероятностей
- •6. Теорема умножения вероятностей
- •Контрольные вопросы
- •Контрольные задания
- •7. Формула полной вероятности
- •8. Теорема гипотез (формула Бейеса)
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •9. Повторение опытов. Формула Бернулли
- •10. Локальная формула Муавра-Лапласа. Формула Пуассона
- •11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- •13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- •Контрольные вопросы
- •Контрольные задания
- •14. Плотность распределения
- •Контрольные вопросы
- •Контрольные задания
- •15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- •Свойства математического ожидания
- •16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- •17. Моменты распределения случайной величины
- •Контрольные вопросы
- •Контрольные задания
- •18. Типы распределений дискретных случайных величин
- •Биномиальное распределение
- •18.2 Гипергеометрическое распределение
- •18.3 Геометрическое распределение
- •4. Распределение Пуассона
- •Контрольные вопросы
- •Контрольные задания
- •19. Типы распределений непрерывных случайных величин
- •19.1 Равномерное распределение
- •19.2 Показательное распределение
- •20. Нормальный закон распределения
- •21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •22. Понятие системы случайных величин
- •23. Закон распределения вероятностей дискретной двумерной случайной величины
- •Контрольные вопросы
- •24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- •25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- •26. Условные законы распределения
- •Контрольные вопросы
- •27. Зависимые и независимые случайные величины
- •28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- •29. Корреляционный момент. Коэффициент корреляции
- •30. Коррелированность и зависимость случайных величин
- •Если величины независимы, то они некоррелированы.
- •31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •32. Закон больших чисел
- •33. Центральная предельная теорема
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Математическая статистика
- •34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- •35. Статистические данные и их представление
- •36. Статистические аналоги теоретических законов распределения
- •36.1 Эмпирическая функция распределения
- •36.2 Полигон и гистограмма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •37. Точечное оценивание параметров распределения
- •38. Свойства статистических оценок
- •Контрольные вопросы
- •Контрольные задания
- •39. Интервальное оценивание параметров распределения
- •40. Интервальное оценивание параметров нормального распределения
- •40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- •40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •41. Статистические гипотезы
- •42. Критерии проверки гипотез
- •Контрольные вопросы
- •Контрольные задания
- •43.Критерий согласия Пирсона «Хи-квадрат» ( )
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •44. Элементы теории корреляции. Задачи корреляционного анализа
- •45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- •Контрольные вопросы
- •46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Глоссарий
Контрольные вопросы
Сформулируйте определение понятия статистическая гипотеза.
Какие выводы делаются при проверке статистических гипотез?
Какую гипотезу называют: а) нулевой; б) конкурирующей; в) параметрической; г) простой; д) сложной?
Определите понятие ошибок 1-го рода и 2-города.
Можно ли одновременно уменьшить вероятности ошибок 1-го и 2-го рода?
Что называется статистическим критерием?
Что называется критической областью?
Что называется областью принятия гипотезы?
Дайте определение: а) правосторонней критической области; б) левосторонней критической области; в) двусторонней критической области.
Как определяются критические точки: а) правосторонней критической области; б) левосторонней критической области; в) двусторонней критической области?
В чем состоит схема проверки статистических гипотез?
Контрольные задания
Наблюдаемый объект может быть либо своим, либо объектом противника. Система обнаружения относит объект к одному из классов по результатам нескольких замеров определенных характеристик. Сформулируйте нулевую и альтернативную гипотезы, если в результате ошибки 1-го рода происходит пропуск цели. В чем состоит ошибка 2-го рода?
Если
и
,
то какие ошибки и как часто будем
совершать в результате статистической
проверки гипотезы?
43.Критерий согласия Пирсона «Хи-квадрат» ( )
На практике часто возникают задачи, связанные с тем, что вид закона распределения исследуемого признака – гипотетический и подлежит проверке. Если проводить графическое сравнение полигона или гистограммы частот с кривой распределения, то можно получить представление, по крайней мере с качественной стороны, о большей или меньшей близости теоретического и эмпирического распределений.
Предположим, что
выборка
извлечена из генеральной совокупности
с неизвестной теоретической функцией
распределения
,
относительно которой имеются две
непараметрические гипотезы: простая
основная Н0:
и сложная конкурирующая Н1:
,
где
- известная функция распределения. Иными
словами, мы хотим проверить, согласуются
ли исходные данные с нашим гипотетическим
предположением относительно теоретического
закона распределения или нет. Поэтому
критерий для проверки гипотез Н0
и Н1
называются критериями
согласия.
Существуют различные критерии согласия, например, критерий согласия Пирсона , критерий согласия Колмогорова. Приведем один из наиболее часто используемых критериев согласия – критерий согласия Пирсона .
Предположим, что
проверяется основная гипотеза Н0:
исследуемый признак Х
имеет распределение
,
против конкурирующей противоположной
гипотезы
при уровне значимости
.
Здесь
- функция распределения исследуемого
признака
Х,
известная с точностью до параметров
.
В силу взаимно
однозначного соответствия между
функцией распределения и рядом
(плотностью) распределения нулевая
гипотеза Н0
может быть сформулирована также в
терминах ряда (плотности) распределения.
Если основная гипотеза простая, т.е.
гипотетическое распределение исследуемого
признака основной гипотезой определяется
однозначно, то количество параметров
распределений, требуемых оценки по
выборке, m
= 0.
Проверка нулевой гипотезы Н0 против альтернативной при уровне значимости проводится по следующей схеме:
Исходя из выборочных данных, находят оценки
неизвестных
параметров распределения
.
Найденные оценки используются в
дальнейшем вместо неизвестных параметров
распределения.Вся область изменения признака Х разбивается на k непересекающихся интервалов
при i
= 1, 2, …, k.
Если признак Х
принимает значения на всей вещественной
оси, то полагаем
и правый конец
.
Если признак Х
принимает только положительные значения,
то полагаем
и правый конец
.
Подсчитываются далее величины
- количество выборочных данных, попавших
в i-тый
интервал
при i
= 1, 2, …, k.
Интервалы
выбирают обычно таким образом, чтобы
все
были не меньше
.
Очевидно,
− объем выборки.
Находятся теоретические вероятности
того, что исследуемый признак Х
примет какое–либо значение из промежутка
:
,
i
= 1, 2, …, k.
Если исследуемый признак дискретный, то
,
где суммирование
ведется по всем значениям индекса r,
для которых
,
i
= 1, 2, …, k.
Очевидно, должно
выполняться равенство
.
4. Вычисляется мера расхождения между теоретическим и эмпирическим распределением:
,
где
- эмпирические частоты признака Х,
- теоретические частоты,
- вероятности, рассчитанные по
предполагаемому теоретическому
распределению.
Для выбранного уровня значимости по таблице распределения находят критическое значение
при числе степеней свободы
,
где k
– число выборочных групп, m
- число параметров теоретического
распределения, определяемого по опытным
данным.Производится сравнение вычисленного по выборке значения с табличным значением
.
Если значения
<
,
то считается, что выборочные данные
согласуются с нулевой гипотезой Н0.
В противном
случае нулевая гипотеза Н0
отвергается,
она опровергается имеющимися данными
в пользу альтернативной.
Задача. Получено следующее распределение 100 рабочих цеха по выработке в отчетном году (в % к предыдущему году):
Выработка в отчетной году (в % к предыдущему году) |
|
|
|
|
|
|
Количество рабочих |
6 |
20 |
45 |
24 |
5 |
100 |
С помощью критерия согласия Пирсона проверить гипотезу о том, что выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения. Уровень значимости критерия принять равным 0,05.
Решение. Нулевая гипотеза Н0 состоит в том, что исследуемый признак Х – выработка на одного рабочего в отчетном году (в % к предыдущему) подчиняется нормальному закону распределения.
В качестве оценок
двух неизвестных параметров а
и
будут фигурировать соответствующие
выборочные характеристики:
и
.
Можно показать, что
.
Исследуемый признак принимает значения
на всей вещественной оси (в принципе,
но не в реальности!). Поэтому интервалы
разбиения таковы, что левый конец
и правый конец
.
Теоретические
вероятности
находятся по формуле
,
i
= 1, 2, … , k.
Необходимые для
этих вычислений значения функции
взяты из таблицы Приложения. Дальнейшие
выкладки сведены ниже в таблицу. При
этом объединены два последних интервала
группировки ввиду их малочисленности.
№ п/п |
Интервал группировки |
Частота |
|
Функция
|
Веро-ятность |
|
|
1 |
|
6 |
−∞ |
−0,5 |
0,053 |
5,3 |
0,092 |
2 |
|
20 |
−1,62 |
−0,447 |
0,238 |
23,8 |
0,636 |
3 |
|
45 |
−0,55 |
−0,209 |
0,404 |
40,4 |
0,524 |
4 |
|
24 |
0,51 |
0,195 |
0,248 |
24,8 |
0,026 |
5 |
|
5 |
1,57 |
0,442 |
0,057 |
5,7 |
0,11 |
7 |
− |
− |
+ ∞ |
0,5 |
− |
− |
− |
|
− |
100 |
− |
− |
1,00 |
100 |
|
Вычисленное
статистическое значение критерия
.
По количеству интервалов группировки
k
= 5, числу параметров нормального
распределения
найдем число степеней свободы 5 – 3 = 2.
Для заданного уровня значимости критерия
и числа степеней свободы, равного 2,
находим
.
Так как
,
то нулевая гипотеза о нормальности
распределения величины выработки
рабочего согласуется с имеющимися
данными.
