- •Бийский технологический институт (филиал)
- •Теория вероятностей и математическая статистика
- •Введение
- •События. Классификация событий. Классическое определение вероятности
- •Статистическое определение вероятности
- •Геометрическая вероятность
- •Контрольные вопросы
- •Контрольные задания
- •4. Операции над событиями. Соотношения между событиями
- •5.Теорема сложения вероятностей
- •6. Теорема умножения вероятностей
- •Контрольные вопросы
- •Контрольные задания
- •7. Формула полной вероятности
- •8. Теорема гипотез (формула Бейеса)
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •9. Повторение опытов. Формула Бернулли
- •10. Локальная формула Муавра-Лапласа. Формула Пуассона
- •11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- •13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- •Контрольные вопросы
- •Контрольные задания
- •14. Плотность распределения
- •Контрольные вопросы
- •Контрольные задания
- •15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- •Свойства математического ожидания
- •16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- •17. Моменты распределения случайной величины
- •Контрольные вопросы
- •Контрольные задания
- •18. Типы распределений дискретных случайных величин
- •Биномиальное распределение
- •18.2 Гипергеометрическое распределение
- •18.3 Геометрическое распределение
- •4. Распределение Пуассона
- •Контрольные вопросы
- •Контрольные задания
- •19. Типы распределений непрерывных случайных величин
- •19.1 Равномерное распределение
- •19.2 Показательное распределение
- •20. Нормальный закон распределения
- •21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •22. Понятие системы случайных величин
- •23. Закон распределения вероятностей дискретной двумерной случайной величины
- •Контрольные вопросы
- •24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- •25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- •26. Условные законы распределения
- •Контрольные вопросы
- •27. Зависимые и независимые случайные величины
- •28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- •29. Корреляционный момент. Коэффициент корреляции
- •30. Коррелированность и зависимость случайных величин
- •Если величины независимы, то они некоррелированы.
- •31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •32. Закон больших чисел
- •33. Центральная предельная теорема
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Математическая статистика
- •34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- •35. Статистические данные и их представление
- •36. Статистические аналоги теоретических законов распределения
- •36.1 Эмпирическая функция распределения
- •36.2 Полигон и гистограмма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •37. Точечное оценивание параметров распределения
- •38. Свойства статистических оценок
- •Контрольные вопросы
- •Контрольные задания
- •39. Интервальное оценивание параметров распределения
- •40. Интервальное оценивание параметров нормального распределения
- •40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- •40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •41. Статистические гипотезы
- •42. Критерии проверки гипотез
- •Контрольные вопросы
- •Контрольные задания
- •43.Критерий согласия Пирсона «Хи-квадрат» ( )
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •44. Элементы теории корреляции. Задачи корреляционного анализа
- •45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- •Контрольные вопросы
- •46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Глоссарий
36. Статистические аналоги теоретических законов распределения
36.1 Эмпирическая функция распределения
Из теории вероятностей
известно, что одной из форм закона
распределения случайной величины Х
(случайного признака Х)
является ее функция распределения
.
Определим выборочный (статистический)
аналог функции
.
Эмпирической функцией распределения называется функция
,
где
- число элементов выборки
,
значения которых меньше х.
В отличие от
эмпирической (построенной по эмпирическим
или выборочным данным) функции
функцию
называют теоретической
(или генеральной)
функцией
распределения.
Построение
эмпирической функции распределения
удобно производить с помощью группированных
данных, представленных статистическим
рядом (дискретным или интервальным).
Функция
постоянна на промежутках
(при i
= 1, 2, …, k)
для дискретно
группированных данных или на промежутках
для интервально группированных данных,
а в концевых точках
увеличивается на относительную
частоту
,
i
= 1, 2, …, k−1:
Эмпирическая
функция распределения
определена однозначно для всех х
(
)
и обладает всеми свойствами функции
распределения: изменяется от 0 до 1, не
убывает и непрерывна слева. Она играет
фундаментальную роль в математической
статистике. Важнейшее ее свойство
состоит в том, что при увеличении числа
наблюдений n
над признаком Х
происходит сближение эмпирической
функции
с теоретической функцией распределения
,
т.е.
при любом сколь
угодно малом
.
Задача. По данным задачи п.35 построить эмпирическую функцию распределения.
Решение. Значения функции распределения приведены ниже.
№ п/п |
Границы интервала |
Частота |
Относительная частота |
Функция
|
|
левая |
правая |
||||
1 |
−∞ |
1 |
0 |
0 |
0 |
2 |
1 |
2 |
4 |
0,04 |
0,04 |
3 |
2 |
3 |
6 |
0,06 |
0,10 |
4 |
3 |
4 |
12 |
0,12 |
0,22 |
5 |
4 |
5 |
16 |
0,16 |
0,38 |
6 |
5 |
6 |
44 |
0,44 |
0,82 |
7 |
6 |
+∞ |
18 |
0,18 |
1 |
36.2 Полигон и гистограмма
Для наглядного представления выборочных данных применяются полигон и гистограмма.
Полигон обычно
используют для изображения дискретного
статистического ряда. Для его построения
на оси абсцисс откладывают все различные
выборочные данные
.
На оси ординат откладывают либо частоты
,
либо относительные частоты
.
Затем отмечают точки с координатами
или
при i
= 1, 2, …, k,
и соединяют соседние точки отрезками
прямой. Полученная таким образом ломаная
называется полигоном
частот или
полигоном
относительных частот.
В силу закона больших чисел в схеме
Бернулли относительные частоты
сходятся к вероятностям
при i
= 1, 2, …, k.
Поэтому полигон относительных частот
является статистическим аналогом
многоугольника распределения.
Кроме того, что полигон частот обеспечивает наглядность представления дискретного статистического ряда, он позволяет сравнивать визуально и делать предположение о близости распределения исследуемого признака к тому или иному закону распределения.
Задача. Построить полигон относительных частот тарифного разряда по данным задачи из п. 35.
Решение. Полигон относительных частот представлен ниже.
Гистограмма
относительных частот
– графическое изображение интервального
статистического ряда в виде ступенчатой
фигуры, составленной из прямоугольников
различной высоты. Основаниями
прямоугольников являются интервалы
(при i
= 1, 2, …, k)
оси абсцисс,
соответствующие интервалам группировки,
а высоты
соответствуют относительным частотам
интервалов.
Использование гистограммы для статистического анализа, кроме наглядности представления данных, основано на том факте, что при достаточно большом объеме выборки n и малых значениях длин интервалов группировки h гистограмма относительных частот близка к плотности распределения исследуемого признака Х.
Задача. Построить гистограмму относительных частот статистического интервального распределения
Интервал группировки |
|
|
|
|
|
|
|
Частота |
4 |
6 |
16 |
36 |
24 |
10 |
4 |
Решение. Для построения гистограммы составим таблицу:
№ п/п |
Границы интервала |
Частота |
Относительная частота |
|
|
левая |
правая |
||||
1 |
5 |
10 |
4 |
0,04 |
0,008 |
2 |
10 |
15 |
6 |
0,06 |
0,012 |
3 |
15 |
20 |
16 |
0,16 |
0,032 |
4 |
20 |
25 |
36 |
0,36 |
0,072 |
5 |
25 |
30 |
24 |
0,24 |
0,048 |
6 |
30 |
35 |
10 |
0,1 |
0,02 |
7 |
35 |
40 |
4 |
0,04 |
0,008 |
Гистограмма данного интервального распределения представлена ниже.
0,072
0,048
0,032 0,02 0,012 0,008
5 10 15 20 25
30 35 40 х
