- •Бийский технологический институт (филиал)
- •Теория вероятностей и математическая статистика
- •Введение
- •События. Классификация событий. Классическое определение вероятности
- •Статистическое определение вероятности
- •Геометрическая вероятность
- •Контрольные вопросы
- •Контрольные задания
- •4. Операции над событиями. Соотношения между событиями
- •5.Теорема сложения вероятностей
- •6. Теорема умножения вероятностей
- •Контрольные вопросы
- •Контрольные задания
- •7. Формула полной вероятности
- •8. Теорема гипотез (формула Бейеса)
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •9. Повторение опытов. Формула Бернулли
- •10. Локальная формула Муавра-Лапласа. Формула Пуассона
- •11. Интегральная формула Муавра-Лапласа. Вероятность отклонения частоты события от его вероятности в n независимых испытаниях
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •12. Понятие случайной величины. Ряд распределения. Многоугольник распределения
- •13. Функция распределения. Вероятность попадания непрерывной случайной величины в заданный интервал
- •Контрольные вопросы
- •Контрольные задания
- •14. Плотность распределения
- •Контрольные вопросы
- •Контрольные задания
- •15. Числовые характеристики случайных величин. Математическое ожидание и его свойства
- •Свойства математического ожидания
- •16. Дисперсия и ее свойства. Среднее квадратическое отклонение
- •17. Моменты распределения случайной величины
- •Контрольные вопросы
- •Контрольные задания
- •18. Типы распределений дискретных случайных величин
- •Биномиальное распределение
- •18.2 Гипергеометрическое распределение
- •18.3 Геометрическое распределение
- •4. Распределение Пуассона
- •Контрольные вопросы
- •Контрольные задания
- •19. Типы распределений непрерывных случайных величин
- •19.1 Равномерное распределение
- •19.2 Показательное распределение
- •20. Нормальный закон распределения
- •21. Вероятность попадания нормально распределенной случайной величины в заданный интервал. Правило трёх сигма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •22. Понятие системы случайных величин
- •23. Закон распределения вероятностей дискретной двумерной случайной величины
- •Контрольные вопросы
- •24. Функция распределения двух случайных величин. Вероятность попадания случайной величины в полуполосу и прямоугольник
- •25. Плотность распределения системы двух случайных величин. Законы распределения отдельных величин, входящих в систему
- •26. Условные законы распределения
- •Контрольные вопросы
- •27. Зависимые и независимые случайные величины
- •28. Числовые характеристики составляющих системы двух случайных величин. Условное математическое ожидание
- •29. Корреляционный момент. Коэффициент корреляции
- •30. Коррелированность и зависимость случайных величин
- •Если величины независимы, то они некоррелированы.
- •31. Линейная регрессия. Прямые линии среднеквадратической регрессии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •32. Закон больших чисел
- •33. Центральная предельная теорема
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Математическая статистика
- •34. Понятие о выборочном методе. Генеральная и выборочная совокупность
- •35. Статистические данные и их представление
- •36. Статистические аналоги теоретических законов распределения
- •36.1 Эмпирическая функция распределения
- •36.2 Полигон и гистограмма
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •37. Точечное оценивание параметров распределения
- •38. Свойства статистических оценок
- •Контрольные вопросы
- •Контрольные задания
- •39. Интервальное оценивание параметров распределения
- •40. Интервальное оценивание параметров нормального распределения
- •40.1 Интервальная оценка математического ожидания нормального распределения при известной дисперсии
- •40.2 Интервальная оценка математического ожидания нормального распределения при неизвестной дисперсии
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •41. Статистические гипотезы
- •42. Критерии проверки гипотез
- •Контрольные вопросы
- •Контрольные задания
- •43.Критерий согласия Пирсона «Хи-квадрат» ( )
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •44. Элементы теории корреляции. Задачи корреляционного анализа
- •45. Выбор формы зависимости между переменными. Метод наименьших квадратов
- •Контрольные вопросы
- •46. Коэффициент корреляции и проверка его значимости. Линейная регрессия и прогноз
- •Контрольные вопросы
- •Контрольные задания
- •Литература
- •Глоссарий
36. Статистические аналоги теоретических законов распределения
36.1 Эмпирическая функция распределения
Из теории вероятностей известно, что одной из форм закона распределения случайной величины Х (случайного признака Х) является ее функция распределения . Определим выборочный (статистический) аналог функции .
Эмпирической функцией распределения называется функция
,
где - число элементов выборки , значения которых меньше х.
В отличие от эмпирической (построенной по эмпирическим или выборочным данным) функции функцию называют теоретической (или генеральной) функцией распределения.
Построение эмпирической функции распределения удобно производить с помощью группированных данных, представленных статистическим рядом (дискретным или интервальным). Функция постоянна на промежутках (при i = 1, 2, …, k) для дискретно группированных данных или на промежутках для интервально группированных данных, а в концевых точках увеличивается на относительную частоту , i = 1, 2, …, k−1:
Эмпирическая функция распределения определена однозначно для всех х ( ) и обладает всеми свойствами функции распределения: изменяется от 0 до 1, не убывает и непрерывна слева. Она играет фундаментальную роль в математической статистике. Важнейшее ее свойство состоит в том, что при увеличении числа наблюдений n над признаком Х происходит сближение эмпирической функции с теоретической функцией распределения , т.е.
при любом сколь угодно малом .
Задача. По данным задачи п.35 построить эмпирическую функцию распределения.
Решение. Значения функции распределения приведены ниже.
№ п/п |
Границы интервала |
Частота |
Относительная частота |
Функция |
|
левая |
правая |
||||
1 |
−∞ |
1 |
0 |
0 |
0 |
2 |
1 |
2 |
4 |
0,04 |
0,04 |
3 |
2 |
3 |
6 |
0,06 |
0,10 |
4 |
3 |
4 |
12 |
0,12 |
0,22 |
5 |
4 |
5 |
16 |
0,16 |
0,38 |
6 |
5 |
6 |
44 |
0,44 |
0,82 |
7 |
6 |
+∞ |
18 |
0,18 |
1 |
36.2 Полигон и гистограмма
Для наглядного представления выборочных данных применяются полигон и гистограмма.
Полигон обычно используют для изображения дискретного статистического ряда. Для его построения на оси абсцисс откладывают все различные выборочные данные . На оси ординат откладывают либо частоты , либо относительные частоты . Затем отмечают точки с координатами или при i = 1, 2, …, k, и соединяют соседние точки отрезками прямой. Полученная таким образом ломаная называется полигоном частот или полигоном относительных частот. В силу закона больших чисел в схеме Бернулли относительные частоты сходятся к вероятностям при i = 1, 2, …, k. Поэтому полигон относительных частот является статистическим аналогом многоугольника распределения.
Кроме того, что полигон частот обеспечивает наглядность представления дискретного статистического ряда, он позволяет сравнивать визуально и делать предположение о близости распределения исследуемого признака к тому или иному закону распределения.
Задача. Построить полигон относительных частот тарифного разряда по данным задачи из п. 35.
Решение. Полигон относительных частот представлен ниже.
Гистограмма относительных частот – графическое изображение интервального статистического ряда в виде ступенчатой фигуры, составленной из прямоугольников различной высоты. Основаниями прямоугольников являются интервалы (при i = 1, 2, …, k) оси абсцисс, соответствующие интервалам группировки, а высоты соответствуют относительным частотам интервалов.
Использование гистограммы для статистического анализа, кроме наглядности представления данных, основано на том факте, что при достаточно большом объеме выборки n и малых значениях длин интервалов группировки h гистограмма относительных частот близка к плотности распределения исследуемого признака Х.
Задача. Построить гистограмму относительных частот статистического интервального распределения
Интервал группировки |
|
|
|
|
|
|
|
Частота |
4 |
6 |
16 |
36 |
24 |
10 |
4 |
Решение. Для построения гистограммы составим таблицу:
№ п/п |
Границы интервала |
Частота |
Относительная частота |
|
|
левая |
правая |
||||
1 |
5 |
10 |
4 |
0,04 |
0,008 |
2 |
10 |
15 |
6 |
0,06 |
0,012 |
3 |
15 |
20 |
16 |
0,16 |
0,032 |
4 |
20 |
25 |
36 |
0,36 |
0,072 |
5 |
25 |
30 |
24 |
0,24 |
0,048 |
6 |
30 |
35 |
10 |
0,1 |
0,02 |
7 |
35 |
40 |
4 |
0,04 |
0,008 |
Гистограмма данного интервального распределения представлена ниже.
0,072
0,048
0,032 0,02 0,012 0,008
5 10 15 20 25
30 35 40 х