- •1. Алгебра событий
- •2. Классическая вероятность. Её свойства.
- •4. Теоремы сложения, умножения вероятностей.
- •5. Формула полной вероятности, формула Байеса.
- •6. Повторные испытания. Формула Бернулли.
- •8. Дискретные случайные величины. Ряд распределения. Функция распределения, её свойства.
- •2.2. Функция распределения вероятностей
- •1. Математическое ожидание непрерывной
- •2. Дисперсия непрерывной случайной величины.
- •12. Нормальное распределение, правило трёх сигм.
- •14 Система непрерывных св, функция плотности совместного распределения, её свойства.
- •15. Зависимые и независимые св, условные законы распределения, условные числовые характеристики.
- •17. Выборка, вариационные ряды и интервальные ряды, полигон и гистограмма.
- •3.2. Построение интервального вариационного ряда распределения
3.2. Построение интервального вариационного ряда распределения
При большом числе наблюдений (n ≥ 20) выборка перестает быть удобной формой записи – она становится слишком громоздкой и мало наглядной. Поэтому первичные данные (выборка) нуждаются в обработке, которая всегда начинается с их группировки. Рассмотрим группировку на конкретном примере. В таблице 3.2. приведены данные выручки магазина (тыс. руб.) за 90 дней. Таблица 3.2 Выручка магазина, тыс. руб.
24,9 |
32,2 |
26,3 |
39,9 |
26,1 |
33 |
24,1 |
35,6 |
26,1 |
35,4 |
42 |
34,3 |
39,5 |
29,4 |
38,1 |
29,3 |
30,1 |
26,2 |
30,9 |
21,8 |
41,1 |
23 |
34,2 |
25 |
28,9 |
22,7 |
30,2 |
30,8 |
23,1 |
30,7 |
39,1 |
36,1 |
26,4 |
35,8 |
18,1 |
33,1 |
22,1 |
30,3 |
22,2 |
29,1 |
38,4 |
20,7 |
30,4 |
31,1 |
32,3 |
27,1 |
31,1 |
22,9 |
53,6 |
26,5 |
26,1 |
29,3 |
29,9 |
30,2 |
35,8 |
25,1 |
27,1 |
19,9 |
29,1 |
32,3 |
41,7 |
36,2 |
25,9 |
32,2 |
44,8 |
33,1 |
48 |
33,7 |
17,9 |
33,8 |
45 |
31,6 |
32,1 |
22,7 |
31,5 |
28 |
19,4 |
28 |
26,5 |
26,6 |
38,6 |
27 |
37,9 |
36,3 |
27,8 |
35 |
31,8 |
22 |
32,5 |
27,4 |
Построение интервального вариационного
ряда распределения включает следующие
этапы:
1. Определение
среди имеющихся наблюдений (табл. 4.2)
минимального хmin и
максимального хmax значений
признака. В данном примере это будутхmin =
17,9 и хmax =
53,6.
2. Определение размаха
варьирования признака R = хmax – х min =
35,7.
3. Определение длины
интервала по формуле Стерджеса
,
где n –
объем выборки.
В данном
примере h =
35,7/8=4,45=4,5 (ссм).
4.
Определение граничных значений интервалов
(аi – bi).
За нижнюю границу первого интервала
рекомендуется брать величину,
равную а1 = хmin – h/2.
Верхняя граница первого интервала b1 = a1 + h.
Тогда, если bi –
верхняя граница i-го
интервала (причем аi+1 = bi),
то b 2 = a2 +h, b3 = a3 + h и
т.д. Построение интервалов продолжается
до тех пор, пока начало следующего по
порядку интервала не будет равно или
больше хmax.
В примере граничные значения
составляют:
а1 =
17,9 – 0,5∙4,5 = 15,7; b1 =
20,2;
a2 =
20,2; b2 и
т.д. =
24,7
Границы последовательных
интервалов запишем в первой графе табл.
4.3.
5.
Сгруппируем результаты наблюдений.
Просматриваем статистические данные
в том порядке, в каком они записаны в
табл. 3.2, и значения признака разносим
по соответствующим интервалам, обозначая
их черточками: | | , | | |, | | | | | , | | | | |, | | |
| | | | | (по одной для каждого наблюдения).
Так как граничные значения признака
могут совпадать с границами интервалов,
то условимся в каждый интервал включать
варианты, большие, чем нижняя граница
интервала (хi > ai),
и меньшие или равные верхней границе
(хi ≤ bi).
Общее количество штрихов, отмеченных
в интервале (табл. 3.3, гр. 3), даст его
частоту (табл. 3.3., гр. 4). В результате
получим интервальный статистический
ряд распределения частот (табл. 3.3., гр.2
и 4).
Таблица 3.3
Интервальный ряд распределения выручки
магазина
№ |
Интервалы ai–bi |
Подсчет частот |
Частота ni |
Накопленная частота nн i |
1 |
15,7 – 20,2 |
| | | | |
4 |
4 |
2 |
20,2 – 24,7 |
| | | | | | | | | | | | |
11 |
15 |
3 |
24,7 – 29,2 |
| | | | | | | | | | | | | | | | | | | | | | | |
23 |
38 |
4 |
29,2 – 33,7 |
| | | | | | | | | | | | | | | | | | | | | | | | | | | |
27 |
65 |
5 |
33,7 – 38,2 |
| | | | | | | | | | | | | |
13 |
78 |
6 |
38,2 – 42,7 |
| | | | | | | | |
8 |
86 |
7 |
42,7 – 47,2 |
| | |
2 |
88 |
8 |
47,2 – 51,7 |
| |
1 |
89 |
9 |
51,7 – 56,2 |
| |
1 |
90 |
Число интервалов обычно берут равным от 7 до 15 в зависимости от числа наблюдений и точности измерений с таким расчетом, чтобы интервалы были достаточно наполнены частотами. Однако приближенно число интервалов можно оценить исходя только из объема выборки с помощью таблицы 3.4. Если получают интервалы с нулевыми частотами, то нужно увеличить ширину интервалов (особенно в середине интервального ряда). Таблица 3.4 Выбор числа интервалов группировки
Объем выборки, n |
30 – 50 |
50 – 100 |
100 – 400 |
400 – 1000 |
1000 – 2000 |
Число интервалов |
4 – 6 |
6 – 8 |
8 – 9 |
9 – 11 |
11 – 12 |
Полигон чаще всего используют для изображения дискретных рядов. Для построения полигона в прямоугольной системе координат на оси абсцисс в произвольно выбранном масштабе откладывают значения аргумента, т. е. варианты, а на оси ординат также в произвольно выбранном масштабе - значения частот или относительных частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность, и чтобы рисунок имел желательный размер. Далее в этой системе координат строят точки, координатами которых являются пары соответствующих чисел из вариационного ряда. Полученные точки последовательно соединяют отрезками прямой. Крайнюю "левую" точку соединяют с точкой оси абсцисс, абсцисса которой находится слева от рассматриваемой точки на таком же расстоянии, как абсцисса ближайшей справа точки. Аналогично крайнюю "правую" точку также соединяют с точкой оси абсцисс.
способ графическогопредставления табличных данных.
Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны. Чаще всего для удобства восприятия ширину прямоугольников берут одинаковую, при этом их высота определяет соотношения отображаемого параметра.
Таким образом, гистограмма представляет собой графическое изображение зависимости частоты попадания элементов выборки от соответствующего интервала группировки.
Вариационным рядом называется последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются.
Интервальным вариационным рядом называется упорядоченная совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частостями попаданий в каждый из них значений величины. Интервальные ряды предназначены для анализа распределения непрерывно изменяющегося признака, значение которого чаще всего регистрируется путем измерения или взвешивания. Варианты такого ряда – это группировка.
