
- •Глава 3. Описательная статистика
- •3.1. Случайные выборки и их описание
- •3.2. Оценка статистических параметров
- •3.2.1. Основные распределения статистических
- •3.2.2. Свойства статистических оценок
- •Оценка называется состоятельной, если
- •3.2.3. Определение точечных оценок
- •3.3. Построение доверительных интервалов
- •3.3.1. Построение доверительных интервалов
- •Методика определения доверительного интервала для математического ожидания сводится к следующему:
- •3.3.2. Построение доверительных интервалов
- •3.4. Формирование выборки
- •Приведем краткую классификацию отбора.
- •3.5. Построение гистограммы
- •Глава 4. Статистическая проверка гипотез
- •4.1. Проверка гипотезы об однородности двух или нескольких анализируемых совокупностей
- •4.2. Проверка гипотез о распределении
- •Решение. Результаты расчета включают:
- •4.2.2. Критерий однородности Смирнова
- •Задания для самостоятельной работы
- •4.3. Проверка гипотезы об однородности
- •4.3.1. Критерий Стьюдента (t-критерий)
- •В качестве критической статистики используется величина
- •Здесь tq, (n–1) – 100 % -я точка распределения Стьюдента с (n- 1) степенями свободы.
- •Решение
- •Задания для самостоятельной работы
- •4.3.2. Критерий Фишера (f-критерий)
- •4.3.3. Критерий Уилкоксона
- •Здесь критическая область примет вид {uUл(q,m,n)}.
- •4.3.5. Критерий знаков
3.5. Построение гистограммы
Пусть
имеется набор экспериментальных данных
.
Обработку данных можно производить в
такой последовательности:
1. Построение вариационного ряда.
Вариационный ряд
получают из исходных данных путем
расположения
в порядке возрастания отxmin
доxmax
так, чтобы
2. Построение гистограммы выборки.
Гистограмма является оценкой плотности распределения f(x).При обработке выборок большого объема используют метод сгруппированных данных. При этом выборка объемаnпреобразуется в статистический ряд. Для этого весь диапазон изменения случайной величины делится наk равных интервалов. Количество интерваловkопределяется с помощью оценочной формулы
k = 1+3.32 lg n |
(3.35) |
с округлением до ближайшего целого значения.
Длина интервала
|
(3.36) |
Отмечают крайние
точки интервалов
,
а также их середины
.
Затем подсчитывают
количество наблюдений
,
попавших в каждый интервал
,
где
и
границыi-го
интервала.
Зная
,
можно определить относительную частоту
(табл.3.1). На основе полученных значений
для всех интервалов строят гистограмму
эмпирического или выборочного
распределения
,
а по ней функцию
(рис.3.1). График
получается в результате сглаживания
эмпирической функции распределения
.
Таблица 3.1. Обработка выборки экспериментальных данных
Номер интервала |
Границы интервалов |
Среднее в интервале |
|
| |
левая |
правая | ||||
1 |
|
|
|
|
|
2 |
|
|
|
|
|
... |
... |
... |
... |
… |
... |
k |
|
|
|
|
|
-
а)
б)
Рис.3.1. Гистограмма (а), эмпирическая функция распределения (б)
Пример 3.6. Исследуем выручку в магазине как непрерывную случайную величину. Исходные данные выручки получены при ее ежедневной регистрации, данная выборка длинойn = 100приведена в табл. 3.2.
Таблица 3.2. Исходные данные к примеру 3.6
4,3 |
4,7 |
3,7 |
3,6 |
3,7 |
2,8 |
3,5 |
3,8 |
4,3 |
3,3 |
3,8 |
3,7 |
4,6 |
3,5 |
3,3 |
4,0 |
4,3 |
3,7 |
3,9 |
3,4 |
3,9 |
3,6 |
4,0 |
4,1 |
4,2 |
4,1 |
4,3 |
4,4 |
4,1 |
4,3 |
3,7 |
4,1 |
4,0 |
3,5 |
3,9 |
5,0 |
3,6 |
4,2 |
4,2 |
4,0 |
3,9 |
3,9 |
4,8 |
5,0 |
4,3 |
3,2 |
4,4 |
2,3 |
4,1 |
4,0 |
2,9 |
3,9 |
1,2 |
3,9 |
3,7 |
3,2 |
4,3 |
5,0 |
3,9 |
4,1 |
3,9 |
4,8 |
4,2 |
3,2 |
3,8 |
2,8 |
3,9 |
4,1 |
3,3 |
2,1 |
3,3 |
4,0 |
3,9 |
3,8 |
4,1 |
4,6 |
3,2 |
3,4 |
5,0 |
3,9 |
4,1 |
3,9 |
4,3 |
4,5 |
3,8 |
5,0 |
4,5 |
4,2 |
4,8 |
3,5 |
4,3 |
4,9 |
4,0 |
3,8 |
4,1 |
3,8 |
4,4 |
3,4 |
4,5 |
2,5 |
Решение.
1. Преобразуем исходные данные в вариационный ряд (табл.3.3).
Таблица 3.3. Преобразованные данные
1,2 |
3,2 |
3,5 |
3,7 |
3,9 |
3,9 |
4,1 |
4,2 |
4,3 |
4,7 |
2,1 |
3,3 |
3,5 |
3,8 |
3,9 |
4,0 |
4,1 |
4,2 |
4,3 |
4,8 |
2,3 |
3,3 |
3,6 |
3,8 |
3,9 |
4,0 |
4,1 |
4,2 |
4,4 |
4,8 |
2,5 |
3,3 |
3,6 |
3,8 |
3,9 |
4,0 |
4,1 |
4,3 |
4,4 |
4,8 |
2,8 |
3,3 |
3,6 |
3,8 |
3,9 |
4,0 |
4,1 |
4,3 |
4,4 |
4,9 |
2,8 |
3,4 |
3,7 |
3,8 |
3,9 |
4,0 |
4,1 |
4,3 |
4,5 |
5,0 |
2,9 |
3,4 |
3,7 |
3,8 |
3,9 |
4,0 |
4,1 |
4,3 |
4,5 |
5,0 |
3,2 |
3,4 |
3,7 |
3,8 |
3,9 |
4,0 |
4,1 |
4,3 |
4,5 |
5,0 |
3,2 |
3,5 |
3,7 |
3,9 |
3,9 |
4,1 |
4,2 |
4,3 |
4,6 |
5,0 |
3,2 |
3,5 |
3,7 |
3,9 |
3,9 |
4,1 |
4,2 |
4,3 |
4,6 |
5,0 |
2. Определим основные характеристики ряда:
выборочное среднее по формуле (3.9)
|
|
выборочную дисперсию по формуле (3.10)
|
|
среднеквадратичное отклонение s=0,63.
3. Определим число интервалов при n = 100 по формуле (3.35):
k = 1+3,32lg n=7,64.
Округлим до ближайшего целого значения, получим k = 8и
вычислим длину интервала:
.
4. Рассчитаем частоту попадания в интервалы (табл. 3.4).
Таблица 3.4. Результаты расчета примера 3.6
Номер интервала |
Границы интервалов |
Среднее в интервале |
|
| |
левая |
правая | ||||
1 |
1,2 |
1,68 |
1,44 |
0,01 |
0,01 |
2 |
1,68 |
2,16 |
1,92 |
0,01 |
0,02 |
3 |
2,16 |
2,64 |
2,4 |
0,02 |
0,04 |
4 |
2,64 |
3,12 |
2,88 |
0,03 |
0,07 |
5 |
3,12 |
3,6 |
3,36 |
0,15 |
0,22 |
6 |
3,6 |
4,08 |
3,84 |
0,36 |
0,58 |
7 |
4,08 |
4,56 |
4,32 |
0,3 |
0,88 |
8 |
4,56 |
5,04 |
4,8 |
0,12 |
1 |
5. Построим гистограмму и функцию распределения (рис. 3.2)
0,5 1
0,4 0,8
0,3 0,6
0,2 0,4
0,1 0,2
i i
0
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
-
а)
б)
Рис.3.2. Гистограмма (а) и эмпирическая функция распределения (б) для примера 3.6
Задания для самостоятельной работы
Самостоятельно сгенерируйте выборку числа реализованного со склада товара за день в течение квартала. Постройте вариационный ряд и гистограмму реализации товара.
2. Сформулируйте статистическую задачу, когда необходимо построение гистограммы, сгенерируйте исходные данные, решите задачу.