
- •Глава 6. Элементы математической статистики
- •6.1. Основы выборочного метода
- •6.1.1. Генеральная совокупность и выборка
- •6.1.2. Статистическое распределение выборки. Полигон. Гистограмма
- •6.1.2.1. Дискретный статистический ряд распределения.
- •6.2.2.2. Статистический интервальный ряд распределения
- •6.1.3. Выборочные характеристики распределения
- •6.1.3.1. Средние величины
- •6.1.3.2. Показатели вариации
- •6.1.3.3. Начальные и центральные моменты статистического ряда распределения
- •6.1.4. Оценки параметров генеральной совокупности по ее выборке
- •6.1.4.1. Точечные оценки основных числовых характеристик генеральной совокупности
- •6.1.4.2. Интервальные оценки основных числовых характеристик генеральной совокупности
- •6.1.4.3. Оценка вероятности (биномиального распределения) по относительной частоте
- •6.2. Проверка статистических гипотез
- •6.2.1. Статистическая гипотеза и общая схема ее проверки
- •6.2.2. Сравнение двух дисперсий нормальных генеральных совокупностей
- •6.2.3. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)
6.2.2.2. Статистический интервальный ряд распределения
Представление результатов наблюдений в виде статистического дискретного ряда распределения на практике удобно лишь в случае ограниченного количества (не более 10-20) различающихся между собой вариант в выборочной совокупности. Если же количество таких вариант существенно больше, то результаты представляют в виде интервального статистического ряда распределения.
Для построения такого ряда всю область наблюдаемых значений изучаемого признака Х разбивают на некоторое небольшое количество равных по величине интервалов (проводят их группировку) и фиксируют количество значений признака, принадлежащих каждому интервалу (частоту интервала).
Число интервалов k следует брать не очень большим, чтобы после группировки ряд не был громоздким, и не очень малым, чтобы не потерять особенности распределения признака.
Согластно
формуле Стерджеса рекомендуемое число
интервалов
,
а величина (ширина) интервала
,
где
– разность между наибольшим и наименьшим
значениями признака. За начало первого
интервала рекомендуется брать величину
.
Пусть,
например, все наблюдавшиеся значения
признака Х принадлежат интервалу (a;
b).
Разделим его на k
равных частей (частичных интервалов)
длиной
и обозначим точки деления через x0=a,
x1,
x2,
…, xk-1,
xk=b
(рис. 6.4).
Рис. 6.4
Если частоты интервалов равны соответственно п1, п2, ..., пk, то целесообразно составить таблицу, в первой строке которой перечислить все частичные интервалы, а во второй – соответствующие им частоты. Предполагается, что каждому интервалу принадлежит один из его концов – либо во всех случаях левые, либо во всех случаях правые.
X |
(х0; х1) |
(х1; х2) |
(х2; х3) |
… |
(хk-2; хk-1) |
(хk-1; хk) |
ni |
п1 |
п2 |
n3 |
… |
пk-1 |
пk |
Такая таблица называется интервальным статистическим рядом распределения.
Графическим изображением такого ряда распределения является фигура, называемая гистограммой частот.
Определение
6.1.6. Гистограммой
частот называется ступенчатая фигура,
состоящая из прямоугольников, основаниями
которых служат частичные интервалы
длиной
,
а высотами – частоты интервалов (рис.
6.5).
Рис. 6.5
Замечание 1. Аналогично строится гистограмма относительных частот.
Замечание 2. Для статистического интервального ряда распределения кумулята определяется также как для дискретного, при этом ломаная строится, начиная с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной нулю; другие точки этой ломаной соответствуют концам интервалов.
Пример 6.1.2. Измерения роста Х 800 студентов дали следующие результаты (в см.): 173, 169, 189, 181, 178, 158, 185, 166, 177, 161, 179, 194, 182, 174, 170, …, 174, 166, 177, 169, 185. Построить статистический ряд распределения величины Х, а также гистограмму относительных частот и кумуляту.
○ Среди
перечисленных значений роста наименьшим
является значение хmin=158,
а наибольшим – хmax=198.
Используя формулу Стерджеса, найдем
число частичных интервалов k=1+3,322lg800=
=10,6≈11, оптимальную величину интервала
вычислим по формуле
,
а начало первого интервала:
.
Поэтому
для построения статистического
дискретного ряда распределения рассмотрим
интервал (156, 200), который разделим на 11
частичных интервалов с шириной
,
и подсчитаем количество значений
признака Х, попадающих в каждый из
интервалов. Полученные результаты
представим в виде таблицы:
Х |
156–160 |
160–164 |
164–168 |
168–172 |
172–176 |
176–180 |
180–184 |
184–188 |
188–192 |
192–196 |
196–200 |
ni |
1 |
3 |
4 |
5 |
8 |
10 |
7 |
6 |
3 |
2 |
1 |
|
0,02 |
0,06 |
0,08 |
0,1 |
0,16 |
0,2 |
0,14 |
0,12 |
0,06 |
0,04 |
0,02 |
|
0,02 |
0,08 |
0,16 |
0,26 |
0,42 |
0,62 |
0,76 |
0,88 |
0,94 |
0,98 |
1 |
где , – соответствующие значения относительной и накопленной частости, которые и будем использовать для построения гистограммы относительных частот (рис. 6.6) и кумуляты (рис. 6.7) соответственно.
10
ni
9
8
7
6

5
4
3

2
1

0
X
156
160
164
168
172
176
180
184
188
192
196
200

Рис. 6.6
X
Рис. 6.7
●