
- •Тема 7. Основные понятия математической статистики
- •§1.Признаки и переменные. Измерительные шкалы
- •§2.Основные типы эксперимента
- •§3. Выборочный метод, основные понятия и принципы
- •§4. Статистическое распределение выборки
- •§5. Числовые характеристики выборочной совокупности
- •§6. Точечные оценки числовых характеристик генеральной совокупности
- •§7. Интервальные оценки числовых характеристик генеральной совокупности. Доверительный интервал
§4. Статистическое распределение выборки
Пусть для изучения количественного признака Х из генеральной совокупности извлечена выборка объема n.
Возможные значения признака Х называют
вариантами, обозначают
,
где индекс
обозначает номер данной варианты.
Частота варианты – это количество
повторений данной варианты в выборке,
обозначается
.
Сумма всех частот должна быть равна
объему выборки:
.
Относительной частотой варианты
называют отношение частоты варианты к
объему выборки, обозначают
(
).
Сумма всех относительных частот должна
быть равна единице:
.
Любая выборка может быть представлена в негруппированном виде (просто в виде набора значений), в виде вариационного ряда или в группированном виде.
Вариационным рядом называют последовательность вариант, записанных в порядке возрастания.
Статистическим распределением выборки
называется соответствие между вариантами
и их частотами
или относительными частотами
.
Статистическое распределение выборки может быть представлено в виде безинтервального ряда или в виде интервального ряда.
Безинтервальный (дискретный) ряд строится в том случае, когда число различных вариант мало (малый объем выборки или при большом объеме выборки мало различных вариант).
Интервальный ряд строится в том случае, когда объем выборки большой, изучаемый признак непрерывен, много различных вариант.
Безинтервальный ряд может быть представлен двумя способами:
в виде таблицы, в первой строке которой перечисляются варианты в порядке возрастания, во второй строке – частоты или относительные частоты. Такая таблица называется статистическим дискретным рядом распределения выборки и является группированным видом представления выборки.
|
|
|
… |
|
или |
|
|
|
… |
|
|
|
|
… |
|
|
|
|
… |
|
в виде графика, в котором по оси абсцисс откладываются варианты, а по оси ординат – частоты или относительные частоты. По данным выборки наносятся точки и соединяются отрезками. Полученная ломаная называется полигоном частот (или относительных частот).
Суть построения интервального ряда состоит в следующем: весь диапазон изменений признака разбивается на частичные интервалы и учитывается не каждая варианта, а число объектов выборки, попавших в данный интервал.
Порядок построения интервального ряда:
Находят в выборке максимальное и минимальное значение и вычисляют размах выборки – разность между максимальным и минимальным значением:
.
Определяют длину частичного интервала по формуле:
, где
- это объем выборки, а знаменатель дроби
- количество частичных интервалов. Найденное значение
округляют до ближайшего четного числа с тем же количеством знаков после запятой, что и сами измерения в выборке.
Замечание:
Определяют начало первого интервала таким образом, чтобы минимальная варианта попала в его середину:
.
Строят таблицу, в первую строку которой записывают частичные интервалы:
Интервалы записывают до тех пор, пока
не перейдут за
.
Во второй строке таблицы подсчитывают количество объектов выборки, попавших в тот или иной интервал (для этого удобен метод «конвертов»). Варианта, попавшая на границу между интервалами, относится в следующий интервал. Чтобы отличить от дискретного ряда, где подсчитывается частота каждой варианты, количество значений, попавших в тот или иной интервал, обозначаем
.
Полученная таблица называется статистическим интервальным рядом распределения выборки. Графическим представлением интервального ряда является гистограмма частот или гистограмма относительных частот. Для построения гистограммы по оси абсцисс откладывают частичные интервалы, а по оси ординат частоты или относительные частоты.