Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Л СЭ4.1. лекции_ 12.doc
Скачиваний:
1
Добавлен:
01.03.2025
Размер:
264.19 Кб
Скачать

Вопрос 2. Статистическое распределение выборки

Итак, мы выяснили, что изучение свойств какого-либо признака генеральной совокупности можно производить по выборочной совокупности (выборке).

Предположим, что изучается некоторый случайный признак Х. С этой целью производится ряд независимых опытов или, как принято говорить, наблюдений, в каждом из которых признак Х принимает то или иное значение. Совокупность полученных значений

x1, х2, . . ., хn

величины Х (где n – число опытов) и есть произведенная нами выборка. Эта совокупность играет роль исходного числового материала (статистических данных), который следует подвергнуть дальнейшей обработке и анализу.

Первым этапом обработки статистических данных является составление вариационного ряда.

Различные значения признака называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом.

Следующим шагом в обработке статистических данных является построение статистического ряда.

Пример 2.1. С помощью классного журнала посещаемости собраны данные о числе пропущенных занятий по математике (за первый семестр) у 25 курсантов первого курса. В результате получены значения:

2, 5, 0, 1, 6, 3, 0, 1, 5, 4, 3, 3, 2, 0, 1, 4, 0, 0, 2, 3, 6, 0, 3, 0, 1.

Составить вариационный ряд.

Решение. Последовательно находим минимальное значение признака и выписываем их подряд, одновременно зачеркивая соответствующее значение в выборочной совокупности.

0 , 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 5, 6, 6 (1)

7 раз 4 раза 3 раза 5 раз 2 2 2 =25

Последовательность (1) является вариационным рядом.

Пусть по результатам испытания получена выборка объема n, в которой наблюдаемый признак Х принял значения x1, х2, . . ., хk, причем варианта x1 наблюдалась m1 раз, варианта x2 m2 раз, и т. д., варианта xk наблюдалась mk раз.

Число mi, показывающее, сколько раз повторилось значение xi в ряде наблюдений, называется частотой варианты xi.

Естественно, что сумма частот по всем вариантам равна объему выборки: .

Отношение частоты варианты mi к объему выборки n называется относительной частотой варианты:

.

Статистическим распределением (статистическим рядом) наблюдаемого признака называется соответствие между вариантами и отвечающими им частотами (или относительными частотами).

Как правило, статистическое распределение записывается в виде двухстрочной таблицы, в которой в первой строке указываются варианты, а во второй – соответствующие им частоты (или относительные частоты).

Составим статистический ряд для примера 2.1.

В первую строку таблицы запишем значения вариант, а во вторую – частоты соответствующих вариант.

хi

0

1

2

3

4

5

6

mi

7

4

3

5

2

2

2

Составим статистический ряд с относительными частотами (во второй строке таблицы запишем значения относительных частот вариант )

хi

0

1

2

3

4

5

6

i

0,28

0,16

0,12

0,20

0,08

0,08

0,08

Необходимо обратить внимание курсантов на то, что сумма частот наблюдаемого признака в рассматриваемом примере равна объему выборки:

,

а сумма относительных частот равна единице:

Графическими изображениями статистического распределения являются полигон распределения и гистограмма.

Для построения полигона на координатной плоскости изображают ломаную с вершинами в точках (xi; mi), где абсцисса xi – значение i-той варианты, а ордината mi – соответствующая ей частота.

Для условий примера 2.1 построим полигон распределения.

m i

0 1 2 3 4 5 6 xi

Рис. 1. Полигон распределения.

Иногда вместо точек (xi; mi) строят точки (xi; ωi). Затем точки (x1; ω1), (x2; ω2)……… (xп; ωп) соединяют отрезками прямых. Полученную ломаную называют полигоном относительных частот.

Гистограмма – это ступенчатая фигура, составленная из серии прямоугольников. Основаниями прямоугольников гистограммы служат отрезки , а высотами – отрезки . Высоты прямоугольников гистограммы демонстрируют частотность значений наблюдаемого признака: чем выше прямоугольник, тем чаще соответствующий признак наблюдался в рамках проведенного исследования.