
- •Начальник кафедры высшей математики и системного моделирования
- •Лекция по учебной дисциплине «Математика и информатика»
- •Раздел I. Математика
- •I. Учебные цели
- •II. Воспитательные цели
- •III. Расчет учебного времени
- •IV. Литература
- •V. Учебно-материальное обеспечение
- •VI. Текст лекции
- •Вопрос 1. Генеральная совокупность и выборка
- •Вопрос 2. Статистическое распределение выборки
- •Вопрос 3. Оценки параметров распределения
Вопрос 2. Статистическое распределение выборки
Итак, мы выяснили, что изучение свойств какого-либо признака генеральной совокупности можно производить по выборочной совокупности (выборке).
Предположим, что изучается некоторый случайный признак Х. С этой целью производится ряд независимых опытов или, как принято говорить, наблюдений, в каждом из которых признак Х принимает то или иное значение. Совокупность полученных значений
x1, х2, . . ., хn
величины Х (где n – число опытов) и есть произведенная нами выборка. Эта совокупность играет роль исходного числового материала (статистических данных), который следует подвергнуть дальнейшей обработке и анализу.
Первым этапом обработки статистических данных является составление вариационного ряда.
Различные значения признака называют вариантами, а последовательность вариант, записанных в возрастающем порядке, – вариационным рядом.
Следующим шагом в обработке статистических данных является построение статистического ряда.
Пример 2.1. С помощью классного журнала посещаемости собраны данные о числе пропущенных занятий по математике (за первый семестр) у 25 курсантов первого курса. В результате получены значения:
2, 5, 0, 1, 6, 3, 0, 1, 5, 4, 3, 3, 2, 0, 1, 4, 0, 0, 2, 3, 6, 0, 3, 0, 1.
Составить вариационный ряд.
Решение. Последовательно находим минимальное значение признака и выписываем их подряд, одновременно зачеркивая соответствующее значение в выборочной совокупности.
0
,
0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 5, 5, 6,
6 (1)
7 раз 4 раза 3 раза 5 раз 2 2 2 =25
Последовательность (1) является вариационным рядом.
Пусть по результатам испытания получена выборка объема n, в которой наблюдаемый признак Х принял значения x1, х2, . . ., хk, причем варианта x1 наблюдалась m1 раз, варианта x2 – m2 раз, и т. д., варианта xk наблюдалась mk раз.
Число mi, показывающее, сколько раз повторилось значение xi в ряде наблюдений, называется частотой варианты xi.
Естественно,
что сумма частот по всем вариантам равна
объему выборки:
.
Отношение частоты варианты mi к объему выборки n называется относительной частотой варианты:
.
Статистическим распределением (статистическим рядом) наблюдаемого признака называется соответствие между вариантами и отвечающими им частотами (или относительными частотами).
Как правило, статистическое распределение записывается в виде двухстрочной таблицы, в которой в первой строке указываются варианты, а во второй – соответствующие им частоты (или относительные частоты).
Составим статистический ряд для примера 2.1.
В первую строку таблицы запишем значения вариант, а во вторую – частоты соответствующих вариант.
хi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
mi |
7 |
4 |
3 |
5 |
2 |
2 |
2 |
Составим
статистический ряд с относительными
частотами (во второй строке таблицы
запишем значения относительных частот
вариант
)
хi |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
i |
0,28 |
0,16 |
0,12 |
0,20 |
0,08 |
0,08 |
0,08 |
Необходимо обратить внимание курсантов на то, что сумма частот наблюдаемого признака в рассматриваемом примере равна объему выборки:
,
а сумма относительных частот равна единице:
Графическими изображениями статистического распределения являются полигон распределения и гистограмма.
Для построения полигона на координатной плоскости изображают ломаную с вершинами в точках (xi; mi), где абсцисса xi – значение i-той варианты, а ордината mi – соответствующая ей частота.
Для условий примера 2.1 построим полигон распределения.
m
i
0 1 2 3 4 5 6 xi
Рис. 1. Полигон распределения.
Иногда вместо точек (xi; mi) строят точки (xi; ωi). Затем точки (x1; ω1), (x2; ω2)……… (xп; ωп) соединяют отрезками прямых. Полученную ломаную называют полигоном относительных частот.
Гистограмма
– это ступенчатая фигура, составленная
из серии прямоугольников. Основаниями
прямоугольников гистограммы служат
отрезки
,
а высотами – отрезки
.
Высоты прямоугольников гистограммы
демонстрируют частотность значений
наблюдаемого признака: чем выше
прямоугольник, тем чаще соответствующий
признак наблюдался в рамках проведенного
исследования.