
Полигон, гистограмма, кумулята
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулята (кумулятная кривая).
ОПР. Полигоном частот называют ломаную, отрезки которой соединяют точки (х1, п1), (х2, п2), ..., (хk; пk). Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат — соответствующие им частоты пi. Точки (хi; пi) соединяют отрезками прямых и получают полигон частот.
Полигон, как правило, служит для изображения дискретного ряда.
Гистограмма служит для изображения интервального ряда.
ОПР. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению пi /h (плотность частоты).
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии пi /h.
Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения.
ОПР. Кумулята – кривая накопленных частот.
Пример.
По данным примера 1 построим гистограмму, полигон, кумуляту.
Изобразим графически интервальный вариационный ряд.
На оси абсцисс отложим интервалы значений признака, а на оси ординат – соответствующие частоты, и построим прямоугольники с основаниями, равными длине интервала, и высотами, равными частоте. Полученная ступенчатая фигура является гистограммой распределения для вариационного ряда.
х
По гистограмме оценивают моду – mod x - варианта, которой соответствует наибольшая частота. По гистограмме это абсцисса точки пересечения прямых, соединяющих углы самого высокого столбца гистограммы с ближайшими углами соседних столбцов. В нашем примере М0=13,4.
Полигон относительных частот лучше строить по дискретному вариационному ряду.
Если
построить точки с координатами (хi;
)
и соединить их отрезками, то получим
так называемый полигон
относительных частот.
Если
же построить точки с координатами (хi;
Wi)
и соединим их отрезками, то получим
график, который называется кумулятой.
Опр. Медианой med x вариационного ряда называется варианта, которая делит вариационный ряд на две части, равные по числу вариант. Её удобнее находить по графику кумуляты – абсцисса точки ордината которой равна 0,5. Видно, что Ме=13,2.
Эмперическая функция распределения
Пусть нам известно статистическое распределение выборки. Обозначим через nx – число наблюдений, при которых значения вариант оказываются меньше, чем х; п—общее число наблюдений (объем выборки). Ясно, что относительная частота события Х < х равна пx/п. Если х изменяется, то, вообще говоря, изменяется и относительная частота, т. е. относительная частота пx/п есть функция от х. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.
ОПР. Эмпирической функцией распределения (функцией распределения выборки) называют функцию F* (х), определяющую для каждого значения х относительную частоту события Х < х.
Итак, по определению,
,
(1)
где nx — число вариант, меньших х; п — объем выборки. В отличие от эмпирической функции распределения выборки функцию распределения F(х) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F(х) определяет вероятность события Х < х, а эмпирическая функция F* (х) определяет относительную частоту этого же события. При больших п числа F* {х) и F (х) мало отличаются друг от друга. Поэтому F* {х) используют для приближенного представления теоретической (интегральной) функции распределения генеральной совокупности.
Такое заключение подтверждается и тем, что F* (х) обладает всеми свойствами F (х):
0≤ F* {х) ≤1;
F* {х) – неубывающая функция;
3) если х1—наименьшая варианта, то F*(х)=0 при x x1, если хk,—наибольшая варианта, то F*(х)=1 при х > хk.
Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности.