Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Psy_stat_bach_1.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.74 Mб
Скачать

Полигон частот. Выборочная функция распределения и гистограмма.

Для наглядного представления о поведении исследуемой случайной величины X в выборке можно строить различные графики. Один из них – полигон частот: ломаная, отрезки, которой соединяют точки с координатами ( ), ( ),…, ( ), где откладываются на оси абсцисс, а – на оси ординат. Если на оси ординат откладывать не абсолютные ( ), а относительные ( ) частоты, то получим полигон относительных частот. Рис. 1.

По аналогии с функцией распределения случайной величины можно задать некоторую функцию, относительную частоту события  X < x.

Выборочной (эмпирической) функцией распределения называют функцию F*(x), определяющую для каждого значения х относительную частоту события        X < x. Таким образом, , где пх – число вариант, меньших х, п – объем выборки.

Замечание. В отличие от эмпирической функции распределения, найденной опытным путем, функцию распределения F(x) генеральной совокупности называют теоретической функцией распределения. F(x) определяет вероятность события X < x, а  F*(x) – его относительную частоту. При достаточно больших п, как следует из теоремы Бернулли, F*(x) стремится по вероятности к F(x).

Из определения эмпирической функции распределения видно, что ее свойства совпадают со свойствами F(x), а именно:

1)      0 ≤ F*(x) ≤ 1.

2)      F*(x) – неубывающая функция.

3)      Если х1 – наименьшая варианта, то F*(x) = 0 при хх1; если хк – наибольшая варианта, то  F*(x)  = 1 при х > хк .

Для непрерывного признака графической иллюстрацией служит гистограмма, то есть ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высотами отрезки длиной ni /h (гистограмма частот) или  wi /h (гистограмма относительных частот). В первом случае площадь гистограммы равна объему выборки, во втором – единице (рис.2). Рис.2.

Если исследуемая случайная величина имеет абсолютно непрерывное распределение, то по нескольким наблюдениям значений этой случайной величины можно составить оценку функции плотности её вероятности. Для этого из наблюдений выбирают наименьшее и наибольшее , а затем полученный интервал делят на меньших по длине интервалов. Эти внутренние интервалы могут быть разной длины, но чаще их делают одинаковыми по длине, равной в этом случае . Далее для каждого построенного внутреннего интервала определяют, сколько значений из попало в него. После этого на каждом внутреннем интервале строится прямоугольник, основанием которого является этот интервал, а высота определяется как , где - этот число наблюдений , попавших в -ый интервал.

При таком построении гистограммы сумма всех площадей построенных на внутренних интервалах прямоугольников будет равна

Полученную совокупность построенных прямоугольников называют гистограммой. Её верхняя граница может служить приближением графика функции плотности распределения случайной величины , потому что на каждом отрезке её значения пропорциональны числу наблюдений в этот отрезок попавших, а общая площадь под этой верхней границей равна 1.

Если теперь середины верхних горизонтальных интервалов, составляющих верхнюю границу гистограммы, соединить отрезками, то получится ломаная линия, которую также можно считать приближением графика функции плотности распределения случайной величины . Эта ломаная называется полигоном частот.

Чем больше производится число наблюдений и чем больше делается число внутренних интервалов, на которые делится область их значений от наименьшего до наибольшего , тем точнее получается приближение графика функции плотности распределения случайной величины и гистограммой, и полигоном частот.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]