Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математика_методические_рекомендации.doc
Скачиваний:
5
Добавлен:
01.03.2025
Размер:
5.86 Mб
Скачать

Статистическое распределение (вариационный ряд). Гистограмма. Полигон

В ходе экспериментов, исследователь получает набор числовых данных, отражающих результаты измерений или наблюдений исследуемых объектов. Совокупность этих числовых данных представленных в виде последовательности результатов наблюдений x1, x2,..., хn – есть выборка из генеральной совокупности. Основная задача первичного статистического анализа состоит в том, чтобы по имеющимся экспериментальным данным охарактеризовать исследуемую генеральную совокупность небольшим числом параметров.

Если полученные данные расположить в порядке убывания или возрастания числовых значений исследуемого признака, то такой ряд чисел будет называться вариационным рядом.

В том случае, когда среди числовых данных есть одинаковые значения, их можно представить в виде таблицы. В первой строке таблицы указываются значения признака (варианты), а во второй – абсолютные или относительные частоты их встречаемости. Такое представление вариационного ряда еще называют статистическим распределением.

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот.

Число , показывающее, сколько раз появилось значение в наблюдениях, называют частотой данного значения, а отношение относительной частотой. Число k различных значений в наблюдениях всегда конечно и . Очевидно, имеют место равенства . Результаты можно свести в таблицу:

Значение признака

Частота встречаемости

Относительная частота

Задача 22. Ежедневное количество студентов, посещающих методический кабинет, на протяжении ряда дней, следующее: 15, 17, 16, 18, 20, 21, 18, 17, 20, 15, 18, 17, 16, 19, 17, 16, 18, 19, 18, 19. Составить статистическое распределение выборки.

Решение. В первое строке таблицы укажем встречающиеся значения посещений, во второй – количество таких значений, и, наконец, в третьей – относительную частоту этих значений.

Значение признака

15

16

17

18

19

20

21

Частота встречаемости

2

3

4

5

3

2

1

Относительная частота

0,1

0,15

0,2

0,25

0,15

0,1

0,05

Если наблюдаемая величина непрерывна, то, строго говоря, каждое значение она принимает только один раз. На практике, также ради экономии места (на хранение данных) и времени (на их обработку), применяют группировку. Это означает, что весь интервал наблюдаемых значений разбивается на k частичных интервалов равной длины h, и затем подсчитываются числа попадания наблюдений в эти интервалы, которые принимают за частоты (для некоторой новой, уже дискретной случайной величины). В качестве новых значений вариант обычно берутся середины интервалов (либо в таблице указываются сами интервалы). Группировка может применяться и в случае дискретных случайных величин, если шаг, с которым изменяются их значения, кажется нам слишком мелким.

Согласно формуле Стерджеса рекомендуемое число интервалов разбиения , а длины частичных интервалов . Предполагается, что весь интервал имеет вид .

Для графического изображения статистического распределения строят полигоны или гистограммы.

Полигоном частот называют ломаную, отрезки которой соединяют точки . Полигоном относительных частот называют ломаную, отрезки которой соединяют точки . Полигоны обычно служат для изображения выборки в случае дискретных случайных величин.

Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основанием которых служат частичные интервалы длиной h, а высоты равны частоте (относительной частоте). Гистограмма обычно служит для изображения выборки в случае непрерывных случайных величин. Если на гистограмме соединить середины верхних сторон прямоугольников, то полученная ломаная образует полигон относительных частот.