Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Случайные величины.doc
Скачиваний:
7
Добавлен:
01.03.2025
Размер:
822.27 Кб
Скачать

3.5. Элементы математической статистики

Математическая статистика – это наука, занимающаяся получением, описанием и обработкой опытных данных или наблюдений с целью изучения закономерностей массовых явлений.

3.5.1. Вариационные ряды и их графическая интерпретация

В практике статистических наблюдений различают два вида наблюдений: сплошное, когда изучаются все объекты (элементы) и выборочное, когда изучается часть объектов. Вся изучаемая совокупность объектов называется «генеральной совокупностью». Простейший пример генеральной совокупности – материалы переписи населения той или иной страны, в которых имеются сведения о всех ее гражданах. Понятие генеральной совокупности в определенном смысле аналогично понятию всей совокупности значений случайной величины.

Как правило, для наблюдений или опыта удается использовать только часть генеральной совокупности – так называемую «выборочную совокупность» или «выборку».

Сущность выборочного метода в статистике состоит в том, чтобы по некоторой части генеральной совокупности (по выборке) определять ее свойства в целом.

На начальном этапе данные выборки заносятся в таблицу, где записываются номера и результаты измерений или опросов. Различные значения случайной величины, наблюдаемые в результате эксперимента, называются вариантами (обозначаются через x). Первый шаг к осмыслению имеющегося статистического материала – это его упорядочение, расположение вариант в порядке возрастания, т. е. ранжирование вариант ряда.

Пример. Генеральная совокупность – N ящиков с приборами;

Выборочная совокупность – n = 10 выбранных для контроля ящиков.

Подсчитывается число пострадавших при транспортировке ящиков деталей. Результаты подсчета представлены в таблице:

№ ящ.

1

2

3

4

5

6

7

8

9

10

Кол. д.

0

1

4

1

2

3

1

5

0

2

Если количество пострадавших деталей – это изучаемая случайная величина X, то полученные данные о ней можно представить в виде «статистического ряда распределения»:

Х

0

1

2

3

4

5

0,2

0,3

0,2

0,1

0,1

0,1

Здесь, как и для дискретной случайной величины, перечислены все возможные значения, принимаемые величиной Х, но вместо вероятностей этих значений во второй строке записаны их относительные частоты или частости . Например, пострадавших деталей нет только в двух ящиках (в первом и девятом) из десяти, поэтому и . Заметим, что вместо относительных частот можно использовать также число , которое показывает, сколько раз данная варианта встречается в выборке; это число называют частотой варианты.

Ранжированный в порядке возрастания (или убывания) ряд вариант с соответствующими им частотами или относительными частотами называется вариационным рядом.

Возможен и другой способ описания статистических данных. Пусть мы опять имеем «статистический ряд», но достаточно длинный. Чтобы сделать результаты опыта более обозримыми, весь диапазон наблюденных значений

величины разобьем на разряды (интервалы) и подсчитаем частоту попадания значений в соответствующий интервал. Рассмотрим опять наш пример.

Интервал значений Х

0 Х < 2

2 Х 3

3 <Х 5

Частота попаданий в интервал

5 ( 0,5)

3 ( 0,3 )

2 ( 0,2 )

В скобках указаны относительные частоты.

При составлении вариационного ряда по интервалам следует иметь ввиду, что число интервалов следует брать не очень большим, чтобы после группировки ряд не был громоздким, и не очень малым, чтобы не потерять особенности распределения признака, все интервалы следует выбирать одинаковой длины, при этом начало интервала включается в него, а конец – нет. Согласно формуле Стерджеса рекомендуемое число интервалов

, а величина (ширина интервала) , где – разность между наибольшим и наименьшим значениями признака.

При изучении вариационных рядов наряду с понятием частоты используется понятие накопленной частоты (обозначение ). Накопленная частота показывает, сколько наблюдалось вариантов со значением признака, меньшим . Отношение накопленной частоты к общему числу наблюдений называют накопленной частостью .

Накопленные частоты (частости) для каждого интервала находятся последовательным суммированием частот (частостей) всех предшествующих интервалов, включая данный.

Для графического изображения вариационных рядов используются два вида графиков: полигон частот или относительных частот и гистограмма.

Полигон частот (относительных частот) представляет собой ломаную, отрезки которой соединяют точки с координатами (или координатами ( )) .

Для рассмотренного выше вариационного ряда полигон относительных частот имеет вид

Полигон частот является аналогом многоугольника распределений дискретной случайной величины.

Гистограммы служат только для изображения интервальных вариационных рядов.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы значений признака , а высоты определяются количеством значений измеряемой величины, попадающих в соответствующий интервал.

Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат интервалы значений признака , а высоты равны относительным частотам попадания значений измеряемой величины в соответствующий интервал.

Гистограмма нашего интервального вариационного ряда изображена ниже.

Если соединить середины верхних оснований прямоугольников отрезками, то получится полигон того же распределения.

Еще одним важным понятием служит понятие эмпирической функции распределения.

Эмпирической функции распределения называется относительная частота (частость) того, что признак (случайная величина ) примет значение, меньшее заданного , то есть

.

Согласно этому определению, для данного эмпирическая функция распределения представляет накопленную частость :

.