Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект по ТВиМС.pdf
Скачиваний:
397
Добавлен:
29.02.2016
Размер:
774.54 Кб
Скачать

Глава 9

Описательная статистика

9.1Генеральная совокупность. Выборка. Выбор

В соответствии с поставленными основными задачами математической статистики рассмотрим абстрактный эксперимент E. В результате его проведения мы измеряем (наблюдаем) значение x изучаемой случайной величины X.

В реальных условиях случайной величиной X являются, например, параметр детали при массовом производстве, величина инфляции, любой общий количественный признак определенного множества объектов.

Определение. Генеральной совокупностью называется множество возможных значений изучаемой случайной величины X с приписанным этому множеству законом распределения X : L(X).

Примеры.

1)X - число рождений в городе за рассматриваемый промежуток времени. Генеральной совокупностью здесь является множество чисел {0, 1, 2, . . . , N}, ограниченное сверху каким-то числом N. Так как заранее для всех случаев указать какое-либо конкретное число N невозможно, то с целью упрощения математической теории здесь удобно рассматривать идеализированную генеральную совокупность - все множество неотрицательных целых чисел {0, 1, 2, . . .} с некоторым законом распределения.

2)X - величина отклонения детали от заданного размера при массовом производстве. Для удобства исследований за генеральную совокупность здесь принимают все множество вещественных чисел с некоторым законом распределения.

3)X - длительность обслуживания в системе массового обслуживания. Здесь генеральной совокупностью является множество неотрицательных вещественных чисел с некоторым законом распределения.

Числа, составляющие генеральную совокупность, называются ее элементами. Закон L(X) распределения случайной величины X называется генеральным законом распределения, а числовые характеристики X - генеральными числовыми характеристиками.

Так как генеральная совокупность - большая, то перебрать все ее элементы невозможно, поэтому для изучения генеральной совокупности из нее делают выборку и по ее свойствам судят о свойствах генеральной совокупности.

Определение. Выборкой называется множество измеренных значений x1, x2, . . . , xn случайной величины X.

Выборка записывается в виде n-мерной точки x1, x2, . . . , xn. Числа, составляющие выборку, называются ее элементами; их количество n - объемом выборки.

61

Выборку нельзя составлять как попало, иначе она не будет правильно характеризовать генеральную совокупность.

Определение. Процесс составления выборки называется выбором. Различных типов выбора существует несколько.

Во-первых, различают выбор с возвращением и без возвращения. Оба типа выбора имеют смысл для конечной перенумерованной генеральной совокупности.

Несмотря на кажущиеся различия между двумя этими типами выбора на самом деле в каждом из них вероятность попадания каждого из элементов в выборку одинакова.

Во-вторых, различают выбор случайный, т.е. проводимый с помощью какого-либо случайного механизма, и неслучайный. В статистике в основном применяется случайный выбор как более надежный в отражении свойств генеральной совокупности.

Определение. Простым случайным выбором называется выбор, удовлетворяющий следующим требованиям:

1.Выбор является случайным.

2.Каждый элемент генеральной совокупности может быть выбран.

3.Каждый элемент выбирается независимо от остальных.

4.Все элементы выборки получаются в равных условиях.

Вреальных условиях простой случайный выбор не всегда осуществим. Он является как бы эталонным идеальным выбором. Реальный выбор можно лишь приближенно считать случайным. Его нельзя, например, осуществить из бесконечной генеральной совокупности, из генеральной совокупности, образование которой не завершено и может продолжаться бесконечно долго.

Виды реальных выборов.

1. Механический выбор. В этом случае элементы генеральной совокупности выбираются по какой-либо закономерности. Например, измерения производятся через равные промежутки времени, контролируется каждая десятая деталь, сходящая с конвейера, каждый пятый человек по списку. Применяется для автоматизированного контроля.

2. Серийный выбор. Элементы в этом случае выбираются не по одному, а сериями. 3. Типический выбор. В этом случае генеральная совокупность делится на непересека-

ющиеся части. Из каждой части выбираются элементы в количестве, пропорциональном объему части.

Так можно получить сведения о средней зарплате в отрасли, об урожайности поля, о политических предпочтениях людей. Характерен для экономических и социологических исследований.

4. Субъективный выбор - на основе какого-либо субъективного принципа. Например, обследуются не все партии продукции, а лишь одна, наиболее подозрительная на содержание брака, ведется опрос по телефону, а не всех слоев населения. Он экономит время, средства, но может привести к большим ошибкам.

5. Выбор с помощью случайных независимых измерений (температура среды, величина тока, загрязненность реки). Характерен для инженерных и естественнонаучных исследований.

Все виды выборов могут комбинироваться между собой. Существуют и другие типы выборов.

Вматематической статистике рассматривается только простой случайный выбор. Случайный выбор - объективен, гарантирует от пропуска скрытых закономерностей в генеральной совокупности, поэтому реальный выбор следует организовывать так, чтобы свойство случайности присутствовало.

62

В результате выполнения выбора из генеральной совокупности отбирается некоторый набор элементов, который называется выборкой. К выборкам, так же, как и к выбору, предъявляется ряд требований. Важнейшим из них является требование репрезентативности (представительности).

Это требование означает, что выборка должна хорошо представлять всю генеральную совокупность. Например, изучая среднюю зарплату в отрасли, нельзя ограничиться данными одного завода, одного месяца и т.д. Для составления репрезентативной выборки более всего подходит типический выбор. Простой случайный выбор тоже репрезентативен, так как теоретически любой элемент генеральной совокупности может попасть в выборку, но менее надежен, чем типический, так как в силу независимости и случайности выбора элементов возможна их концентрация и, следовательно, недостаточно представительный охват генеральной совокупности.

Другим требованием является требование однородности выборки. Это означает, что условия проведения экспериментов для получения выборки не должны меняться. Выборка должна быть получена из генеральной совокупности, а не из нескольких. В ней должны отсутствовать выбросы. Неоднородная выборка не может дать правильного прогноза.

Отметим, что методы обработки малых (n < 30) и больших выборок отличаются. Для обработки больших выборок привлекаются асимптотические методы.

9.2Вариационный и статистический ряды

Выборка является труднообозримым множеством. Для дальнейшего изучения выборку подвергают перегруппировке.

Определение. Вариационным рядом называется последовательность всех элементов выборки, расположенных в неубывающем порядке. Одинаковые элементы повторяются.

Вариационный ряд представляет собой ряд чисел, записывается в виде x1, x2, . . . , xn. Элементы вариационного ряда называются вариантами или порядковыми статисти-

ками. Минимальный и максимальный элементы называются крайними:

xmin = x1; xmax = xn.

Разность между максимальным и минимальным элементами называется размахом или широтой выборки:

R = xmax − xmin.

Определение. Средний элемент вариационного ряда, если n - нечетное, или полусумма двух средних элементов, если n - четное, называется медианой выборки и обозначается med.

med =

(xl l + xl+1)/2, n = 2l.

 

x +1, n = 2l + 1,

Определение. Элементы вариационного ряда, на четверть отстоящие от краев, называются соответственно нижней и верхней квартилями и обозначаются z1/4 и z3/4.

Определение. Статистическим рядом называется последовательность различных элементов zi вариационного ряда с указанием частот ni повторения элементов.

В общем случае статистический ряд можно записать в виде таблицы:

zi

z1

z2

...

...

zk

ni

n1

n2

...

...

nk

63

Статистический ряд можно изобразить графически в виде полигона (многоугольника), откладывая по оси абсцисс элементы статистического ряда, а по оси ординат - частоты (или относительные частоты). Полученные точки плоскости соединяются отрезками.

Рис. 9.1: Полигон частот

Полигон частот (или относительных частот) дает хорошее представление о распределении частот в выборке. Элемент, отвечающий наибольшей частоте по сравнению с соседними элементами статистического ряда, называется выборочной модой (mod).

На полигоне моде соответствует наивысшая точка.

9.3Выборочная функция распределения

Определение. Выборочной (эмпирической) функцией распределения называется относительная частота события X < x, полученная по выборке:

F (x) = P (X < x) = nnx .

Здесь nx - число элементов выборки, меньших значения x. Иначе эмпирическую функцию можно записать

F (x) = n1 X ni.

xi<x

Это функция распределения дискретной случайной величины X , заданной таблицей распределения

64