Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2_Matematicheskaya_statistika_lektsii.doc
Скачиваний:
219
Добавлен:
09.03.2016
Размер:
504.32 Кб
Скачать

1.2. Способы отбора статистического материала

Различают два основных способа составления выборки: повторный и бесповторный. При повторном способе каждый отобранный объект возвращается в генеральную совокупность, после чего выбирают следующий, очередной объект.

При бесповоротном способе объекты в генеральную совокупность не возвращаются.

Повторный способ отбора можно рассматривать как последовательность независимых испытаний, бесповторный – как последовательность зависимых испытаний. Оба способа составления выборки приводят к практически одинаковым результатам, если объем ' выборки мал по сравнению с объемом генеральной совокупности.

1.3. Статистическое распределение. Геометрическое изображение

Возьмем выборочную совокупность объема п. Если генеральная совокупность имеет небольшой объем, то в некоторых случаях можно в выборку включить все ее члены.

Количественное значение признака, наблюдаемое при отборе, – это случайная величина, ее возможные значения обозначают символами х1 х2, х3, ..., хk, а числа ni объектов с одинаковым количественным признаком называют частотами и обозначают п1, п2, п3,…,nk.

Изучение выборки начинают с составления статистического распределения – таблицы с двумя строками. В одной строке указывают значения признака, в другой – соответствующие им частоты.

Определение. Статистическим распределением случайной величины называют таблицу значений признака, расположенных в возрастающем порядке, и соответствующих им частот или относительных частот.

Различают дискретные (возможные значения признака изолированы друг от друга), и интервальные (с непрерывным признаком) распределения. Составление статистического распределения начинают с определения наименьшего и наибольшего значений признака. Остальные значения записывают между ними в порядке возрастания. Далее подсчитывают частоты каждого значения признака.

Для непрерывно варьирующего количественного признака интервал его изменения разбивают на частичные интервалы одинаковой длины (классы) «от и до». Величина частичного интервала (класса) находятся по формуле

(1)

где п – объем выборки; – разность между наибольшим и наименьшим значениями признака. Обычно при небольших выборках число классов принимают равным 5–9. Точное их число устанавливается практическими соображениями: с одной стороны, важно, чтобы таблица не была слишком громоздкой и с другой стороны, в ней не должны исчезнуть особенности изучаемого признака. Затем подсчитывают число количественных признаков в каждом таком интервале. Обычно признак, находящийся на границе двух интервалов, относят к правой границе интервала.

Пример дискретного распределения. В результате обследования 50 кроликов, по количеству родившихся крольчат в одном помете, составлено распределение, приведенное в табл. 1.

Таблица 1

xi

4

5

6

7

8

9

10

11

12

ni

3

4

6

11

15

14

8

7

2

Пример распределения с непрерывно варьирующим количественным признаком. При измерении длины 50 колосьев ячменя сорта «Московский 121» получены данные, помещенные в табл. 2.

Таблица 2

Длина колосьев, см

6...8

8...10

10...12

12...14

14...16

16...18

Частота

6

12

17

10

4

1

Это пример интервального распределения.

Группировку по классам применяют и в случае дискретного распределения. Так, если число зерен в колосе от 5 до 30, то этот интервал разбивают на классы, например, 3...6, 6...9, 9...12 и т. д.

Геометрическое изображение статистического распределения. Наглядное представление о распределении дает график. Будем откладывать на оси абсцисс числовое значение признака хi а на оси ординат – их частоты ni или относительные частоты. Полученные точки соединим ломаной линией, которая вместе с осью Ох образуют полигон распределения частот или относительных частот. Распределение (см. табл. 1) изображено на рис. 1.

Если количественный признак изменяется непрерывно, то на каждом интервале строят прямоугольники с высотой, равной числу значений признака ni или относительной частоте. Графическое изображение интервального распределения называется гистограммой (рис. 2). Обведем гистограмму плавной линией так, чтобы были приблизительно равны площади, ограниченные: а) ступенчатой ломаной и б) кривой. В результате получим график функции f*(х), называемый эмпирической функцией распределения частот или относительных частот.

В теории вероятностей ей отвечает дифференциальная функция распределения f(x). Если увеличивать объем выборки, то в соответствии с законом больших чисел относительная частота будет весьма мало отличаться от вероятности появления случайной величины X и график f*(х) будет по форме приближаться к графику f(х).