- •Элементы математической статистики
- •1.1. Предмет и задачи математической статистики Генеральная и выборочная совокупность. Выборочный метод.
- •1.2. Способы отбора статистического материала
- •1.3. Статистическое распределение. Геометрическое изображение
- •1.4. Эмпирическая функция распределения
- •1.5. Выборочные характеристики статистического распределения
- •3. Выборочное среднее квадратическое отклонение.
- •1.6. Статистические оценки параметров распределения
- •1.7. Доверительные интервалы и доверительные вероятности
- •1.8. Оценка существенности различий выборочных средних
- •1.10. Выводы
1.2. Способы отбора статистического материала
Различают два основных способа составления выборки: повторный и бесповторный. При повторном способе каждый отобранный объект возвращается в генеральную совокупность, после чего выбирают следующий, очередной объект.
При бесповоротном способе объекты в генеральную совокупность не возвращаются.
Повторный способ отбора можно рассматривать как последовательность независимых испытаний, бесповторный – как последовательность зависимых испытаний. Оба способа составления выборки приводят к практически одинаковым результатам, если объем ' выборки мал по сравнению с объемом генеральной совокупности.
1.3. Статистическое распределение. Геометрическое изображение
Возьмем выборочную совокупность объема п. Если генеральная совокупность имеет небольшой объем, то в некоторых случаях можно в выборку включить все ее члены.
Количественное значение признака, наблюдаемое при отборе, – это случайная величина, ее возможные значения обозначают символами х1 х2, х3, ..., хk, а числа ni объектов с одинаковым количественным признаком называют частотами и обозначают п1, п2, п3,…,nk.
Изучение выборки начинают с составления статистического распределения – таблицы с двумя строками. В одной строке указывают значения признака, в другой – соответствующие им частоты.
Определение. Статистическим распределением случайной величины называют таблицу значений признака, расположенных в возрастающем порядке, и соответствующих им частот или относительных частот.
Различают дискретные (возможные значения признака изолированы друг от друга), и интервальные (с непрерывным признаком) распределения. Составление статистического распределения начинают с определения наименьшего и наибольшего значений признака. Остальные значения записывают между ними в порядке возрастания. Далее подсчитывают частоты каждого значения признака.
Для непрерывно варьирующего количественного признака интервал его изменения разбивают на частичные интервалы одинаковой длины (классы) «от и до». Величина частичного интервала (класса) находятся по формуле
(1)
где п – объем выборки; – разность между наибольшим и наименьшим значениями признака. Обычно при небольших выборках число классов принимают равным 5–9. Точное их число устанавливается практическими соображениями: с одной стороны, важно, чтобы таблица не была слишком громоздкой и с другой стороны, в ней не должны исчезнуть особенности изучаемого признака. Затем подсчитывают число количественных признаков в каждом таком интервале. Обычно признак, находящийся на границе двух интервалов, относят к правой границе интервала.
Пример дискретного распределения. В результате обследования 50 кроликов, по количеству родившихся крольчат в одном помете, составлено распределение, приведенное в табл. 1.
Таблица 1
xi |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
ni |
3 |
4 |
6 |
11 |
15 |
14 |
8 |
7 |
2 |
Пример распределения с непрерывно варьирующим количественным признаком. При измерении длины 50 колосьев ячменя сорта «Московский 121» получены данные, помещенные в табл. 2.
Таблица 2
Длина колосьев, см |
6...8 |
8...10 |
10...12 |
12...14 |
14...16 |
16...18 |
Частота |
6 |
12 |
17 |
10 |
4 |
1 |
Это пример интервального распределения.
Группировку по классам применяют и в случае дискретного распределения. Так, если число зерен в колосе от 5 до 30, то этот интервал разбивают на классы, например, 3...6, 6...9, 9...12 и т. д.
Геометрическое изображение статистического распределения. Наглядное представление о распределении дает график. Будем откладывать на оси абсцисс числовое значение признака хi а на оси ординат – их частоты ni или относительные частоты. Полученные точки соединим ломаной линией, которая вместе с осью Ох образуют полигон распределения частот или относительных частот. Распределение (см. табл. 1) изображено на рис. 1.
Если количественный признак изменяется непрерывно, то на каждом интервале строят прямоугольники с высотой, равной числу значений признака ni или относительной частоте. Графическое изображение интервального распределения называется гистограммой (рис. 2). Обведем гистограмму плавной линией так, чтобы были приблизительно равны площади, ограниченные: а) ступенчатой ломаной и б) кривой. В результате получим график функции f*(х), называемый эмпирической функцией распределения частот или относительных частот.
В теории вероятностей ей отвечает дифференциальная функция распределения f(x). Если увеличивать объем выборки, то в соответствии с законом больших чисел относительная частота будет весьма мало отличаться от вероятности появления случайной величины X и график f*(х) будет по форме приближаться к графику f(х).