- •Часть II Математическая статистика введение
- •§ 1. Задачи статистики. Понятие выборки
- •§ 2. Первичная обработка данных. Способы задания выборки. Эмпирический закон распределения
- •0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1.
- •§ 3. Точечные оценки
- •3.1Определение оценки и ее качество
- •3.2 Оценки моментов
- •3.3 Оценка функции распределения (эмпирическая функция распределения)
- •3.4 Оценка плотности распределения (гистограмма)
- •§ 4. Точечные оценки параметров распределения
- •4.1 Метод моментов
- •4.2 Метод максимального (наибольшего) правдоподобия
- •§ 5. Понятие интервальной оценки
- •5.1 Основные понятия
- •5.2 Доверительные интервалы для параметров нормального распределения
- •5.2.1Интервальные оценки для математического ожидания при известной дисперсии
- •5.2.2 Интервальные оценки математического ожидания при неизвестной дисперсии
- •5.2.3 Интервальные оценки дисперсии (среднеквадратического отклонения) при известном математическом ожидании
- •5.2.4 Интервальные оценки дисперсии (среднеквдратического отклонения) при неизвестном математическом ожидании
- •§ 6. Проверка статистических гипотез
- •6.1 Основные понятия
- •6.2 Гипотезы о математическом ожидании нормально распределенной генеральной случайной величины
- •6.3 Критерии согласия для предполагаемого закона распределения
- •6.3.1 Критерий согласия (критерий Пирсона)
- •6.3.2 Критерий Колмогорова
§ 2. Первичная обработка данных. Способы задания выборки. Эмпирический закон распределения
Первоначально значения генеральной случайной величины, полученные в результате п наблюдений, регистрируются в порядке появления. Записываются п значений Каждое выборочное значение не имеет никакого преимущества перед другими. Если выборочные значения поставить в порядке возрастания, то мы получим вариационный ряд.
Если в вариационном ряду много одинаковых значений, то удобно оставить различные выборочные значения и указать, сколько раз каждое значение встречается. Частота элемента указывает на то, сколько раз это значение встречалось в выборке, она обозначается и записывается во второй строке под значением :
Объем выборки: Считаем, что выборочные значения записаны в порядке возрастания: В этом случае говорят, что выборка задана с учетом повторений.
В силу частотного определения вероятности имеем:
Относительная частота появления значения является вероятностью принятия этого значения в записиэмпирического закона распределения:
Случайная величина (или ) называется обобщенной выборочной случайной величиной.
По эмпирическому закону распределения находятся приближенные значения характеристик и параметров генеральной случайной величины.
Если объем выборки велик и выборочные значения мало отличаются друг от друга, то после построения вариационного ряда удобно провести группировку. Введем обозначения:
Значение R называется размахом выборки. Интервал содержит все выборочные значения, его разбивают на непересекающиеся подмножества. Рекомендуется число разбиений выбирать по формуле:
Чаще всего разбиение проводится на равные по длине интервалы, длина их равна:
Получаем промежутки разбиения:
Далее производится подсчет числа выборочных значений, попавших в каждый из промежутков разбиения. Обозначим число выборочных значений, попавших в i-ый промежуток. В таблице указываются границы промежутков разбиения, и под каждым промежутком указывается число выборочных значений, попавших в промежуток. Такое задание выборки называется еще интервальным вариационным рядом.
Пример 1. Проведено 16 подбрасываний монеты. Если выпадает решка, записываем 1, если герб – записываем 0. Получена выборка:
0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1.
Запишем выборку с учетом повторений:
-
0
1
7
9
Запишем эмпирический закон распределения:
-
0
1
Случайная величина Х равна 0, если при подбрасывании монеты выпала решка, и равна 1, если при подбрасывании выпал герб. Эта случайная величина Х выступает в роли генеральной случайной величины. Исходя из эмпирического закона распределения, мы определяем:
Пример 2. Отделом технического контроля измерены длины нитей в 30 клубках. Длина нити дана в метрах. Получена выборка:
8,05 8,1 8,13 8,15 8,0 8,25 8,15 8,21 8,2 8,03 8,17 8,12 8,03
8,04 8,27 8,14 8,06 8,07 8,26 8,18 8,09 8,3 8,3 8,25 8,26 8,13
8,02 8,19 8,05 8,21
В данном примере генеральная случайная величина Х показывает длину нити в клубке.
По данным выборки построим интервальный вариационный ряд.
Число интервалов разбиения:
Найдем размах выборки:
Тогда находим длину промежутков:
Запишем промежутки и число выборочных значений, попавших в каждый из промежутков:
-
Интервалы
5
5
5
5
3
7