- •Часть II Математическая статистика введение
- •§ 1. Задачи статистики. Понятие выборки
- •§ 2. Первичная обработка данных. Способы задания выборки. Эмпирический закон распределения
- •0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1.
- •§ 3. Точечные оценки
- •3.1Определение оценки и ее качество
- •3.2 Оценки моментов
- •3.3 Оценка функции распределения (эмпирическая функция распределения)
- •3.4 Оценка плотности распределения (гистограмма)
- •§ 4. Точечные оценки параметров распределения
- •4.1 Метод моментов
- •4.2 Метод максимального (наибольшего) правдоподобия
- •§ 5. Понятие интервальной оценки
- •5.1 Основные понятия
- •5.2 Доверительные интервалы для параметров нормального распределения
- •5.2.1Интервальные оценки для математического ожидания при известной дисперсии
- •5.2.2 Интервальные оценки математического ожидания при неизвестной дисперсии
- •5.2.3 Интервальные оценки дисперсии (среднеквадратического отклонения) при известном математическом ожидании
- •5.2.4 Интервальные оценки дисперсии (среднеквдратического отклонения) при неизвестном математическом ожидании
- •§ 6. Проверка статистических гипотез
- •6.1 Основные понятия
- •6.2 Гипотезы о математическом ожидании нормально распределенной генеральной случайной величины
- •6.3 Критерии согласия для предполагаемого закона распределения
- •6.3.1 Критерий согласия (критерий Пирсона)
- •6.3.2 Критерий Колмогорова
§ 2. Первичная обработка данных. Способы задания выборки. Эмпирический закон распределения
Первоначально
значения генеральной случайной величины,
полученные в результате п
наблюдений, регистрируются в порядке
появления. Записываются п
значений
Каждое выборочное значение
не имеет никакого преимущества перед
другими. Если выборочные значения
поставить в порядке возрастания, то мы
получим вариационный
ряд.
Если в вариационном
ряду
много одинаковых значений, то удобно
оставить различные выборочные значения
и указать, сколько раз каждое значение
встречается. Частота
элемента
указывает на то, сколько раз это значение
встречалось в выборке, она обозначается
и записывается во второй строке под
значением
:
Объем выборки:
Считаем, что выборочные значения записаны
в порядке возрастания:
В этом случае говорят, что выборка
задана с учетом повторений.
В силу частотного определения вероятности имеем:
![]()
Относительная
частота появления значения
является вероятностью принятия этого
значения в записиэмпирического закона
распределения:
Случайная величина
(или
)
называется обобщенной
выборочной случайной величиной.
По эмпирическому закону распределения находятся приближенные значения характеристик и параметров генеральной случайной величины.
Если объем выборки велик и выборочные значения мало отличаются друг от друга, то после построения вариационного ряда удобно провести группировку. Введем обозначения:
![]()
Значение R
называется размахом
выборки.
Интервал
содержит все выборочные значения, его
разбивают на непересекающиеся
подмножества. Рекомендуется число
разбиений выбирать по формуле:
![]()
Чаще всего разбиение проводится на равные по длине интервалы, длина их равна:
![]()
Получаем промежутки разбиения:
![]()
![]()
Далее производится
подсчет числа выборочных значений,
попавших в каждый из промежутков
разбиения. Обозначим
число выборочных значений, попавших в
i-ый
промежуток. В таблице указываются
границы промежутков разбиения, и под
каждым промежутком указывается число
выборочных значений, попавших в
промежуток. Такое задание выборки
называется еще интервальным
вариационным рядом.
Пример 1. Проведено 16 подбрасываний монеты. Если выпадает решка, записываем 1, если герб – записываем 0. Получена выборка:
0, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1.
Запишем выборку с учетом повторений:
-

0
1

7
9
Запишем эмпирический закон распределения:
-

0
1


Случайная величина Х равна 0, если при подбрасывании монеты выпала решка, и равна 1, если при подбрасывании выпал герб. Эта случайная величина Х выступает в роли генеральной случайной величины. Исходя из эмпирического закона распределения, мы определяем:
![]()
Пример 2. Отделом технического контроля измерены длины нитей в 30 клубках. Длина нити дана в метрах. Получена выборка:
8,05 8,1 8,13 8,15 8,0 8,25 8,15 8,21 8,2 8,03 8,17 8,12 8,03
8,04 8,27 8,14 8,06 8,07 8,26 8,18 8,09 8,3 8,3 8,25 8,26 8,13
8,02 8,19 8,05 8,21
В данном примере генеральная случайная величина Х показывает длину нити в клубке.
По данным выборки построим интервальный вариационный ряд.
Число интервалов разбиения:
![]()
Найдем размах выборки:
![]()
Тогда находим
длину промежутков: ![]()
Запишем промежутки и число выборочных значений, попавших в каждый из промежутков:
-
Интервалы







5
5
5
5
3
7
