![](/user_photo/59031_ixqng.jpg)
- •Математическая статистика Учебное пособие
- •Введение
- •1. Описательная статистика
- •1.1. Выборка
- •1.2. Статистическое распределение выборки
- •1.3. Эмпирическая функция распределения
- •1.4. Числовые характеристики выборки
- •2. Статистические оценки параметров теоретического распределения
- •2.1. Точечные и интервальные оценки
- •2.2. Точечные оценки математического ожидания и дисперсии
- •2.3. Интервальные оценки математического ожидания нормального распределения
- •2.4. Примеры статистических расчетов
- •3. Проверка статистических гипотез
- •3.1. Статистические гипотезы
- •3.2. Проверка гипотезы о равенстве дисперсий
- •3.3. Проверка гипотезы о равенстве математических ожиданий
- •3.4. Критерии согласия
- •3.5. Критерий согласия Пирсона
- •3.6. Критерий согласия Колмогорова
- •3.7. Примеры проверки гипотез
- •Приложения
- •Для двусторонней критической области
- •Значения коэффициента q(, k)
- •Критические точки распределения χ2
- •Функция распределения k(t)
- •Содержание
- •Математическая статистика
- •190031, СПб., Московский пр., 9.
1.3. Эмпирическая функция распределения
В теории вероятности
случайную величину Х
можно задать [3] функцией распределения
или (в случае непрерывной величины Х)
плотностью распределения
.
В статистике функция распределения
генеральной совокупности называется
теоретической
функцией распределения.
По вариационному ряду (см. таблицу 1.2.1)
можно построить эмпирическую
функцию распределения
,
которая определяется как относительная
частота события
.
Таким образом,
,
где
– число вариант, меньших
в данной выборке.
Функция
обладает следующими свойствами:
1) если
– наименьшая варианта, то
при
,
2) если
– наибольшая варианта, то
при
;
3) – неубывающая функция;
4)
.
Из теоремы Бернулли
[3] следует, что для всех х
относительная частота события
стремится по вероятности к значению
теоретической функции распределения
.
Это означает, что
при любом значении
.
Другими словами, значения
и
мало отличаются одно от другого при
больших
.
Для построения
исходный вариационный ряд (см. таблицу
1.2.1) нужно дополнить двумя графами:
накоплений частот (
)
и относительных частот (
).
Таблица 1.3.1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Данные, приведенные в таблице 1.3.1, дают возможность задать все значения функции :
График подобной функции представлен на рисунке 1.3.1.
Рис. 1.3.1
Перед построением графика эмпирической функции распределения сгруппированного вариационного ряда надо также добавить две строки в таблицу 1.2.3.
Таблица 1.3.2
Интервал |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В случае непрерывной
теоретической функции распределения
график
строится приближенно по точкам
,
которые соединяются отрезками, как это
показано на рисунке 1.3.2. Чтобы показать,
что
для всех
и
для всех
,
надо провести две горизонтальных линии.
Рис. 1.3.2
При большом
количестве промежутков со значительным
числом вариант в них
,
т.е. ломаная
дает представление о гладкой кривой
.
1.4. Числовые характеристики выборки
В случае вариационного
ряда выборочный начальный момент
-го
порядка определяется следующим образом:
;
Выборочной
средней
называется среднее арифметическое
значений выборки. Величина
совпадает с начальным моментом первого
порядка
.
Выборочная
медиана
– значение, приходящееся на середину
вариационного ряда в таблице 1.2.1, значит
|
если
если
|
Выборочная мода
– варианта
с наибольшей частотой
.
Таких значений
в выборке может быть несколько.
Характеристики положения
,
,
примерно указывают расположение вариант
на числовой оси,
т.к. каждая из них не превышает наибольшего
значения и не может быть меньше наименьшего
значения
.
Выборочные центральные моменты m-го порядка вычисляются по формуле
.
Выборочной
дисперсией
называется среднее арифметическое
квадратов отклонения наблюдаемых
значений от их среднего значения
.
Величина
совпадает с центральным выборочным
моментом второго порядка
.
Раскрывая скобки
и учитывая, что
,
получаем
,
где
– начальный момент второго порядка.
Выборочным
среднеквадратическим отклонением
называется квадратный корень из
выборочной дисперсии, т.е.
.
Величина
,
вычисленная по формуле
,
называется
исправленной
выборочной дисперсией,
а
– исправленным выборочным
среднеквадратическим отклонением.
Характеристики
рассеивания
,
,
,
определяют величину разброса вариант
относительно центра расположения
.
В случае
сгруппированного вариационного ряда
сначала таблица 1.2.3 преобразуется в
обычный вариационный ряд, в котором в
первой строке помещены значения середины
промежутков
.
Таблица 1.4
|
|
|
|
|
|
|
|
|
|
Все выборочные моменты в этом случае вычисляются по тем же формулам для вариационного ряда с учетом значений, приведенных в таблице 1.4. Например, выборочное среднее
.
Группировка и
усреднение исходных данных вносят
определенную ошибку в расчет моментов,
особенно заметную при малом количестве
интервалов. Для уменьшения ошибок можно
применить поправки Шеппарда [6]. Если
все промежутки имеют одинаковую ширину
,
то выборочная дисперсия с учетом поправки
Шеппарда вычисляется по формуле:
.
При выполнении
условия
поправкой Шеппарда можно пренебречь.
Используя свойства выборочных моментов, можно упростить расчеты численных характеристик выборки.
1) Если все выборочные
значения
уменьшить на одно и то же постоянное
число
,
то выборочное среднее уменьшится на
это же число
,
а все центральные выборочные моменты
не изменятся. Это свойство используется
при вычислении выборочных моментов: из
каждого значения
вычитается величина близкая к среднему
(ложный нуль), что равносильно изменению
начала отсчета.
2) Если все выборочные
значения
умножить на одно и то же постоянное
число
,
то начальные и центральные выборочные
моменты
-го
порядка умножаться на
.
В реальных задачах (см. параграф 2.4) оба свойства обычно используют одновременно.