10.2. Математическая статистика
Выборочный метод – статистический метод исследования общих свойств совокупности каких-либо объектов (генеральной совокупности) на основе изучения свойств лишь части этих объектов, взятых на выборку (выборочной совокупности).
Объем совокупности – количество объектов этой совокупности.
Характеристики генеральной совокупности – это теоретические характеристики изучаемой СВ.
Характеристики выборки называют выборочными (статистическими, эмпирическими, опытными). Они являются статистическими аналогами соответствующих характеристик генеральной совокупности.
Если для исследования СВ Х выполняются опыты (эксперименты), то:
- генеральная совокупность (Г.С.) – множество всех возможных значений СВ Х;
- выборочная совокупность(выборка) – множество наблюдаемых ее значений, которые называютсявариантами(x1, x2, ..., xn).
Будем обозначать: xi - значение (варианта) СВ Х,
n - число всех вариант (объем выборки).
Размах варьирования
|
R = xнаиб. – xнаим. |
10.21 |
Формула Стерджеса для определения длины x интервала статистического ряда
|
|
10.22 |
Количество k интервалов статистического ряда определяется по формулам:
|
|
10.23 |
Относительная частота (частость) значния хi
(статистическая вероятность)
|
где ni – частота значения хi; n – число всех вариант. |
10.24 |
Эмпирическая (статистическая) функция распределения
|
где nx – число выборочных значений хi, меньших х. |
10.25 |
Выборочное
среднее
![]()
(несмещенная, состоятельная оценка математического ожидания mx)
|
|
10.26 |
где k – число интервалов (разрядов) в сгруппированном статистическом ряде.
Выборочная
дисперсия
![]()
|
а)
|
|
|
или |
10.27 |
|
|
|
|
|
|
|
б)
|
|
|
или |
10.28 |
|
|
|
"Исправленная"
выборочная дисперсия (s2)
(несмещенная, состоятельная оценка дисперсии 2 Г.С.)
|
|
10.29 |
|
|
|
|
|
10.30 |
Замечание.
При большом объеме выборки
Поэтому на практике исправленной
дисперсией пользуются при малых объемах
выборки (n
< 20
30).
Выборочное среднее квадратическое отклонение
(стандартное отклонение)
|
|
10.31 |
|
|
10.32 |
|
|
|
|
Выборочный коэффициент вариации |
|
|
|
10.33 |
|
|
|
|
Выборочный центральный момент k -го порядка
|
|
|
|
10.34 |
|
|
|
|
Выборочные коэффициенты
|
|
|
а)
ассиметрии
|
10.35 |
|
|
|
|
б)
эксцесса
|
10.36 |
Мода М0 – варианта, имеющая наибольшую частоту.
Медиана Ме – варианта, делящая статистический ряд на две равные части.
Точечные оценки параметров Г.С. (mx, x2, x)
Обозначим:
-
оценка параметра.
|
а)
|
- (см. формулу 10.26); |
|
|
|
|
б)
|
- смещенная оценка дисперсии, применяют при большом объеме выборки (см. формулы 10.27 и 10.28); |
|
|
|
|
в)
|
- несмещенная оценка дисперсии; применяют при малом объеме выборки (n < 20 30). |
Интервальные оценки параметров Г.С.
Если
то
с надежностью.
В этом случае: - доверительная вероятность (надежность);
- доверительный
интервал для mx;
- предельная
погрешность оценки mx
по выборочной
средней
.
Построение доверительного интервала для математического ожидания mx с надежностью
1) Пусть генеральная совокупность (Г.С.) имеет нормальное распределение.
а) Если известна дисперсия 2 генеральной совокупности, то
|
и |
10.37 |
|
|
|
Здесь t - корень уравнения = 2Ф(t);
Ф(t) - функция Лапласа (см. прил. 1).
б) Если неизвестна дисперсия 2 генеральной совокупности, то
|
|
10.38 |
|
|
|
|
|
|
Здесь = 1 - ; = n – 1 - число степеней свободы;
s - "исправленное" стандартное отклонение;
t , n-1 - квантиль распределения Стьюдента (см. прил. 3).
в) Из правила "трех сигм" следует простая (но менее точная) формула для :
|
|
10.39 |
2) Если распределение Г.С. отличается от нормального, то
а) при большом
объеме выборки применяют формулу
(10.37), заменив
его точечной
оценкой
;
б) при малом объеме выборки применяют формулу (10.38).
Для любого распределения
|
pi = P(xi-1 < X < xi) = F(xi) – F(xi-1) |
10.40 |
Для нормального распределения
|
pi = P(xi-1 < X < xi) = Ф(ui) – Ф(ui-1), |
10.41 |
где
![]()
(Функция Лапласа).
