- •Математическая статистика оглавление
- •1. Вариационный ряд. Статистические распределения. Эмпирическая функция распределения. Графическое представление статистических распределений
- •2. Выборочные характеристики статистических распределений
- •3. Точечные и интервальные оценки параметров распределения
- •4. Проверка гипотезы о нормальном распределении генеральной совокупности
- •5. Парная линейная корреляционная зависимость. Парный линейный коэффициент корреляции, проверка его значимости. Линейное уравнение регрессии
- •Приложения
2. Выборочные характеристики статистических распределений
Для описания основных свойств статистических распределений чаще всего используют выборочные характеристики следующих двух видов:
средние;
Выборочная средняя: |
а) характеризует типичное для выборки значение признака X; б) приближенно характеризует (оценивает) типичное для генеральной совокупности значение признака X (см. п. 3.2); |
||
|
– средняя арифметическая; применяется к вариационному ряду (данные наблюдения не сгруппированы); |
||
|
– взвешенная средняя арифметическая (частоты mi , и частости wi называют весами); используется, если данные сгруппированы; непосредственно применима только к статистическому распределению дискретного признака (дискретному ряду). |
||
|
|||
Структурные (порядковые) средние. |
Если
|
||
хме = хj+1 , если n = 2j+1 – нечетное. |
Медиана
– это серединное значение признака
X;
по определению:
|
||
хмo = xi , если mi = mmax (справедливо только для дискретного ряда). |
Мода – наиболее часто встречающееся значение признака X. |
||
2) характеристики вариации (рассеяния).
|
– выборочная
дисперсия есть
выборочная средняя арифметическая
квадратов отклонений значений признака
X
от выборочной средней
|
|||
|
– выборочная дисперсия; применяется к вариационному ряду (данные наблюдения не сгруппированы); |
|||
|
– выборочная взвешенная дисперсия; используется, если данные сгруппированы; непосредственно применима только к статистическому распределению дискретного признака (дискретному ряду); |
|||
|
– средний квадрат есть выборочная средняя арифметическая квадратов значений признака X (для вариационного ряда и для дискретного распределения соответственно). |
|||
|
– выборочное среднее квадратическое отклонение есть арифметическое значение корня квадратного из дисперсии; оно показывает, на сколько в среднем отклоняются значения xj признака X от выборочной средней . |
|||
|
||||
R = хmax – хmin |
– размах вариации. |
|||
|
– коэффициент вариации; применяют для сравнения вариации признаков сильно отличающихся по величине, или имеющих разные единицы измерения (разные наименования). |
|||
Замечание.
Если исходный вариационный ряд недоступен,
приведенные выше формулы вычисления
выборочных характеристик, применимые
только к дискретному ряду, могут быть
использованы для приближенного
вычисления выборочных характеристик
непрерывного признака, представленного
интервальным рядом. Для этого предварительно
каждый интервал xi–1–xi
заменяется его серединой
= (xi–1+ xi) / 2,
то есть производится замена интервального
ряда дискретным, соответствующим ему
приближенно.
Пример 5. Найти числовые характеристики распределения предприятий по числу работающих (пример 1).
Решение. Признак Х – число работающих (чел.) на предприятии. Для расчета характеристик данного распределения удобнее использовать таблицу:
Число работающих на предприятии, (хi ,чел.) |
Число предприятий (mi) |
хi mi |
Н(хi) |
(хi
– |
хi2 mi |
150 250 350 450 550 650 750 |
1 3 7 30 19 15 5 |
150 750 2450 13500 10450 9750 3750 |
0 1 4 11 41 60 75 |
129600 202800 179200 108000 30400 294000 288000 |
22500 187500 857500 6045000 5747500 6337500 2812500 |
Итого |
80 |
40800 |
- |
1232000 |
22040000 . |
510
(чел.) – среднее число работающих на
предприятии.
Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = xi при Н(хi) + 1 j Н(хi+1). Для рассматриваемого примера: xj = 450 при 12 j 41.
Объем выборки n = 80 – число четное. Пусть n = 2j , тогда j = 40. Поэтому:
450
(чел.).
Частота достигает максимума: mi = mmax = 30 при xi = 450, поэтому:
хмо = 450 (чел.).
Очевидно хмo хме – распределение асимметричное (см. рис. 1).
R = хmax – хmin = 750 – 150 = 600 (чел.).
Дисперсию рассчитываем двумя способами.
1)
2)
=
275500 – (510)2
= 15400.
(численность
работающих на каждом предприятии
отклоняется от средней численности в
среднем на 124 чел.)
24,3 %.
На практике считают,
что если
33 %
, то совокупность однородная. В данном
случае исследуемая совокупность
однородная.
Пример 6. Найти числовые характеристики распределения затрат времени на обработку одной детали (пример 2).
Решение. Признак Х – затраты времени на обработку одной детали (мин) – непрерывный. Распределение задано интервальным рядом. Характеристики такого ряда находят по тем же формулам, что и для дискретного ряда, предварительно заменив интервальный ряд дискретным. Для этого каждый интервал xi–1–xi заменяется его серединой . Расчеты представим в таблице:
Затраты времени на обработку 1 детали (Х, мин): xi–1–xi |
Число рабочих (mi) |
|
mi |
Н( ) |
|
( )2 mi |
22–24 24–26 26–28 28–30 30–32 32–34 |
2 12 34 40 10 2 |
23 25 27 29 31 33 |
46 300 918 1160 310 66 |
0 2 14 48 88 98 |
50 108 34 40 90 50 |
1058 7500 24786 33640 9610 2178 |
Итого |
100 |
- |
2800 |
- |
372 |
78772 . |
28 (мин) – среднее
время на обработку одной детали.
Легко убедиться,
что в случае дискретного признака Х
в ранжированном вариационном ряду xj =
при Н(
) + 1 j Н(
).
Для рассматриваемого примера:
xj
= 29 при
49 j 88.
Объем выборки n = 100 – число четное. Пусть n = 2j , тогда j = 50. Поэтому:
29
(мин).
Частота достигает максимума: mi = mmax = 40 при xi = 29, поэтому:
хмо = 29 (мин).
Очевидно хмo хме – распределение асимметричное (см. рис. 2).
R = хmax – хmin = 34 – 22 = 12 (мин).
Дисперсию рассчитываем двумя способами.
1)
;
2)
;
= 787,72 – (28)2 = 3,72.
1,93
(мин), то есть затраты времени на обработку
одной детали каждым рабочим отклоняются
от средних затрат времени в среднем на
1,93 мин.
– совокупность
однородная.
