Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая_статистика._Конспект_лекций_33_с...doc
Скачиваний:
9
Добавлен:
01.05.2025
Размер:
1.43 Mб
Скачать

2. Выборочные характеристики статистических распределений

Для описания основных свойств статистических распределений чаще всего используют выборочные характеристики следующих двух видов:

  1. средние;

Выборочная средняя:

а) характеризует типичное для выборки значение признака X;

б) приближенно характеризует (оценивает) типичное для генеральной совокупности значение признака X (см. п. 3.2);

средняя арифметическая; применяется к вариационному ряду (данные наблюдения не сгруппированы);

взвешенная средняя арифметическая (частоты mi , и частости wi называют весами); используется, если данные сгруппированы; непосредственно применима только к статистическому распределению дискретного признака (дискретному ряду).

Структурные (порядковые) средние.

Если  = хмo = хме , то распределение симметричное. При нарушении симметрии равенство нарушается (хотя бы одно).

, если n = 2j – четное;

хме =  хj+1 , если = 2j+1 – нечетное.

Медиана – это серединное значение признака X; по определению: .

хмo = xi , если m= mmax (справедливо только для дискретного ряда).

Мода – наиболее часто встречающееся значение признака X.

2) характеристики вариации (рассеяния).

выборочная дисперсия есть выборочная средняя арифметическая квадратов отклонений значений признака X от выборочной средней (равна “среднему квадрату без квадрата средней”):

выборочная дисперсия; применяется к вариационному ряду (данные наблюдения не сгруппированы);

выборочная взвешенная дисперсия; используется, если данные сгруппированы; непосредственно применима только к статистическому распределению дискретного признака (дискретному ряду);

средний квадрат есть выборочная средняя арифметическая квадратов значений признака X (для вариационного ряда и для дискретного распределения соответственно).

выборочное среднее квадратическое отклонение есть арифметическое значение корня квадратного из дисперсии; оно показывает, на сколько в среднем отклоняются значения xj признака X от выборочной средней .

R = хmax  хmin

размах вариации.

коэффициент вариации; применяют для сравнения вариации признаков сильно отличающихся по величине, или имеющих разные единицы измерения (разные наименования).

Замечание. Если исходный вариационный ряд недоступен, приведенные выше формулы вычисления выборочных характеристик, применимые только к дискретному ряду, могут быть использованы для приближенного вычисления выборочных характеристик непрерывного признака, представленного интервальным рядом. Для этого предварительно каждый интервал xi–1xi заменяется его серединой  = (xi–1+ xi) / 2, то есть производится замена интервального ряда дискретным, соответствующим ему приближенно.

Пример 5. Найти числовые характеристики распределения предприятий по числу работающих (пример 1).

Решение. Признак Х – число работающих (чел.) на предприятии. Для расчета характеристик данного распределения удобнее использовать таблицу:

Число работающих на предприятии, (хi ,чел.)

Число предприятий (mi)

хi mi

Н(хi)

(хi )2 mi

хi2 mi

150

250

350

450

550

650

750

1

3

7

30

19

15

5

150

750

2450

13500

10450

9750

3750

0

1

4

11

41

60

75

129600

202800

179200

108000

30400

294000

288000

22500

187500

857500

6045000

5747500

6337500

2812500

Итого

80

40800

-

1232000

22040000 .

510 (чел.) – среднее число работающих на предприятии.

Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj xi при Н(хi) + 1  j  Н(хi+1). Для рассматриваемого примера: xj = 450 при 12  j  41.

Объем выборки n = 80 – число четное. Пусть n = 2j , тогда j = 40. Поэтому:

450 (чел.).

Частота достигает максимума: mi = mmax = 30 при xi = 450, поэтому:

хмо = 450 (чел.).

Очевидно хмo хме  – распределение асимметричное (см. рис. 1).

R = хmax – хmin = 750 – 150 = 600 (чел.).

Дисперсию рассчитываем двумя способами.

1)

2)

= 275500 – (510)2 = 15400.

(численность работающих на каждом предприятии отклоняется от средней численности в среднем на 124 чел.)

 24,3 %.

На практике считают, что если   33 % , то совокупность однородная. В данном случае исследуемая совокупность однородная.

Пример 6. Найти числовые характеристики распределения затрат времени на обработку одной детали (пример 2).

Решение. Признак Х – затраты времени на обработку одной детали (мин) – непрерывный. Распределение задано интервальным рядом. Характеристики такого ряда находят по тем же формулам, что и для дискретного ряда, предварительно заменив интервальный ряд дискретным. Для этого каждый интервал xi–1xi заменяется его серединой . Расчеты представим в таблице:

Затраты времени на обработку 1 детали (Х, мин): xi–1xi

Число рабочих (mi)

mi

Н( )

( )2 mi

22–24

24–26

26–28

28–30

30–32

32–34

2

12

34

40

10

2

23

25

27

29

31

33

46

300

918

1160

310

66

0

2

14

48

88

98

50

108

34

40

90

50

1058

7500

24786

33640

9610

2178

Итого

100

-

2800

-

372

78772 .

28 (мин) – среднее время на обработку одной детали.

Легко убедиться, что в случае дискретного признака Х в ранжированном вариационном ряду xj = при Н( ) + 1  j  Н( ). Для рассматриваемого примера: xj = 29 при 49  j  88.

Объем выборки n = 100 – число четное. Пусть n = 2j , тогда j = 50. Поэтому:

29 (мин).

Частота достигает максимума: mi = mmax = 40 при xi = 29, поэтому:

хмо = 29 (мин).

Очевидно хмo хме  – распределение асимметричное (см. рис. 2).

R = хmax – хmin = 34 – 22 = 12 (мин).

Дисперсию рассчитываем двумя способами.

1) ;

2) ;

= 787,72 – (28)2 = 3,72.

  1,93 (мин), то есть затраты времени на обработку одной детали каждым рабочим отклоняются от средних затрат времени в среднем на 1,93 мин.

– совокупность однородная.