Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2978

.pdf
Скачиваний:
2
Добавлен:
15.11.2022
Размер:
2.15 Mб
Скачать

Таблица 5.1

Характеристики ряда распределения коэффициента использования по времени

Коэф. использования по времени

 

 

 

 

 

 

 

i

 

 

в

 

 

 

 

Плотность распределения р

 

 

Среднее арифметическое К

i

i

н

н

 

 

 

 

i

i

Границы интервалов

Номер интервала

ЧастотаF

Частостьf

Накопленная частота F

Накопленная частость f

0,665

0,665

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,666

0,6913

1

0,6655

2

0,0833

2

0,0833

3,16

 

 

 

 

 

 

 

 

 

0,706

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,714

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,714

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,717

0,7177

2

0,7128

4

0,1667

6

0,2500

6,33

 

 

 

 

 

 

 

 

 

0,718

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,725

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,725

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,725

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,727

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,733

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,734

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,735

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,739

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,74

0,744

3

0,7301

10

0,4167

16

0,6667

15,82

 

 

 

 

 

 

 

 

 

0,746

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,757

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,759

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,764

0,7703

4

0,7565

4

0,1667

20

0,8333

6,33

 

 

 

 

 

 

 

 

 

0,772

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,78

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,787

0,7967

5

0,7797

3

0,1250

23

0,9583

4,75

 

 

 

 

 

 

 

 

 

0,823

0,823

6

0,8230

1

0,0417

24

1,0000

1,58

 

 

 

 

 

 

 

 

 

На рис. 5.1 приведена эмпирическая гистограмма плотности распределения коэффициента использования по времени и ее качественная аппроксимация законом нормального распределения.

31

Рис. 5.1. Гистограмма (1) и аппроксимация гистограммы (2) плотности распределения вероятности коэффициента использования по времени

6. Показатели выборок

Числовые показатели случайных величин условно разделяются на основные и вспомогательные. К основным относятся показатели положения случайной величины и показатели рассеяния. Показатели положения определяют некоторую точку на числовой оси, вокруг которой группируются возможные значения случайной величины. К ним относят: математическое ожидание, моду и медиану случайной величины. Показатели рассеяния являются некоторой мерой разброса возможных значений случайной величины около своего центра рассеяния, например математического ожидания. Показателями рассеяния являются среднее линейное отклонение, дисперсия и вероятное отклонение случайной величины.

К дополнительным показателям относят: асимметрию (скошенность), эксцесс (островершинность) закона распределения случайной величины и коэффициент вариации случайной величины, который характеризует относительный разброс возможных значений случайной величины.

Числовые показатели случайных величин, найденные на основе экспериментальных данных, называются точечными оценками этих характеристик или эмпирическими характеристиками. Покажем определение этих оценок на примере простого вариационного ряда.

Оценкой математического ожидания случайной величины служит среднее арифметическое значение элементов выборки:

32

1,25d .

1n

xn xi .

in

(6.1)

Среднее линейное отклонение. Среднее линейное отклонение представляет собой среднюю арифметическую величину из абсолютных значений отклонений отдельных вариантов xi от средней арифметической x ряда. Его величина определяется формулой

d

xi x

.

n

 

 

(6.2)

Меру вариации (изменчивости признака) более объективно отражает показатель дисперсии. Дисперсия, или средний квадрат отклонений, равна:

 

 

 

(xi x)

2

 

2

 

.

 

n

 

 

 

 

(6.3)

Дисперсия показывает разброс выборки, ее однородность, но она несоизмерима со средней величиной, поэтому введено стандартное отклонение или среднее квадратическое отклонение

 

(xi x)

2

 

.

n

 

 

(6.4)

Среднее квадратическое отклонение является наиболее распространенным и общепринятым показателем рассеяния случайной величины. Оно несколько больше среднего линейного отклонения. Для умеренно асимметричных распределений установлено следующее соотношение между ними:

(6.5)

Стандартное отклонение определяется в единицах измерения самой случайной величины, оно равно корню квадратному из дисперсии случайной величины. Стандартное отклонение используют при расчете стандартной ошибки среднего арифметического, при построении доверительных интервалов, при статистической проверке гипотез, при измерении линейной взаимосвязи между случайными величинами.

Несмещенная оценка среднеквадратического отклонения (стандарт) s случайной величины x относительно ее математического ожидания определяется по формуле

33

 

i n

x

2

 

 

 

 

 

 

x

 

 

 

 

s

i 1

i

 

n

 

2

 

 

.

 

 

 

 

 

 

 

 

 

 

n 1

n 1

 

 

 

(6.6)

Коэффициент вариации используют для сравнения рассеивания двух и более признаков, имеющих различные единицы измерения. Коэффициент вариации представляет собой относительную меру рассеивания, выраженную в процентах. Он вычисляется по формуле

Если

K

v

 

Kv

 

 

100 %.

(6.7)

x

 

 

 

 

больше 33 %, то это говорит о большой изменяемо-

сти признака.

Мода Мod (х) – наиболее часто встречающаяся величина, которая определяется по гистограмме или полигону частот. В дискретном ряду мода – это вариант с наибольшей частотой (например, наибольшим спросом обуви пользуется 37-й размер, т.е. это именно то число, которое в действительности встречается чаще всего).

В интервальном ряду модой приближенно считают центральный вариант модального интервала, т.е. того интервала, который имеет наибольшую частоту.

Медиана Мed (х) – величина, которая делит выборку пополам (до медианы и после количество объектов одинаково). Ряд сортируется в порядке возрастания (ранжируется), для нечетной выборки медианой является вариант, расположенный в центре ряда.

Если выборка симметрична, то x = Мod (х) = Мed (х). Для интервального ряда медиана находится по данным о накопленных частотах: медиана делит выборку пополам, следовательно, она расположена там, где накопленная частота составляет половину или больше половины всей суммы частот.

Асимметрия характеризует степень симметричности выборки. Величина асимметрии показывает степень смещения выборки

влево или вправо от средней арифметической ряда:

 

А = М3 / 3,

(6.8)

34

где

 

 

 

x

x

 

 

 

 

3

М

 

=

i

 

3

n

 

 

 

 

 

– центральный момент третьего порядка.

При А 0 выборка смещена влево, при А 0 – вправо, при А 0 выборка симметрична. Если величина асимметрии находится в пределах отрезка –1,0518 ≤ А ≤ 1,0518, то она не выходит за пределы нормальной.

Эксцесс определяет островершинность симметричного распределения:

Е = (М4 / σ4) – 3,

(6.9)

где М 4 = xi x 4 – центральный момент четвертого порядка. n

Если Е 0, то выборка островершинная; если Е 0 – плосковершинная; если Е = 0 – выборка подчиняется нормальному закону распределения. При значении 0 < Е ≤ 4 выборка имеет эксцесс в пределах нормы.

Если величины А и Е находятся в пределах нормы, то эмпирическое (полученное по статистическим данным) распределение согласуется с нормальным законом распределения частот. Это предварительная оценка статистических данных.

Задача 3. Расчет элементарных статистик вариационного ряда: средней арифметической, дисперсии, среднего квадратического (стандартного) отклонения, коэффициента вариации, асимметрии, эксцесса, ошибок вычисленных статистик для коэффициентов использования по времени, коэффициентов готовности, коэффициентов технического использования, коэффициентов эффективности и времени наработки на отказ.

На основе табличных данных своего варианта требуется:

1.Создать файл для обработки.

2.Рассчитать среднюю арифметическую.

3.Рассчитать отклонение аргумента от средней арифметиче-

ской.

4.Рассчитать дисперсию, среднее квадратическое (стандартное) отклонение и коэффициент вариации.

5.Рассчитать асимметрию.

6.Рассчитать эксцесс.

35

7. Проанализировать результаты расчета.

В табл. 6.1 приводится пример определения промежуточных данных для расчета числовых показателей ряда распределения коэффициента использования по времени на основе данных табл. 2.1, а именно: суммы членов ряда и суммы отклонений от среднего арифметического в степенях 1, 2, 3, 4. Табл. 6.2 содержит основные числовые характеристики приведенного вариационного ряда,

вычисленные по формулам (6.1), (6.3), (6.4), (6.6)–(6.9).

Таблица 6.1

Предварительные данные расчета элементарных статистик для ряда коэффициента использования по времени

Номер

Коэф.

Отклоне-

Квадрат

Куб

 

Четвертая

использова-

 

степень

значения

ние

отклонения

отклонения

отклонения

в ряду i

ния по вре-

(xi x)

(xi x)

2

(xi x)

3

мени xi

 

 

(xi x)

4

 

 

 

 

 

 

 

 

 

 

1

0,665

–0,07129

0,0050823

–0,0003623

2,5829E-05

2

0,666

–0,07029

0,0049407

–0,0003473

2,441E-05

3

0,706

–0,03029

0,0009175

–2,779E-05

8,4178E-07

4

0,714

–0,02229

0,0004968

–1,107E-05

2,4685E-07

5

0,714

–0,02229

0,0004968

–1,107E-05

2,4685E-07

6

0,717

–0,01929

0,0003721

–7,178E-06

1,3846E-07

7

0,718

–0,01829

0,0003345

–6,118E-06

1,1191E-07

8

0,725

–0,01129

0,0001275

–1,439E-06

1,6247E-08

9

0,725

–0,01129

0,0001275

–1,439E-06

1,6247E-08

10

0,725

–0,01129

0,0001275

–1,439E-06

1,6247E-08

11

0,727

–0,00929

8,63E-05

–8,018E-07

7,4484E-09

12

0,733

–0,00329

1,082E-05

–3,561E-08

1,1716E-10

13

0,734

–0,00229

5,244E-06

–1,201E-08

2,7501E-11

14

0,735

–0,00129

1,664E-06

–2,147E-09

2,7692E-12

15

0,739

0,00271

7,344E-06

1,9903E-08

5,3936E-11

16

0,74

0,00371

1,376E-05

5,1065E-08

1,8945E-10

17

0,746

0,00971

9,428E-05

9,155E-07

8,8895E-09

18

0,757

0,02071

0,0004289

8,8826E-06

1,8396E-07

19

0,759

0,02271

0,0005157

1,1713E-05

2,6599E-07

20

0,764

0,02771

0,0007678

2,1277E-05

5,8958E-07

21

0,772

0,03571

0,0012752

4,5538E-05

1,6261E-06

22

0,78

0,04371

0,0019106

8,3511E-05

3,6503E-06

23

0,787

0,05071

0,0025715

0,0001304

6,6126E-06

24

0,823

0,08671

0,0075186

0,00065194

5,653E-05

Сумма

17,671

4E-05

0,02823096

0,000176247

0,000121349

36

Таблица 6.2

Элементарные статистики для ряда коэффициента использования по времени

Показатель

Величина

 

 

Среднее арифметическое значение

0,7362916

 

 

Дисперсия

0,00117629

 

 

Среднее квадратическое отклонение

0,034297083

 

 

Стандартное отклонение

0,035034740

 

 

Коэффициент вариации

4,658083882

 

 

Эксцесс

0,654243793

 

 

Асимметрия

0,18202879

 

 

Центральный момент первого порядка

0,00000167

 

 

Центральный момент второго порядка

0,0011763

 

 

Центральный момент третьего порядка

0,00000734

 

 

Центральный момент четвертого порядка

0,00000506

 

 

Полученные результаты показывают, что параметры асимметрии и эксцесса находятся в пределах нормы. Это позволяет сделать вывод о том, что вариационный ряд подчинен нормальному закону распределения вероятностей.

7. Многофакторные математические модели показателей

При изучении многомерных случайных величин знание математических ожиданий, дисперсий и других характеристик отдельных компонент случайной величины не позволяет делать выводы о существовании статистической связи между этими компонентами, которая может носить как линейный, так и нелинейный характер.

Изучение линейной связи между величинами является наиболее простой задачей при исследовании статистической зависимости между величинами X и Y. Для измерения силы линейной связи используется линейный коэффициент корреляции:

r

Kxy

,

(7.1)

 

xy

x y

 

 

 

 

 

где Kxy – ковариационный момент или просто ковариация случайных величин; σx, σy – стандартные отклонения величин.

37

При рассмотрении совокупности n случайных величин (n > 2) используется корреляционная матрица – матрица, составленная

из коэффициентов корреляции

rij (i 1,

, n; j 1,

, n).

Корре-

ляционная матрица более наглядно представляет линейные связи между рассматриваемыми величинами.

Для построения многофакторных математических моделей используется шаговый регрессионный метод, который заключается в следующем [10]. Сначала строится корреляционная матрица, и в регрессионное уравнение включается переменная, наиболее коррелируемая с откликом. Для включения в уравнение выбирается переменная с наибольшим квадратом частного коэффициента корреляции и т.д.

Для проверки введенных на раннем шаге переменных на предмет их взаимосвязи с другими переменными на каждом шаге вычисляется частный F-критерий для каждой переменной уравнения и сравнивается с заранее избранной процентной точкой соответствующего F-распределения Фишера. Это позволяет оценить вклад переменной в предположении, что она введена в модель последней, независимо от момента ее фактического введения. Переменная, дающая незначительный вклад, исключается из модели. Этот процесс продолжается до тех пор, пока не будут рассмотрены все переменные.

Общий F-критерий Фишера служит для определения статистической значимости модели, рассматриваемой на каждом этапе. Он рассчитывается следующим образом:

F =

Средний квадрат, обусловленный регрессией

Средний квадрат, обусловленный остатком

 

.

(7.2)

Для сравнения влияния и установления относительной важности каждого из факторов используется нормирование коэффициентов регрессии:

bi = ai Sxi /Syi ,

(7.3)

где bi – коэффициент уравнения регрессии после нормирования; ai – коэффициент уравнения регрессии до нормирования; Sxi – средняя квадратическая ошибка переменной Хi; Syi – средняя квадратическая ошибка отклика Yi.

38

Нормирование коэффициентов регрессии возможно лишь при случайных переменных Хi.

Далее для полученной модели строится вектор ошибок и проверяется его соответствие закону нормального распределения, что является необходимым условием для использования критериев t и F при получении доверительных интервалов.

Проверка принадлежности вектора ошибок закону нормального распределения осуществляется с помощью критерия согласия Пирсона χ2. Для этого строится эмпирическое распределение вектора ошибок, определяется значение χ2, и в соответствии с выбранным уровнем надежности критерия (чаще всего выбирается = 0,05 (95 %) или = 0,01 (99 %)) по таблицам определяется теоретическое значение 2 .

Если χ2

2

то нет оснований отвергнуть гипотезу о нор-

= ,

мальности распределения вектора ошибок.

Для проверки неадекватности модели используют средний квадрат ошибки S2 как оценку величины 2, предполагая, что модель правильна. Если эти величины отличаются на порядок и более, делается вывод о неадекватности модели.

Проверка значимости уравнения регрессии (для нулевой гипотезы Н0: b1 = b2 = ... = 0) производится с помощью отношения средних квадратов SS (R / b0)/(р – 1), которое рассматривается как распределенная случайная величина F(р – 1, ν), где SS (R / b0) – сумма квадратов с учетом поправки на оценку коэффициента модели b0; р – число степеней свободы регрессии; ν = (n – р) – число степеней свободы вектора ошибок; n – количество вариантов, для которых строится модель.

Для статистически значимого уравнения регрессии дисперсионное отношение должно превосходить теоретическое значение F(р – 1, ν, 1 – ) с заданным уровнем значимости .

Число наблюдений равно числу расчетов в соответствующей задаче. Уровень риска β для доверительного интервала обозначает вероятность совершения ошибки первого рода и используется для расчета доверительных интервалов уровня (1 – ) коэффициентов регрессии. Доля объясненной вариации в процентах –

39

это квадрат коэффициента множественной корреляции

r

2

.

 

xy

 

Сред-

ний отклик означает среднее арифметическое всех наблюдаемых значений отклика (переменной Y). Стандартная ошибка в процентах от среднего отклика – это мера величины стандартного отклонения остатков относительно среднего отклика, которая рассчитывается как отношение стандартного отклонения остатков к среднему отклику.

Задача 4. Предполагая линейную корреляционную связь между коэффициентами использования по времени и коэффициентами готовности, коэффициентами технического использования, коэффициентами эффективности, временем наработки на отказ, оценить тесноту и значимость связи между этими признаками.

Требуется:

1.Оценить тесноту связи между факторами с помощью линейного коэффициента корреляции.

2.Сделать вывод о характере связи и ее силе между факторным признаком (х) и результативным признаком (у) по рассчитанным коэффициентам корреляции.

3.Построить эмпирическую и теоретическую линии регрессии.

4.Выполнить оценку влияния факторного признака на результативный признак и проверку статистической значимости полученных параметров.

5.Сделать вывод.

Множественный корреляционный анализ позволяет учесть влияние многих факторов (х1, х2, х3) на результативный признак (у). По заданию необходимо провести парный регрессионнокорреляционный анализ.

Ниже приводится алгоритм расчета коэффициентов парного регрессионного уравнения

y = а + bх

(7.4)

на основе данных табл. 7.1, для случая, если результативный признак y = Кг, факторный признак х = Кв.

40

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]