Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1674

.pdf
Скачиваний:
0
Добавлен:
07.01.2021
Размер:
1.54 Mб
Скачать

Полученные в табл. 21 суммы используем для определения в0 и в1, применяя формулы (164) и (165).

 

 

в

9 144004,8 2817 451,7

 

23604,3

0,437.

 

 

 

 

 

1

9 887721 (2817)2

54000

 

 

 

 

 

 

 

в0

 

451,7 887721 14400,8 2817

 

 

46779459

86,63.

 

 

 

 

 

54000

 

54000

 

На основании проведенных расчетов имеем следующую зависимость растворимости порошкообразного вещества от температуры растворителя:

y€ 0,437 x 86,63.

Проверим сходимость результатов, полученных по рассчитанному уравнению регрессии и фактически имеющих место в результате соответ-

ствующего опыта.

y€ 0,437 293 86,63 41,4,

 

Итак, если х=293К, то

а фактически

y=41,2 г/100г.

y€=50,15 ,

 

 

х=313К;

фактически

y=50,0;

x=343K;

y€=63,26 ,

фактически

y=64,3.

Из вышеприведенных расчетов видно, что рассматриваемое отклонение не превышает 1,04 г/100г растворителя.

Приемлемо ли такое отклонение? Ответ на этот вопрос дает статистический анализ уравнения регрессии, который является следующей темой рассмотрения.

2.8.2. Статистический анализ уравнения регрессии

Уравнение регрессии, полученное путем обработки статистических данных методом наименьших квадратов, в самом общем случае не может дать одни и те же результаты, что и реальный объект исследования, поскольку, с одной стороны, существует погрешность приборов, которыми измеряются соответствующие величины параметров реального объекта, а с другой стороны, аналитический вид зависимости (математическая модель) носит приближенный характер.

По результатам обработки статистических данных методом наименьших квадратов получают уравнение регрессии в виде полинома – отрезка ряда Тейлора:

ув0 вixi вij xi xj вjj(x2j

a) ... ,

(170)

i 1

ij

j

 

 

где в0, вi, вij, вjj – свободный член, коэффициенты, соответствующие эффектам линейного, бинарного и квадратичного взаимодействий соответственно; а – константа.

109

После того, как получено уравнение регрессии, необходимо осуществить его статистический анализ, включающий в себя проверку значимости коэффициентов и адекватности уравнения регрессии. Адекватность означает соответствие расчетных данных, полученных с помощью уравнения регрессии, фактическим экспериментальным данным объекта исследования. Совокупность этих проверок носит название регрессивного анализа. Существуют следующие условия применения регрессивного анализа:

1.Отклонение в определении величины отклика Y связано с тем, что не учтены все действующие факторы на объект, поэтому некоторые из них не вошли в уравнение регрессии.

2.Величина Y распределена по нормальному закону.

3.Независимые переменные или факторы Х определяются с пренебрежимо малой ошибкой.

4.Выборочные дисперсии однородны.

Если выборочные дисперсии однородны, то дисперсия воспроизводимости рассчитывается по формуле

N

Si2

Sвоспр2

i 1

.

(171)

 

 

N

 

Число степеней свободы этой дисперсии равно

f N (m 1),

(172)

где N – число опытов в данном эксперименте; т – число повторений опытов.

Дисперсия воспроизводимости необходима для оценки значимости коэффициентов уравнения регрессии, которая осуществляется по критерию Стьюдента или с помощью так называемого t – отношения.

tj

 

вj

 

,

(173)

 

 

 

j

 

 

 

где tj – расчетная величина критерия Стьюдента для j-го коэффициента уравнения регрессии; вj j-й коэффициент уравнения регрессии; j - среднеквадратическое отклонение при определении j-го коэффициента, определяемое по формуле

 

N

в

j

 

2

 

 

 

 

 

2

 

j

 

 

Si .

(174)

 

yi

 

 

i 1

 

 

 

Обычно принято считать, что среднеквадратическое отклонение при определении j-го коэффициента рассчитывается по формуле накопления

110

ошибок.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если

выборочные

 

 

дисперсии равны между

собой, т.е.

S2

S2 ... S2

S2

, то получим для линейной регрессии формулу

1

2

i

воспр

 

 

 

 

 

 

 

 

 

 

 

 

(174) в следующем виде:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sвоспр2

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi2

 

 

 

 

 

 

 

 

 

Sв0

 

 

 

 

i 1

 

 

 

;

(175)

 

 

 

 

 

N

N

 

 

 

 

 

 

 

 

 

 

 

N xi2

( xi )2

 

 

 

 

 

 

 

 

 

i 1

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sв

 

 

 

Sвоспр2 N

 

.

(176)

 

 

 

 

 

N

N

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N xi2 ( xi )

2

 

 

 

 

 

 

 

 

 

 

 

 

 

i 1

i 1

 

 

 

 

 

 

Если расчетная величина критерия Стьюдента больше его табулированного значения tp(f), определяемого по справочнику для выбранного уровня значимости и числа степеней свободы f (см. прил.3), т.е. если

tj>t ( f ), то коэффициент вj значимо отличается от нуля и равен нулю во

всех остальных случаях.

После этой проверки незначимые коэффициенты исключаются из уравнения регрессии (170), а оставшиеся коэффициенты пересчитываются вновь, поскольку они взаимно коррелированны.

Проверка адекватности, т.е. соответствия полученной математической модели (уравнения регрессии) реальному объекту исследования, осуществляется с использованием критерия Фишера или, иначе говоря, F-отношения, рассчитываемого по формуле

S2

F ост . (177)

Sвоспр2

Критерий Фишера – это есть отношение остаточной дисперсии к дисперсии воспроизводимости.

N

(yi yi)2

Sост2

i 1

 

,

(178)

 

 

 

 

N

 

где yi– величина i-го отклика, полученная с использованием исследуемого уравнения регрессии (170); уi – экспериментальная величина i-го отклика; (N – ) – степень свободы остаточной дисперсии; N – объем выборки, т.е. число опытов в рассматриваемом эксперименте; – число значимых ко-

111

эффициентов в уравнении регрессии (170). Если отношение (177) меньше табличного, определяемого по справочнику (прил.5), т.е., если F<F (f1;f2)

для степеней свободы f1 =N–1 и f2=N– и уровня значимости , то исследуемое уравнение регрессии адекватно реальному объекту и не соответствует ему во всех остальных случаях.

В условиях, когда нет возможности определить дисперсию воспроизводимости, т.е. отсутствуют параллельные опыты, качество аппроксимации исследуемой зависимости принятым уравнениям регрессии все-таки можно оценить, сравнив остаточную дисперсию с дисперсией относитель-

но среднего Sy2

N

(yi yi)2

Sy2

i 1

 

(179)

 

 

по критерию Фишера

N 1

 

 

Fрасч

Sy2

.

(180)

Sост2

 

 

 

В данном случае критерий Фишера показывает, во сколько раз уменьшается рассеяние относительно полученного уравнения регрессии по сравнению с рассеянием относительно среднего и чем больше F превышает табличное F ( f1; f2)для выбранного уровня значимости и вычислен-

ных степеней свободы f1; f2 (см. прил.5), тем эффективнее полученное уравнение регрессии.

Необходимо особо отметить, что проверке на адекватность подвергается уравнение регрессии, включающее только значимые коэффициенты. Это обстоятельство дает возможность чаще всего снизить величинучисло связей, налагаемых на выборку, которое для рассматриваемого случая равно количеству значимых коэффициентов уравнения (170).

Пример. Допустим, необходимо исследовать влияние четырех факторов xi на величину отклика y. В результате обработки статистических данных получено уравнение регрессии в следующем виде:

ув0 в1 х1 в2 х2 в3 х3 в4 х4 в12 х1 х2 в13 x1 x3 в14 х1 х4

в

23

х

2

х

в

24

х

2

х

4

в

34

х

3

х

4

в

(x2

0,8) в

22

(x2 0,8)

 

 

3

 

 

 

 

 

 

 

 

11

1

 

 

2

в33

(x32

0,8) в44(x42

0,8).

 

 

 

 

 

 

 

 

 

 

(181)

 

В табл.22 в первом столбце указывается номер варианта задания и ко-

эффициенты

в0;

в1 в4

см. столбцы

2–6,

в12 в34

столбцы 7–12 и

в11 в44

– столбцы 13 – 16.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

112

 

 

 

 

 

 

 

 

 

 

 

 

Исходные данные

 

 

 

Таблица 22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в0

в1

в2

в3

в4

в12

в13

в14

в23

в24

в34

в11

в22

1

2

3

4

5

6

7

8

9

10

11

12

13

14

 

51,52

60,38

6,4

4,7

-4,7

7,18

2,0

1,2

0,56

0,78

1,9

4,5

1,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в33

в44

j

i

jj

N

f

 

Y1

Y2

Y3

Y4

(уi уi)

 

15

16

17

18

19

20

21

22

23

24

25

26

27

 

4,09

-5,34

0,545

0,61

0,864

25

2

0,05

61,8

59,3

58,7

69,4

376,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используя данные табл.22, необходимо:

1.Составить уравнение регрессии.

2.Произвести проверку значимости коэффициентов составленного уравнения регрессии, используя заданные среднеквадратические отклоне-

ния j; ij; Sвjj (см. табл. 22, столбцы 17 – 19). При этом уровень значимости и степень свободы f заданы в табл. 22 (см. столбцы 21 и 22).

3. Произвести проверку адекватности составленного уравнения рег-

N

рессии, используя величины (уi yi)2 и число опытов N в заданном экс-

i 1

перименте, которые указаны в табл. 22 (см. столбцы 27 и 20), и данные дополнительных опытов у1 у4 (см. столбцы 23 – 26).

Решение. Согласно табл. 22 имеем следующее уравнение регрессии:

y€=61,54+17,34x1 + 6,4x2 + 4,7x3 – 4,7x4 + 2,18x1 x2 + 2x1 x2 + 1,2x1 x4+

+0,56x2

x3 + 0,79x2

x4

+ 1,9x3

x4+4,5(х2

0,8) 1,3(х2

0,8)

 

 

 

 

1

2

 

+4,09(х32 0,8) 5,34(х42 0,8).

 

(A)

Кроме того, были поставлены дополнительно четыре опыта (см. табл. 22, столбцы у1 у4) для определения дисперсии воспроизводимости:

у1=61,8; у2=59,3; у3=58,7; у4=69.

Необходимо провести регрессионный анализ полученного уравнения регрессии согласно заданию.

Работа выполняется в такой последовательности. 1. Определяем дисперсию воспроизводимости:

113

т

 

 

 

 

 

y

 

 

61,8 59,3 58,7 69

 

60,95 ;

 

 

 

 

у

 

i 1

 

 

 

 

 

 

 

m

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

(уi

 

y

)2

 

 

(61,8 60,95)2 (59,3 60,95)2 (58,7 60,95)

2

 

Sвоспр

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4 1

 

 

 

m 1

 

 

 

 

 

(69 60,95)2 5,95, 4 1

где число степеней свободы дисперсии воспроизводимости (Sвоспр2 )

f=m – 1 = 4 – 1 = 3, поскольку число повторений опыта равно 4, т.е.

т=4 (у1 у4).

2. Рассчитываем ошибки определения коэффициентов уравнения регрессии по формулам (174) – (176), что было изначально задано (см.

табл. 22, столбцы 17–19):

 

 

 

j S2вj

0,545;

ij

S2вij 0,61;

jj S2вjj 0,864.

Далее по формуле (173) определяем величину t – отношения для каждого коэффициента составленного уравнения регрессии (А):

t0

 

64,54

 

112,9;

t23

 

0,56

 

0,91;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,525

 

 

 

 

 

0,61

 

 

 

 

t

17,34

 

30,33;

t

 

 

0,79

1,29;

1

0,545

 

 

 

 

 

24

0,61

 

 

 

t2

 

6,4

 

11,7;

t34

 

1,9

3,11;

 

 

 

 

 

 

 

 

0,545

 

 

 

 

 

0,61

 

 

 

 

 

t

 

t

 

 

 

4,7

8,64;

t

 

 

4,5

 

5,2;

 

3

 

 

 

 

4

 

0,545

 

11

0,864

 

 

 

t

 

 

2,18

3,57;

t

 

 

1,3

 

1,5;

 

 

 

 

 

 

 

12

 

 

 

 

0,61

 

 

 

 

 

22

0,864

 

t

 

 

2

 

 

3,18;

t

 

 

4,09

4,73;

 

 

 

 

 

 

 

 

13

 

 

 

 

0,61

 

 

 

 

 

33

0,864

 

 

114

t

 

1,2

1,97;

t

 

 

5,34

6,82;

 

 

 

14

0,61

 

44

0,864

 

Табулированное значение критерия Стьюдента для уровня значимости0,05и числа степеней свободы f=3 равно t ( f ) 3,18 (см. прил.3).

После исключения незначимых коэффициентов в13,в14,в23,в24,в34,, в22 , для которых критерий Стьюдента, т.е. t-отношение, меньше t ( f ) и

дополнительных расчетов, связанных с раскрытием скобок, получим следующее уравнение регрессии:

y58,3 17,97x1 6,4x2 4,7x3 4,7x4 2,18x1 x2 4,5x12 4,09x32

5,34x42.

(В)

Это уравнение регрессии, включающее только значимые коэффициенты, следует проверить на адекватность реальному объекту. В нем 9 коэффициентов.

Для проверки адекватности полученного уравнения регрессии (В), содержащего только значимые коэффициенты, определяем остаточную дисперсию.

 

N

 

 

 

 

Sост2

(yi

y

i )

2

 

396,2

 

i 1

 

 

24,7 ,

N

 

 

 

 

 

25 9

поскольку N=25 (см. табл. 22, столбец 20), а число значимых коэффициентов, оставшихся в уравнении регрессии (В), равно 9, т.е. =9.

Тогда Fрасч-отношение получим согласно выражению (177).

Fрасч S2ост 24,7 4,15.

Sвоспр 5,95

Табулированное значение критерия Фишера для уровня значимости0,05и чисел степеней свободы

f2 N 25 9 16; f1=m – 1= 4 – 1 = 3.

составляет F ( f1, f2 ) 8,6 (см. прил.5).

Поскольку Fрасч F ( f1, f2), т.е. 4,15<8,68 , то полученное уравнение регрессии (В) адекватно описывает исследуемое явление – зависимость скорости автомобиля от мощности двигателя, веса автомобиля, горизонтального уклона дороги и шероховатости дорожного покрытия и может быть использовано при исследованиях скоростных характеристик автомобиля в изученном диапазоне изменения факторов.

115

Статистический анализ уравнения регрессии (А) следует производить с изложением хода рассуждений и расчетов в соответствии с приведенным примером, привести четкие выводы и дать их обоснования. Если, например, отсеяны коэффициенты уравнения регрессии, то необходимо доказать величинами расчетных и табулированного t-отношения и т.д.

3. КОНТРОЛЬНАЯ РАБОТА

Данная контрольная работа предусмотрена стандартом Министерства образования РФ и предназначена для выработки у студентов практических навыков по количественной оценке случайных явлений с целью последующего использования прогнозируемых величин в производственной и научно-исследовательской деятельности.

Здесь приведены многовариантные задания – это условия задач по теории вероятностей и математической статистике – и по 10 вариантов исходных данных по каждой задаче. Студенту необходимо выписать условия задач, заменив буквы на цифры для своего варианта. Номер варианта – это последняя цифра номера зачетной книжки студента. Например, номер зачетной книжки студента Аз – 99 – 27. Это значит, что студенту необходи-

мо использовать исходные данные к задачам по седьмому варианту. Краткие теоретические сведения, необходимые для решения постав-

ленных задач и успешной аттестации студента по данной дисциплине, приведены в соответствующих разделах настоящего пособия.

Здесь следует особо отметить, что задача № 7 отличается от остальных не только тем, что требует изучить значительный объем учебного материала из соответствующего раздела пособия, но и предусматривает исследование в несколько этапов. Поэтому по ней дополнительно даны пояснения в виде последовательности этапов решения данной задачи.

Кроме того, по каждой задаче приведены методические рекомендации, которые призваны оказать помощь студенту при решении задач по контрольной работе.

Впроцессе освоения теоретического материала у студента могут возникнуть затруднения, которые он не сможет преодолеть самостоятельно.

Вэтом случае он обращается к преподавателю (при личной встрече либо по переписке почтой или через Internet). Для этого студент должен указать характер затруднения, наименование учебника (учебного материала), издательство, место, год издания и номер страницы. Если же затруднения возникли при решении задачи, то необходимо еще привести предполагаемый план ее решения.

116

Задачи

Задача № 1

Для сигнализации перегрузки двигателя машины установлены два датчика, имеющие вероятности отказа соответственно 10 –2 для первого и 210 –2 для второго сигнализатора. Найти вероятность того, что при перегрузке двигателя сработает:

а) один датчик; б) два датчика;

в) хотя бы один датчик; г) ни один датчик.

Здесь и далее N – номер варианта, т.е. последняя цифра номера зачетной книжки студента.

Рекомендации. На основе исходных данных необходимо определить вероятности отказа и безотказной работы каждого датчика. Поскольку отказ и безотказная работа прибора составляют полную группу событий (т.е. ничего больше, кроме указанных событий с прибором не произойдет), то сумма вероятностей отказа и безотказной работы должна быть равна единице.

Напоминаем, что если при словесном описании изучаемой ситуации для связи событий используется cвязка «ии», то при определении соответствующей вероятности применяется теорема умножения вероятностей, а если «либолибо», то сложение вероятностей.

Например, один из двух рассматриваемых датчиков может сработать так: либо сработает и первый датчик и не сработает второй, либо и не сработает первый датчик и сработает второй датчик.

На основании анализа этой фразы имеем следующую формулу для определения вероятности того, что при перегрузке сработает один датчик: вероятность безотказной работы первого датчика p1 , умноженная на вероятность отказа q2 второго датчика (эти события в описании ситуации связаны союзами «и…и»), а далее следует связка «либо…либо» – это значит, что вторым слагаемым в этой сумме будет p2·q1.

Применяя изложенную методику, можно найти решения по остальным пунктам рассматриваемой задачи.

Задача №2

В город поставляются автобусы с трех различных заводов в пропорциях n1, n2 и n3 (в процентах). На автобусах устанавливаются как отечественные, так и импортные двигатели. Доля автобусов каждого типа с отечественными двигателями соответственно равна m1, m2, m3 (в процентах). Вы-

117

яснилось, что на очередном автобусе оказался импортный двигатель. Какова вероятность того, что этот автобус поставлен с L-го завода? Исходные данные помещены в табл. 23.

Таблица 23

Исходные данные к задаче № 2 по вариантам

Пара-

 

 

 

 

Номер варианта

 

 

 

 

метры

0

1

2

3

 

4

5

 

6

7

8

9

n1

30

20

10

30

 

25

60

 

20

80

15

10

n2

50

30

60

10

 

25

10

 

20

15

25

40

N1

20

50

30

60

 

50

30

 

60

5

65

50

m1

70

50

40

80

 

10

40

 

15

70

10

75

m2

20

80

50

60

 

90

80

 

40

10

80

15

m3

60

40

60

20

 

70

20

 

45

20

10

10

L

1

2

3

1

 

3

2

 

2

3

1

3

Рекомендации. Здесь используется формула определения вероятности, которая широко применяется в медицинской и технической диагностике для уточнения диагноза больного после проведения дополнительного обследования (данные анализов и т.п.) либо для уточнения характера неисправности системы после использования дополнительных тестов. Необходимо обратить внимание на то, что заданы доли отечественных двигателей на автобусах (m1,m2,m3), а условие задачи требует определить вероятность того, что автобус с импортным двигателем поставлен с L-го завода.

Задача № 3

Непрерывная случайная величина Х задана интегральной функцией распределения

 

0

при

x 0;

 

А x2

при

0 x N;

F(x)

 

1

при

x N.

 

Определить:

а) коэффициент А; б) дифференциальную функцию распределения (плотность вероятно-

стей); в) математическое ожидание и дисперсию;

г) построить графики интегральной и дифференциальной функций распределения.

Рекомендации. Решения по пп. а) и б) основываются на формулах, которые приведены в соответствующем разделе, а поэтому особых затруднений не должны вызвать. Сложности здесь могут возникнуть при построе-

118

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]