Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Анализ СД на ПК

.pdf
Скачиваний:
28
Добавлен:
22.02.2016
Размер:
1.18 Mб
Скачать

Для случая линейной регрессии оценки параметров β0 и β1 получаются минимизацией по β0 и β1 суммы квадратов отклонений ei выборочных значений с. в. Y от значений, предсказываемых уравнением регрессии Y на X, т. е. минимизацией функции

n

 

n

S(β0,β1) = (yi

 

(xi ))2 = (yi (β0 1 xi ))2 .

y

i=1

 

i=1

Из курса математического анализа известно, что для нахождения минимума функции S(β0, β1) необходимо приравнять к нулю частные производные этой функции S (по неизвестным β0 и β1) и решить полученную систему уравнений, называемых нормальными:

 

S(β0 ,β1)

= 0;

 

∂β0

 

 

(4)

 

)

 

S(β

β

 

 

 

0, 1`

 

= 0.

∂β

 

 

 

 

 

 

1

 

 

Система уравнений (4) имеет единственное решение, если определитель матрицы ее коэффициентов не равен нулю. Полученные значения β0 и β1 ,

являющиеся решением системы (4), называются оценками параметров регрессии. Для предполагаемой линейной регрессионной зависимости (2) оценки минимизируют ошибку, возникающую при аппроксимации выборки прямой, и вычисляются по формулам:

 

 

n

 

 

((xi

 

)(yi

 

))

ˆ

 

x

y

 

i=1

β1

=

 

n

 

 

(xi

 

)2

 

 

x

 

 

i=1

ˆ

 

 

ˆ

 

 

(5)

 

 

 

; β0

= y − β1 x ;

 

 

= 1

n

 

 

1

n

 

 

 

xi ;

 

=

yi .

(6)

x

y

 

 

 

 

n i=1

 

 

n i=1

 

В результате оценка уравнения линейной регрессии (эмпирическое уравнение линейной регрессии, прямая, полученная МНК) будет иметь вид:

 

ˆ

ˆ

 

y(x) = β0

+ β1 x .

В предположении, что значения ошибок {e1, e2,…, en}, возникающих при аппроксимации выборки уравнением линейной регрессии, являются взаимно независимыми случайными величинами с нормальным распределением, нулевым математическим ожиданием и постоянной дисперсией, оценки пара-

50

метров таких уравнений регрессии (полученные МНК) являются несмещенными, состоятельными и эффективными.

Метод наименьших квадратов применим для оценивания параметров уравнений регрессии произвольного вида (гиперболической, параболической, экспоненциальной, логарифмической и т. д.).

4 Пошаговый регрессионный анализ

В случае, если по виду диаграммы рассеяния сложно выдвинуть предположение о виде регрессионной зависимости, рекомендуется использовать пошаговый регрессионный анализ. Для этого уравнение регрессии выбирают как можно более сложным, содержащим большое количество слагаемых. Например,

 

(x) = β

 

+ β / x + β

 

x + β

x2 + β

 

x3

+ β

ex .

(7)

y

0

2

4

 

 

1

3

 

 

5

 

 

Стандартная пошаговая процедура позволяет в записанном уравнении регрессии выбрать те слагаемые, совокупность которых достаточно качественно предсказывает среднее значение зависимой с. в., и отбросить те слагаемые, которые существенно не улучшают предсказание с. в. Y.

Особенно полезен пошаговый регрессионный анализ в случае множественной регрессии, когда с. в. Y зависит от нескольких независимых случайных величин X1, X2, X3 и т. д. При этом пошаговая процедура позволяет из множества влияющих (независимых) с. в. исключить несущественные и тем самым упростить уравнение регрессии.

5 Корреляционный анализ

Помимо предположения о форме уравнения регрессионной зависимости между случайными величинами и нахождения параметров уравнения исследователю необходимо оценить, насколько удачно выбранная регрессионная модель объясняет существующую зависимость между исследуемыми с. в.

Коэффициент корреляции. Основной числовой характеристикой, определяющей тесноту линейной связи (1) между двумя случайными величинами, является коэффициент корреляции

r =

M[XY]M[X ]M[Y]

,

(8)

σ[X ]σ[Y]

 

 

 

 

где M[XY] – математическое ожидание произведения с. в. X и Y. Коэффициент корреляции является безразмерной величиной и может

принимать значения из интервала: –1 r 1. Для линейно независимых случайных величин Х и Y коэффициент корреляции равен нулю. Чем теснее ли-

51

нейная зависимость между двумя с. в., тем больше коэффициент корреляции отличается от нуля. Экстремальные значения 1 или –1 коэффициента корреляции соответствуют линейной функциональной зависимости между двумя с. в. (положительной и отрицательной соответственно). Положительная зависимость указывает на увеличение значения одной величины при увеличении значения другой величины. Например, стаж и производительность труда рабочих; время подготовки к экзамену и полученная оценка. Для отрицательной зависимости характерно уменьшение значения одной из величин при увеличении значения другой величины. Например, скорость модемного соединения и время, необходимое для передачи файла.

Таким образом, можно говорить, что коэффициент корреляции характеризует тесноту линейной регрессионной зависимости между двумя с. в., т.е. близость ее к линейной функциональной зависимости. По заданной двумерной выборке оценку коэффициента корреляции rˆ можно найти по формуле

 

 

n

 

 

 

 

 

 

 

 

 

((xi

 

)(yi

 

))

 

 

 

 

 

x

y

 

rˆ =

 

i=1

 

 

 

 

 

.

(9)

 

 

 

 

 

 

 

 

 

 

 

 

n

n

 

 

 

(xi

 

)2

(yi

 

)2

 

 

 

 

x

y

 

 

 

i=1

i=1

 

Коэффициент детерминации. Для характеристики качества описания зависимости между двумя с. в. произвольным уравнением регрессии используется коэффициент детерминации R2. Чем лучше линия регрессии аппроксимирует точки на диаграмме рассеяния, тем больше значение R2, и тем надежнее уравнение регрессии может быть применено для практических расчетов.

Оценка коэффициента детерминации определяется выражениями (10) – (11) и может принимать значения в интервале от нуля до единицы (0 R2 1):

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

(xi )

 

 

)2

 

 

 

ˆ2

 

y

y

 

 

 

=

i=1

 

 

 

 

 

 

 

 

 

,

(10)

R

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

(yi

 

)2

 

 

 

 

 

y

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

n

 

 

 

ˆ 2

 

 

 

 

ei2

 

 

 

= 1

 

 

i=1

 

,

(11)

R

 

 

 

 

n

 

 

 

 

(yi

 

)2

 

 

 

 

 

 

y

 

 

 

i=1

где n – объем выборки;

y(xi ) – значение с. в. Y, предсказываемое уравнением регрессии для

52

заданного xi (условное среднее);

y = 1 n yi – безусловное среднее с. в. Y; n i=1

yi i-е выборочное значение с. в. Y;

ei = yi y(xi ) – отклонения наблюденных значений с. в. Y = yi от расчетных, полученных по уравнению регрессии y(xi ) .

В формуле (10) числитель характеризует рассеяние условных средних y(xi ) , определяемых уравнением регрессии, около безусловного среднего

y , в знаменателе – рассеяние (дисперсию) опытных данных yi около безусловного y .

Отметим, что коэффициент детерминации не является мерой какой-либо зависимости априорно (как это справедливо для коэффициента корреляции, который всегда характеризует степень линейной зависимости между двумя с. в.), он лишь оценивает степень приближения выбранного уравнения регрессионной зависимости к действительной зависимости между двумя с. в.

Близость коэффициента детерминации к нулю указывает на то, что выбранное уравнение регрессии (модель зависимости) незначимо объясняет существующую зависимость между с. в. Равенство же коэффициента детерминации единице указывает на то, что зависимость между случайными величинами является функциональной, описываемой уравнением регрессии, т. е. выбранное уравнение регрессии полностью (однозначно) определяет зависимость между с. в.

Если значение коэффициента детерминации больше 0,7, то считают, что выбранное уравнение регрессии хорошо описывает зависимость, существующую между случайными величинами. Если же коэффициент детерминации меньше 0,3, то уравнение регрессии незначительно описывает зависимость между случайными величинами, если таковая существует.

Замечание – При анализе связи между случайными величинами Х и Y, для которых значение одной из с. в. (обычно X) задаются исследователем, коэффициент корреляции (или детерминации) нельзя рассматривать как строгую меру взаимосвязи явлений (как в случае, где Х – неконтролируемая величина), поскольку здесь большую роль играет выбор самих значений xi. В этом случае коэффициент корреляции (детерминации) характеризует лишь меру близости эмпирических точек к линии регрессии.

6 Проверка значимости оценок коэффициентов корреляции и детерминации

Оценки коэффициентов корреляции и детерминации сами являются случайными величинами, так как для различных выборок из одной и той же ге-

53

неральной совокупности могут принимать различные значения. При малых объемах выборок эти различия будут особенно существенными. Поэтому при нахождении оценок коэффициентов корреляции и детерминации используется проверка значимости этих оценок, которая позволяет сделать вывод о существенности описания действительной зависимости выбранным уравнением регрессии.

Фактически, проверка значимости оценки коэффициента корреляции/детерминации заключается в статистической проверке параметрической гипотезы о том, что действительное значение коэффициента равно нулю

(r = 0 или R2 = 0), а отличие от нуля соответствующей оценки ( rˆ или Rˆ2 ) вызвано лишь случайностью выборки.

Проверка значимости rˆ . Чтобы сделать статистический вывод о значимости оценки коэффициента корреляции (при проверке линейной регрессионной зависимости) выдвигается нулевая гипотеза об отсутствии линей-

ной зависимости между исследуемыми с. в. (т. е. H0: r = 0; Ha: r 0). Если гипотеза H0 отклоняется, то считается, что уравнение регрессии Y на X действительно имеет линейный вид (1) – (2).

Для проверки гипотезы H0 вычисляется t-статистика

tˆ = rˆ

n 2

 

.

(12)

 

 

1rˆ2

 

При условии справедливости гипотезы H0 рассчитанная t-статистика имеет распределение Стьюдента с n – 2 степенями свободы. Найденное по

формуле (12) значение tˆ сравнивается с критическим значением tα,ν при

ν = n – 2 степенях свободы (см. приложение Б). Если расчетное значение tˆ по абсолютной величине превосходит табличное для заданного уровня значимости α, то нулевая гипотеза H0 о линейной независимости двух с. в. отклоняется, и с вероятностью ошибки α можно утверждать, что между исследуемыми величинами существует линейная зависимость.

Проверка значимости Rˆ 2 . При выполнении процедуры проверки значимости оценки коэффициента детерминации выдвигается нулевая гипотеза о том, что предложенное уравнение регрессии никак не отражает реальную зависимость между с. в., т. е. H0: R2 = 0. Альтернативная гипотеза заключается в том, что выбранная модель зависимости (уравнение регрессии) y(xi ) в

достаточной степени объясняет действительную зависимость между случайными величинами, т. е. Ha: R2 > 0.

Для проверки значимости оценки коэффициента детерминации исполь-

54

зуется статистика

ˆ ˆ 2

n m

 

 

 

F = R

 

 

,

(13)

ˆ2

)

 

(m 1)(1R

 

 

имеющая F-распределение Фишера с ν1 = m – 1 и ν2 = n m степенями свободы. Здесь m – число неизвестных параметров предполагаемого уравнения регрессии (β0 , β1 ,…, βm–1 ). Значение статистики, вычисленное по формуле (13) сравнивается с критическим значением Fν1, ν2, α, найденным по таблицам квантилей распределения Фишера (приложение Д) при заданном уровне значимости и соответствующем числе степеней свободы. Если F > Fν1, ν2, α, то нулевая гипотеза отклоняется, вычисленный коэффициент детерминации значимо отличается от нуля, и с вероятностью ошибки α можно утверждать, что между исследуемыми величинами существует зависимость предложенного вида, и полученное уравнение регрессии может использоваться в дальнейших исследованиях.

Пример 1 По результатам десяти совместных измерений скорости движения локомотива X, км/ч, и соответствующего расхода топлива Y, л/100 км, представленных в таблице 1, следует исследовать зависимость между данными величинами с целью определения «крейсерской» скорости локомотива и прогнозирования величины расхода топлива при заданной скорости движения поезда.

Таблица 1 – Исходные данные

X

40,23

19,63

29,01

89,14

74,96

57,89

34,33

21,01

16,69

9,24

 

 

 

 

 

 

 

 

 

 

 

Y

50,66

67,82

60,95

65,53

46,84

52,91

43,71

70,52

67,02

89,96

 

 

 

 

 

 

 

 

 

 

 

Решение. На величину расхода топлива локомотивом Y, помимо скорости движения X, влияние оказывает масса состава, профиль и качество железнодорожного полотна, качество подвижного состава, направление и скорость ветра и другие факторы. Поэтому зависимость между величиной расхода топлива локомотивом Y и скоростью движения поезда X является статистической: на одной скорости движения при различных дополнительных условиях расход топлива может принимать различные значения. Для решения поставленной задачи определения «крейсерской» скорости локомотива и прогнозирования величины расхода топлива при заданной скорости движения поезда ограничимся отысканием регрессионной зависимости.

Диаграмма рассеяния, построенная по результатам наблюдений исследуемых величин, представлена на рисунке 4.

55

л/100км

90

80

70

60

50

40

0

20

40

60

80

100

 

 

 

 

 

км/ч

Рисунок 4 – Диаграмма рассеяния случайных величин X и Y

Характер расположения точек на диаграмме рассеяния позволяет сделать предположение о параболической регрессионной зависимости

 

(x) = β

 

+ β x + β

 

x2 .

(14)

y

0

2

 

 

1

 

 

Оценки параметров β0 , β1 и β2 найдем методом наименьших квадратов. Для этого составим функцию S(β0 , β1 , β2) (см. (3)), которая в случае параболической регрессии примет вид

n

n

2 )]2 .

 

S(β0,β1,β2 ) = (yi

 

(xi ))2

= [yi (β0 + β1xi 1xi

(15)

y

i=1

i=1

 

 

Для отыскания оценок параметров β0 , β1 и β2, минимизирующих функцию S(β0 , β1 , β2) , составим и решим систему нормальных уравнений (4):

 

S(β0,β1,β2 )

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

= 0;

 

 

2[(β0 + β1xi + β2xi2)] =

0;

 

 

[(β0 + β1xi

 

∂β0

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(β0,β1,β2 )

 

 

 

 

n

 

 

 

 

2

 

 

 

 

 

n

 

 

 

 

 

 

= 0;

 

 

2[(β0 + β1xi + β2xi

 

]xi

= 0;

 

 

[(β0 + β1xi

∂β1

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

S(β0,β1,β2 )

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

= 0,

 

2

[(β

 

+ β x + β

x 2

]x 2

= 0,

 

 

 

[(β

 

+ β x

∂β2

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1 i

2 i

 

i

 

 

 

 

 

0

1 i

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

n

2

 

 

 

 

 

 

 

 

 

 

 

yi − β0n − β1

xi − β2 xi

 

= 0 ;

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

i=1

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

n

2

 

n

 

3

 

= 0;

 

 

yi xi − β0 xi −β1 xi

− β2 xi

 

 

 

 

 

 

i=1

 

 

 

 

 

i=1

i=1

 

 

i=1

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

n

 

 

 

n

 

 

 

 

 

 

 

 

 

yi xi 2

− β0 xi2

−β1xi

3 − β2 xi4 = 0.

 

 

 

 

i=1

 

 

 

 

 

i=1

 

 

i=1

 

 

i=1

 

 

 

 

 

+β2xi2)] = 0 ;

+β2xi2]xi = 0;

+β2xi2]xi2 = 0,

(16)

Для вычисления значений сумм, входящих в систему уравнений (16), составим расчетную таблицу 2.

56

Таблица 2 – Результаты промежуточных вычислений

 

 

N

xi

 

 

 

yi

xi2

xi yi

xi3

 

xi4

 

 

xi2 yi

 

 

 

1

40,23

50,66

1618,45

2038,05

65110,36

 

2619389,79

 

 

81990,82

 

 

 

2

19,63

67,82

385,34

1331,31

7564,16

 

148484,53

 

 

26133,55

 

 

 

3

29,01

60,95

841,58

1768,16

24414,24

 

708257,06

 

 

51294,31

 

 

 

4

89,14

65,53

7945,94

5841,34

708301,06

 

63137956,13

 

520697,42

 

 

 

5

74,96

46,84

5619,00

3511,13

421200,36

 

31573178,98

 

263194,03

 

 

 

6

57,89

52,91

3351,25

3062,96

194003,98

 

11230890,64

 

177314,75

 

 

 

7

34,33

43,71

1178,55

1500,56

40459,58

 

1388977,51

 

 

51514,37

 

 

 

8

21,01

70,52

441,42

1481,63

9274,24

 

194851,70

 

 

31128,95

 

 

 

9

16,69

67,02

278,56

1118,56

4649,10

 

77593,50

 

 

18668,83

 

 

 

10

9,24

89,96

85,38

831,23

788,89

 

7289,33

 

 

7680,57

 

 

 

Σ

392,13

615,92

21745,5

22484,9

1475766

 

111086869,2

 

1229617,6

 

 

После подстановки значений система уравнений (16) примет вид:

 

 

 

 

 

 

 

615,92 10β0 392,13β1 21745,47β2 = 0 ;

 

 

 

 

 

 

 

 

22484,93 392,13β0 21745,47β1 1475765,97β2 = 0;

(17)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1229617,6 21745,5β0 1475765,97β1 111086869,2β2 = 0.

 

Решив систему уравнений (17) известными методами или с помощью

 

 

 

 

 

 

 

 

 

 

ˆ

 

ˆ

= −2,095621;

MAthCAD, получим следующее решение: β0 = 103,00457 ;

β1

ˆ

= 0,0187455 , а уравнение регрессии примет вид

 

 

 

 

 

β2

 

 

 

 

 

 

 

 

 

 

 

 

(x) = 103,00457 2,095621x + 0,0187455 x2 .

 

 

(18)

 

 

 

 

 

 

y

 

 

На рисунке 5 представлена диаграмма рассеяния случайных величин X и Y с нанесённой линией регрессии.

л/100км

 

 

 

 

 

90

 

 

 

 

 

80

 

 

 

 

 

70

 

 

 

 

 

60

 

 

 

 

 

50

 

 

 

 

 

40

 

 

 

 

 

0

20

40

60

80

100

 

 

 

 

 

км/ч

 

Рисунок 5 – Диаграмма рассеяния случайных

 

 

величин X и Y с нанесённой линией регрессии

 

57

Оценим качество описания зависимости между величиной расхода топлива локомотивом (Y) и скоростью его движения (Х) полученным уравнением регрессии с помощью коэффициента детерминации (10), где

y(x) = 103,00457 2,095621x + 0,0187455 x2 – значение расхода топлива, предсказываемое уравнением регрессии, при скорости локомотива xi (см.

 

 

 

 

 

 

 

 

 

 

 

1

n

 

 

 

 

 

615,92

 

 

 

 

 

 

 

 

последний столбец таблицы 3);

y

=

 

yi

=

 

 

 

= 61,592 л/100км – сред-

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

n i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

неарифметическое наблюденных значений расхода топлива.

 

 

Таблица 3 – Значения расхода топлива локомотивом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Скорость

Наблюденное (фактиче-

 

 

Значение, предсказываемое уравне-

 

 

N

 

ское) значение расхода

 

 

нием регрессии

 

 

 

 

 

 

 

 

 

xi

 

топлива, yi

 

 

 

 

 

 

 

 

(xi) =β0 +β1 xi+β2 xi2

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

1

 

40,23

 

50,66

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

49,036

 

 

 

 

 

2

 

19,63

 

67,82

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

69,091

 

 

 

 

 

3

 

29,01

 

60,95

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

57,986

 

 

 

 

 

4

 

89,14

 

65,53

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

65,152

 

 

 

 

 

5

 

74,96

 

46,84

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

51,248

 

 

 

 

 

6

 

57,89

 

52,91

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

44,510

 

 

 

 

 

7

 

34,33

 

43,71

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

53,154

 

 

 

 

 

8

 

21,01

 

70,52

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

67,250

 

 

 

 

 

9

 

16,69

 

67,02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

73,250

 

 

 

 

 

10

 

9,24

 

89,96

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

85,241

 

 

 

 

 

Σ

 

392,13

 

615,92

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ2

n

 

 

 

 

2

 

 

 

 

n

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R

= (y(xi ) y)

 

 

 

(yi y)

 

=

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

=

 

(49,036 61,592)2 + (69,09161,592)2 + ...+ (85,24161,592)2

=

 

 

(50,66 61,592)2 + (67,82 61,592)2 + ...+ (89,96 61,592)2

 

 

 

 

 

= 157,6408 + 56,23316 + ...+ 559,2981

= 1436,761

= 0,844708 .

 

 

 

 

 

119,5086 + 38,78798 + ...+ 804,7434

1700,897

 

 

 

 

Расчётное значение коэффициента детерминации

ˆ 2

= 0,844708

 

указы-

R

 

вает на удовлетворительность описания зависимости между величиной скорости (Х) и расхода топлива (Y), выбранным уравнением регрессии. Проверим, однако, значимость оценки коэффициента детерминации с помощью статистики Фишера

ˆ

 

10 3

F = 0,844708

 

 

= 19,03818 .

(3 1)(10,844708)

Вывод. Критическое значение статистики Фишера для степеней свободы

58

ν1 = 3 – 1 = 2 и ν2 = 10 – 3 = 7 и уровня значимости α = 0,05 составляет F0,05;2;7 = 4,737 . Поскольку расчётное значение статистики Фишера больше

критического ( Fˆ = 19,03818 > 4,737 = F0,05;2;7 ), то вычисленный коэффициент детерминации значимо отличается от нуля, и выбранное уравнение регрессионной зависимости (18) между величинами скорости и расхода топлива локомотивом может быть использовано в практических целях.

Например, при движении локомотива со скоростью 70 км/ч можно ожидать в среднем расход y(70) = 103,00457 2,095621 70 + 0,0187455 702 = = 48,164 литров топлива на каждые 100 км пути. Следовательно, можно контролировать фактический расход топлива локомотивом.

Для определения «крейсерской» скорости локомотива (которой соответствует минимальный расход топлива) необходимо решить задачу минимизации функции y(x) (см. рисунок 5). Для этого приравняем к нулю производ-

ную функции y(x) и решим полученное уравнение:

(y(x))= −2,095621+ 0,0187455 2x = 0 ; 0,037491035x = 2,095621 x = 55,89658024 .

Таким образом, «крейсерская» скорость локомотива составляет 55,897 км/ч (см. рисунок 5).

Пример 2 По десяти предприятиям лёгкой промышленности были получены следующие данные об объёмах вкладываемых в предприятие инвестиций X, млрд руб., и соответствующих размерах прибыли Y, млрд руб. (таблица 4).

Таблица 4 – Исходные данные

X

1,0

1,5

4,0

2,5

1,0

0,5

3,0

2,0

0,5

5,0

 

 

 

 

 

 

 

 

 

 

 

Y

7,34

11,46

15,35

16,02

3,50

4,95

13,43

7,31

–0,87

17,54

 

 

 

 

 

 

 

 

 

 

 

Требуется исследовать зависимость между величинами инвестиций и прибылью, получаемой предприятиями лёгкой промышленности, с целью оптимизации вложения средств.

Решение. Естественно, что на величину прибыли предприятия, помимо величины инвестиций, влияние оказывает большое количество дополнительных факторов (эффективность расходования средств, конъюнктура рынка, величина основных фондов предприятия и др.). Поэтому при исследовании зависимости между величиной инвестиций и прибылью ограничимся отысканием регрессионной зависимости между ними.

Диаграмма рассеяния, построенная по результатам наблюдений исследуемых величин, представлена на рисунке 6.

59