Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Прикл математика май 2014 / Методичка по прикладной математике

.pdf
Скачиваний:
63
Добавлен:
17.04.2015
Размер:
2.08 Mб
Скачать

таблицы для метода Эйлера.

Построить графики решений, полученных разными методами, используя функции

ВСТАВКА ТОЧЕЧНАЯ ДИАГРАММА ТОЧЕЧНАЯ С ГЛАДКИМИ КРИВЫМИ и ВЫБРАТЬ ДАННЫЕ ДОБАВИТЬ.

21

Скопировать на тот же лист результаты вычислений, повторить решение

дифференциального уравнения при n 20.

22

23

Задание 4. Элементы регрессионного анализа. Метод наименьших квадратов

Дана таблица значений величин x и y .

x

1,92

2,01

2,95

3,57

3,72

4,17

4,21

5,64

6,85

 

 

 

 

 

 

 

 

 

 

y

1,93

1,67

1,08

0,95

0,51

0,63

0,75

0,07

0,09

 

 

 

 

 

 

 

 

 

 

1.Методом наименьших квадратов найти уравнение линейной регрессии. На координатной плоскости построить точки, соответствующие исходным данным и график линейной регрессии

2.Оценить величину регрессионной зависимости с помощью коэффициента детерминации.

3.Оценить значимость уравнения регрессии при уровне значимости 0,05.

4.Используя средства Excel найти уравнения нелинейной регрессии: квадратичной,

экспоненциальной, логарифмической, степенной.

5.По максимальному коэффициенту детерминации найти наилучшее уравнение регрессии.

Основная цель регрессионного анализа состоит в определении связи между некоторой величиной y и величинами x1, x2 , ...,xm , которые влияют на значение y .

Переменная

y называется зависимой переменной (откликом), влияющие переменные

x1, x2 , ...,xm

называются факторами (регрессорами). Установление формы зависимости,

подбор модели (уравнения) регрессии и оценка ее параметров являются задачами регрессионного анализа.

Взависимости от числа взаимосвязанных величин различают парную и

множественную регрессию. Если исследуется связь между двумя величинами, то регрессия называется парной, если между тремя и более величинами – множественной

(многофакторной) регрессией.

Пусть задана таблица значений величин x и y .

x

x1

 

x2

 

 

xk

 

xn

y

y1

 

y2

 

 

yk

 

yn

Задача

парной регрессии

состоит в

получении аналитического

выражения

функциональной

зависимости

 

y F(x) :

 

определении

вида

функции

 

 

 

 

24

 

 

 

 

 

F(x) F(x, a0 , a1, ...,am ) , ее параметров a0 , a1 ,...,am

( m

n)

и последующего

статистического исследования уравнения регрессии y

F(x)

 

 

 

 

 

 

В зависимости от вида функции F(x)

различают линейную и нелинейную регрессию

(квадратичная, экспоненциальная, логарифмическая и т.д.).

 

 

 

 

 

 

Предположение о виде

зависимости можно сделать, построив на координатной

плоскости точки (xk , yk ) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметры функциональной

зависимости

 

F(x)

F(x, a0 , a1, ...,am )

определяют,

используя метод наименьших

квадратов. Наилучшими

 

значениями

параметров

a0 , a1, ...,am будут те, для которых сумма отклонений

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

(a , a ,...,a

m

)

(F(x

k

, a , a ,...,a

m

)

y

k

)2

 

0

1

 

 

 

0

1

 

 

 

 

 

 

 

 

 

k

0

 

 

 

 

 

 

 

 

 

 

принимает наименьшее значение.

 

 

 

 

 

 

 

 

 

 

 

 

Используя необходимые условия экстремума для функции

, получим систему

уравнений для определения параметров a0 ,a1,...,am .

 

 

 

 

 

 

 

 

0

a0

0

a1

...

0

am

n

 

 

 

 

 

 

 

 

 

 

F

 

 

2

(F(x

 

, a , a ,...,a

 

)

y

 

)

 

0

k

m

k

 

 

 

0

1

 

 

 

 

a0

 

 

k

0

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

F

 

 

2

(F(x

 

, a , a ,...,a

 

)

y

 

)

 

0

k

m

k

 

 

 

0

1

 

 

 

 

a1

 

 

k

0

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F

 

 

2

(F(xk , a0 , a1 ,...,am )

yk )

 

 

0

 

 

 

 

am

 

k 0

 

 

 

 

 

 

 

 

 

 

 

Если эта система имеет единственное решение a0 ,a1,...,am , то оно будет искомым.

Линейная регрессия

Будем искать функциональную зависимость в виде F(x) ax b , где a – коэффициент регрессии. В этом случае сумма квадратов отклонений

n

(a,b) (axk b yk )2 . Для

k 1

определения неизвестных параметров a и b нужно решить систему:

n

2 (axk b yk )xk 0

k 1 n

2 (axk b yk ) 0

k 1

25

После преобразований система примет вид

 

 

 

n

n

 

 

n

 

 

 

 

 

a

x2

b

x

k

x

k

y

k

 

 

 

k

 

 

 

 

 

 

 

k 1

k

1

 

k 1

 

 

(4.1)

 

 

 

 

 

 

 

 

 

 

n

 

 

n

 

 

 

 

 

 

a

xk

bn

yk

 

 

 

 

 

 

k 1

 

 

k

1

 

 

 

Можно показать, что эта система имеет единственное решение. При полученных

значениях a и b функция

(a, b) будет иметь минимум.

Направление связи между величинами

x и

 

y определяется на основании знака

коэффициента

регрессии

a .

Если знак при коэффициенте регрессии положительный,

связь между

x и y будет

положительной.

Если

знак при коэффициенте регрессии

отрицательный, то связь является отрицательной (обратной).

Для анализа общего качества уравнения регрессии используют коэффициент

детерминации R2 :

 

 

 

n

 

 

yT )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( y

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

1 n

 

 

R2

1

 

ki 1

 

 

 

 

 

 

 

yT

 

 

 

 

 

 

 

 

 

 

 

 

,

где

ax

b,

 

y

y

 

(4.2)

 

n

 

 

 

k

 

 

 

 

 

 

 

 

 

 

k

 

k

 

 

 

 

n k 1

 

 

 

 

( y

k

 

y)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ki 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

R2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент детерминации R2 показывает, на

сколько процентов ( R2

100% )

найденная функция регрессии описывает связь между исходными значениями

x и y .

Соответственно,

величина 1 R2

показывает, на сколько процентов изменения величины

y обусловлены факторами, не включенными в регрессионную модель.

 

Если

значение

 

R2 близко к

единице,

это

означает,

что построенная

модель

(уравнение регрессии) объясняет почти всю изменчивость соответствующих величин. И

наоборот, если значение R2 близко к нулю, то это означает плохое качество построенной модели.

Оценка значимости

уравнения линейной регрессии осуществляется с помощью

 

 

n

( yT

y)2

 

 

 

 

 

 

k

 

 

F-критерия Фишера:

F

k

1

 

 

(n 2) .

n

 

 

 

 

 

y)2

 

 

 

( y

k

 

 

 

 

 

 

 

 

k

1

 

 

 

При условии справедливости нулевой гипотезы о том, что уравнение регрессии

статистически незначимо (

H

0

:

R2 0 ), критерий имеет распределение Фишера с числом

 

 

 

 

степеней свободы k1 1, k2

 

n

2 .

 

 

 

 

26

Критическое значение Fкр определяется по таблицам распределения Фишера для заданного уровня значимости Fкр F( , k1, k2 ) . Fкр - это максимально возможное

значение критерия под влиянием случайных факторов при данных степенях свободы и

уровне значимости . Уровень значимости

- вероятность отвергнуть правильную

гипотезу при условии, что она верна. Обычно

принимается равной 0,05 или 0,01.

Фактическое значение F-критерия можно вычислить и по формуле

 

 

Fнабл

 

 

R2

(n 2)

 

 

1

R2

 

 

 

 

Если F

F

, то нулевая гипотеза отвергается, и коэффициент детерминации R2

набл

кр

 

 

 

 

считается статистически значимым (найденное уравнения регрессии статистически

надежно). Если Fнабл

Fкр , то нулевая гипотеза принимается, и признается статистическая

ненадежность уравнения регрессии.

 

 

 

 

 

 

 

 

 

 

 

 

На листе Exсel написать название темы, ввести исходные данные

 

 

 

 

 

1.

Для определения коэффициентов линии регрессии F(x) ax b решить систему

 

(4.1) матричным способом:

 

 

 

X

A 1B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

x2

n

 

 

 

 

 

 

 

n

 

 

 

 

 

 

a

 

 

 

 

x

k

 

 

 

 

 

 

 

x

k

y

k

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

Здесь X

,

A

k

1

k 1

 

,

A

1

- обратная матрица, B

k

1

 

 

 

 

 

 

 

 

b

n

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

xk

 

n

 

 

 

 

 

 

 

 

 

yk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

1

 

 

 

 

 

 

 

 

 

k 1

 

 

 

 

Для этого

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1)

Заполнить вспомогательную таблицу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

x

 

 

y

k

x2

 

 

x y

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

k

 

 

k k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и найти суммы значений по столбцам, используя автосумму или функцию СУММ.

2)Построить матрицу A коэффициентов при неизвестных размерности 2 2 и

матрицу-столбец свободных членов B , размерности 2 1

3)Найти обратную матрицу A 1 . Для этого выделить область размером 2 2 и

воспользоваться функцией:

Функция Математические МОБР. Для вывода всей таблицы нажать сначала F2, а затем одновременно CTRL+SHIFT+ENTER.

4)Найти столбец коэффициентов функции F(x) , умножив полученную обратную матрицу на столбец свободных членов ( A 1B ). Для этого выделить область размером 2 1 и воспользоваться функцией:

27

Функция Математические МУМНОЖ. Для вывода всей таблицы нажать сначала F2, а затем одновременно CTRL+SHIFT+ENTER.

5) На диаграмме построить точки (xk , yk ) , соответствующие исходным данным. Для этого выделить таблицу исходных данных и далее использовать функции

ВСТАВКА ТОЧЕЧНАЯ ДИАГРАММА ТОЧЕЧНАЯ С МАРКЕРАМИ.

6) Построить

таблицу значений и

график функции F(x) . Т.к. функция

F(x)

линейная, достаточно вычислить ее значения для

x1 и

xn , и построить график

функции,

используя функции

РАБОТА

С

ДИАГРАММАМИ

 

КОНСТРУКТОР ВЫБРАТЬ ДАННЫЕ. Далее, выделив полученные точки,

ИЗМЕНИТЬ ТИП ДИАГРАММЫ ДЛЯ РЯДА ТОЧЕЧНАЯ С ГЛАДКИМИ

КРИВЫМИ.

Результаты вычислений можно оформить, например, следующим образом

2. Вычислить коэффициент детерминированности R2 :

 

n

 

yT )2

 

( y

k

 

 

k

R2 1

ki 1

 

 

n

 

 

( yk y)2

ki 1

28

 

 

 

 

 

 

1 n

 

 

 

 

 

 

 

 

 

1)

Вычислить y

yср

yk ,

используя

для этого, например, функцию

n k

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

СРЗНАЧ.

 

 

 

 

 

 

 

 

 

 

 

 

2)

Заполнить вспомогательную таблицу

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

xk

 

 

yk

 

ykT axk

b

(yk ykT )2

(yk y)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найти суммы значений в двух последних столбцах столбцам и вычислить значение R2 .

3. Найти критическое значение

Fкр

критерия

Фишера для уровня значимости

0,05и степеней свободы k1

1, k2

9 2

7, используя функцию FРАСПОБР,

R2

и фактическое значение Fнабл 1 R2 (n 2) . Сделать вывод о статистической надежности уравнения регрессии.

4.1) По исходным данным построить четыре диаграммы с точками (xk , yk ) ,

соответствующими исходным данным. Для этого выделить таблицу исходных данных и далее использовать функции ВСТАВКА ТОЧЕЧНАЯ ДИАГРАММА

ТОЧЕЧНАЯ С МАРКЕРАМИ.

29

2)На первой диаграмме построить линию квадратичной регрессии, выполнив операции РАБОТА С ДИАГРАММАМИ МАКЕТ ЛИНИИ ТРЕНДА

ДОПОЛНИТЕЛЬНЫЕ ПАРАМЕТРЫ ЛИНИИ ТРЕНДА, выбирая из

возможных вариантов линии тренда ПОЛИНОМИАЛЬНАЯ (степень 2),

показывая

на

диаграмме

уравнение

линии

и

коэффициент

детерминированности R2 .

3)На остальных диаграммах аналогично построить экспоненциальную,

логарифмическую и степенную линию регрессии, показывая на диаграммах уравнение линии и коэффициент детерминированности R2 .

30