Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Применение ЭВМ пособие.pdf
Скачиваний:
93
Добавлен:
15.03.2016
Размер:
637.99 Кб
Скачать

2 ПАССИВНЫЙ ЭКСПЕРИМЕНТ. КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ

Одной из основных задач математической статистики является исследование зависимости между двумя или несколькими переменными.

На практике при обработке экспериментальных данных закон распределения случайной величины (x, y) как правило, неизвестен. В

распоряжении экспериментатора имеются только полученные значения двумерной величины (xi; yi) (i=1, 2, … n). Если результаты выборки изобразить в виде точек в декартовой системе координат, то полученную точечную диаграмму называют корреляционным полем. Приближенное выражение модельной

функции регрессии называют эмпирической функцией регрессии yx = f (x, a,b,K, d) .

Модельную функцию регрессии или модель чаще всего подбирают по характеру расположения точек (xi; yi) на корреляционном поле, так, чтобы она отражала характерные особенности расположения этих точек. Поскольку оценками модели являются средние значения y, то эмпирическая линия регрессии должна проводится не через точки (xi; yi), а должна усреднять (сглаживать) результаты измерений (xi; yi). Усреднить это найти такую функцию yx = f (x, a,b,K, d) , график которой наилучшим образом приближается к

неизвестной модельной линии регрессии.

2.1 Метод наименьших квадратов

Для решения задачи нахождения эмпирических уравнений регрессии применяется метод наименьших квадратов. Метод наименьших квадратов позволяет при заданном виде зависимости выбрать параметры этой зависимости. В качестве параметров выступают коэффициенты уравнения регрессии.

Предположим, что уравнение регрессии имеет следующий вид:

(3)

y=b0+b1×x

Для удобства вычислений создается таблица следующего вида:

 

Таблица 1

xi2

yi2

 

 

(xi+yi)2

xi

yi

xi*yi

xi+yi

В последней строке таблицы размещается сумма по всем столбцам

Контроль произведенных вычислений осуществляем по формуле

å(xi + yi )2 = åxi 2 + 2åxi × yi + å yi 2 (4)

Для нахождения коэффициентов уравнения запишем систему нормальных уравнений с учетом значений в таблице 1:

7

ìb n + b

x

=

 

y

i

(5)

ï

0

1

å i

 

å

 

í

 

x

+ b

 

x 2

=

x × y

 

ïb

 

i

î

0

å i

1 å

i

 

å i

Составленная система уравнений решается методом Крамера. Для этого составляются определители:

D =

 

n

å xi

 

Db0

=

 

åyi

åxi

 

Db1

=

 

n

åyi

 

(6)

 

 

 

 

 

 

 

å xi

å xi

2

 

åxi× yi

åxi 2

 

 

åxi

åxi ×

yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определители раскрываются по следующей формуле, например первый определитель:

D = n×å xi

2 - å xi ×å xi

(7)

Коэффициенты b0 и b1 находятся по формуле:

b0

=

b0

b1

=

b1

(8)

D

D

 

 

 

 

 

 

2.2 Регрессионный анализ

Регрессионный анализ это анализ функций регрессий первого и второго рода. С его помощью решаются следующие задачи:

o находятся точечные и интервальные оценки параметров эмпирической функции регрессии;

o производится точечное и интервальное оценивание условных математических ожиданий, необходимое для предсказания средних значений одной случайной величины, соответствующих определенным фиксированным значениям другой величины;

o проверяется согласованность найденной эмпирической функции регрессии с экспериментальными данными.

Для решения первой задачи регрессионного анализа определяются средние квадратичные ошибки Sb0 и Sb1, характеризующие точность найденных коэффициентов уравнения регрессии, вычисляется среднеквадратичная ошибка, характеризующая рассеивание эмпирических точек вокруг линии регрессии.

Для этого создается таблица 2. Таблица 2

xi

yi

)

= b1 × xi + b0

)

ε

 

yi

εi = yi - yi

2

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В последней строке таблицы размещается сумма по всем столбцам

Расчет значений в данной таблице осуществляется аналогичным образом, как и расчет значений в таблице 1. Формулы для расчета приведены в заголовке таблицы 2.

Несмещенная оценка дисперсии зависимой переменной y определяется по формуле:

 

2

 

1

)

2

(9)

S

 

yx =

 

å( yi - yi )

 

 

 

n - 2

 

 

 

 

 

 

 

 

8

Эмпирические дисперсии точечных оценок коэффициентов регрессии определяются следующим образом:

S 2b0 =

S 2 yx ×

å

xi 2

 

S 2b1 =

 

n ×S 2 yx

 

(10)

n ×åxi 2 - (åxi )2

n

×åxi 2 - (åxi )2

 

 

 

Для построения 95 %-ных доверительных интервалов необходимо

воспользоваться формулами:

 

 

 

 

 

95 %-ный доверительный интервал для коэффициента b0:

 

 

 

b0 - tα × Sb0

< b0 < b0 + tα ×Sb0

 

 

(11)

 

 

 

2

 

2

 

 

 

 

95 %-ный доверительный интервал для коэффициента b1:

b1 - tα × Sb1

< b1 < b1 + tα × Sb1

(12)

2

2

 

По таблицам t-распределения Стьюдента [4] по числу степеней свободы и доверительной вероятности находится критическое значение статистики tα . Число

2

степеней свободы определяется по формуле: к = n-2, где n – количество опытов и вероятности α = 0,05.

Для решения второй задачи регрессионного анализа осуществляется статистическое оценивание коэффициентов регрессии, т.е. проверяется нулевая гипотеза Н0, т.е. проверяется отличается ли статистически значимо оценка коэффициента регрессии от нуля. Границу значимости устанавливают на основании распределения Стьюдента.

Для этого вычисляется статистика:

t

набл

= r ×

 

n - 2

 

(13)

 

1- r 2

 

 

 

 

По таблицам распределения

Стьюдента при α=0,05

и числу степеней

свободы k = n-2 находим tα/2;k. Сравниваем tнабл с tα/2;k. Необходимо чтобы tнабл > tα/2;k. В этом случае регрессионная модель выбрана удачно, т.е. она согласуется с экспериментальными данными и значение коэффициента отличается от нуля. В

противном случае регрессионная модель не согласуется с экспериментальными данными, т.е. регрессионная модель выбрана не удачно. Если это условие выполняется, то гипотеза Н0 отклоняется.

Коэффициент детерминации характеризует степень совпадения экспериментальных данных модельным (рассчитанным по уравнению регрессии). Чем выше значение коэффициента детерминации, тем выше точность значений рассчитанных по уравнению регрессии. Коэффициент детерминации изменяется от 0 до 1.

Вычисляется коэффициент детерминации:

 

 

)

- y)2

 

R

2

å( yi

(14)

 

= å( yi

- y)2

Очень часто на практике считают, что условное математическое ожидание М(Y/X) является линейной функцией, т.е. М(Y/X) = β0+β1х. Это предположение является гипотезой, которую надо проверить. Проверка этой гипотезы основывается на оценивании коэффициента корреляции.

9

2.3 Корреляционный анализ

Корреляционный анализ это анализ оценок коэффициента корреляции. Корреляционный анализ позволяет ответить на вопрос: существует ли линейная функциональная зависимость между случайными величинами X и Y.

В случае положительного ответа позволяет измерить степень тесноты статистической зависимости (степень близости статистической зависимости к функциональной). Существует ряд случаев, характеризующих линейность уравнения регрессии:

1)r=1. Линейная положительная функциональная связь существует, линии

регрессии Y на X и X на Y совпадают, коэффициенты регрессии равны b0=b1 и оба положительны. График такой зависимости представлен на рисунке 1а.

2)r=-1. Линейная отрицательная функциональная связь существует, линии

регрессии Y на X и X на Y совпадают, коэффициенты регрессии равны b0=b1 и оба отрицательны. График зависимости представлен на рисунке 1б.

3)r=0. Линейная функциональная зависимость не существует между переменными X и Y. Линии регрессии параллельны координатным осям, коэффициенты регрессии равны нулю. График зависимости представлен на рисунке 1в.

4)-1<r<1. В данном случае линейная зависимость может существовать, а может и не существовать. Для точного ответа на этот вопрос необходим дополнительный дисперсионный анализ. График зависимости представлен на рисунке 1г.

Y

 

 

Y=f(X)

 

18

 

 

 

 

16

 

 

 

 

14

 

 

 

y = 2x + 2

12

 

 

 

10

 

 

 

r = 1

8

 

 

 

 

 

 

 

6

 

 

 

 

4

 

 

 

 

2

 

 

 

X

0

 

 

 

 

 

 

 

0

2

4

6

8

 

 

 

а)

 

 

 

Y=f(X)

 

 

0

 

 

 

X

0

2

4

6

8

-5

 

 

 

y = -2x - 2

 

 

 

 

r = 1

-10

 

 

 

 

-15

 

 

 

 

-20

 

 

 

 

Y

 

 

 

 

 

 

б)

 

 

10