Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1627.pdf
Скачиваний:
24
Добавлен:
07.01.2021
Размер:
1.43 Mб
Скачать

точного совпадения путём значительного увеличения числа коэффициентов уравнения регрессии неразумно, поскольку экспериментальные результаты получены с большей или меньшей погрешностью, и такая функция может просто не отражать действительного характера изменения исследуемой величины в силу влияния помех.

При n > k+1 число независимых уравнений системы избыточно. Из этих уравнений в разных комбинациях можно составить несколько систем уравнений, каждая из которых в отдельности даст своё решение. Но между собой они будут несовместимыми. Каждое решение будет соответствовать своим значениям коэффициентов bj. Если все их построить на графике, то получим целый пучок аппроксимирующих кривых, форма и ширина которого показывает область неопреде-

лённости проведённого эксперимента. Может быть произведено усреднение всех найденных кривых и полученнаяИусреднённая кривая будет точнее и достовернее описывать исследуемое явление, так как она в значительной степени освобождена от случайных погрешностей, приводивших к разбросу отдельных экспериментальных точек.

Второй подход – метод наименьших квадратов. Основан на вы-

полнении требования, чтобы сумма квадратов отклонений экспери-

ментальных точек от соответствующих значений уравнения регрессии

была минимальна.

 

 

 

 

 

Д

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

b

 

 

 

 

 

,...,bk

yi

 

 

 

 

 

 

 

 

f xi ,b0,b1,...,bj

 

 

 

 

min,

 

 

 

i 1

 

 

 

 

 

 

А

 

 

 

 

 

 

 

f x

,b ,b ,...б,b ,...,b y

 

f xi

 

 

 

 

 

b

 

0,

 

0 j k ,

(3.9)

 

 

 

 

i 1

 

i

0 1

 

 

j

 

k

i

 

 

 

bj

 

 

 

 

 

 

b

 

 

и

 

 

f xi

 

 

n

 

 

f xi

 

 

 

f x

,b ,b ,...,b

 

,...,b

 

 

y

 

 

0.

 

 

 

 

 

bj

 

 

i 1

i

 

0 1

j

 

 

k

 

bj

 

 

 

 

i 1

i

 

 

 

ПоследняяСсистема содержит столько же уравнений, сколько неизвестных коэффициентов.

Расчёт коэффициентов уравнения регрессии методом наименьших квадратов можно применять при любых статистических данных, распределённых по любому закону.

3.4. Определение тесноты связи между случайными величинами

Определив уравнение теоретической линии регрессии, необходимо дать количественную оценку тесноты связи между двумя рядами наблюдений. При корреляционном анализе предполагается, что

39

факторы и отклики носят случайный характер и подчиняются нормальному закону распределения. Тесноту связи между случайными величинами характеризуют корреляционным отношением

xy

Sy2 Sy2ост

,

(3.10)

Sy2

 

 

 

где Sy2 – дисперсия выходного параметра, определяет разброс экспе-

риментально наблюдаемых точек относительно среднего значения,

Sy2

 

1

n

yi

 

y

2 ;

(3.11)

 

 

 

 

 

n 1i 1

 

 

 

 

 

Sy2ост остаточная дисперсия,

характеризует

разброс эксперимен-

тально наблюдаемых точек относительно линии регрессии и представляет собой показатель ошибки предсказания параметра по урав-

нению регрессии,

 

 

Д

 

 

 

 

 

 

 

 

~ 2

 

 

 

 

 

2

 

1

n

 

 

 

 

 

Syост

 

yi

y

.

(3.12)

 

 

 

 

 

 

 

 

 

n 1 k i 1

 

 

 

 

В случае, если

 

А

 

 

 

 

 

xy 1,

связь являетсяИфункциональной,

Sy2

ост 0,

все точки корреляционного поля оказываются на линии

регрессии,

xy 0 означает отсутствие какой-либо тесноты связи ме-

 

 

и

 

 

 

 

ост , разброс экс-

жду x и y для данного уравнения регрессии, Sy2 Sy2

периментальных точек относ тельно среднего значения линии рег-

С

б

рессии одинаков.

Чем ближе расположены экспериментальные точки к линии регрессии, тем теснее связь, тем меньше остаточная дисперсия и тем больше корреляционное отношение.

3.5. Парная линейная корреляция

Простейшей системой корреляционной связи является линейная связь между двумя признаками – парная линейная корреляция. Практическое ее значение состоит в том, что существуют системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Измерение парных корреляций составляет необходимый этап в изучении сложных многофакторных связей. Рассмотрение линейных связей объясняется ограниченной ва-

40

риацией переменных и тем, что в большинстве случаев нелинейные формы связей для выполнения расчетов преобразуются в линейную форму.

По общему направлению связи могут быть прямые и обратные. При прямых связях с увеличением признака x увеличивается и признак y, при обратных с увеличением признака x признак y уменьшается. Изучение парной корреляции осуществляется при совместном измерении двух физических величин.

Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид

~

(3.13)

y a bx,

где ~y – среднее значение результативного признака y при определен-

ном значении факторного признака x; a – свободный член уравнения; b коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения (вариация y, приходящаяся на единицу вариации x).

Показателем тесноты парной линейнойИкорреляционной связи

является коэффициент корреляцииДrxy . Этот показатель представля-

ет собой стандартизованный коэффициент регрессии, т.е. коэффициент, выраженный не в а солютных единицах измерения признаков, а

в долях СКО результативного признака:

 

 

 

А

 

 

r b

x

.

(3.14)

 

 

 

xy

 

 

 

 

 

бy

 

и

 

 

 

 

С

 

 

 

 

 

Интерпретац я коэфф ц ента корреляции такова: отклонение признака-фактора от его среднего значения на величину СКО в среднем по совокупности приводит к отклонению результативного признака от своего среднего значения на rxy его СКО. В отличие от ко-

эффициента регрессии b коэффициент корреляции не зависит от принятых единиц измерения признаков и сравним для любых признаков.

3.6. Статистическое изучение корреляционной связи

Целью статистического исследования является получение модели зависимости результативного признака от признака-фактора для ее практического использования. Решение этой задачи осуществляется следующим образом.

41

3.6.1.Сбор первичной информации, проверка ее на однородность

инормальность распределения

Устанавливаются результативный показатель y и влияющий на его изменение фактор x.

Для оценки однородности совокупности используется коэффи-

циент вариации по факторному признаку

V

Sx

100%,

(3.15)

 

 

x

 

 

где x, Sx –выборочное среднее и оценка СКО факторного признака соответственно, определяемые по формулам (2.1), (2.17), (2.3), (2.18) в зависимости от объема выборки.

Совокупность считается однородной, если коэффициент вариации V не превышает 33 %.

Проверка нормальности распределения исследуемых факторных признаков проводится по методике, изложенной в подразд. 2.7. Для

упрощения процедуры проверки можно воспользоваться табл. 3.2.

 

 

 

 

 

 

 

 

 

 

 

 

И

Таблица 3.2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Проверка признака-фактора на нормальность

 

 

 

 

 

 

 

 

 

 

 

Д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Удельный вес

 

 

 

Интервалы

 

 

Число единиц,

Удельный вес

единиц, входящих

 

 

 

 

 

входящ х

А

 

в интервал, при

значений фактора

 

единиц, входящих

в

нтервал

 

в интервал, %

нормальном

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б

 

 

распределении, %

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

2

 

 

3

4

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x Sx x Sx

 

 

 

 

 

 

68,3

 

x

2Sx

x

2Sx

 

 

 

 

 

95,4

 

x

3Sx

x

3Sx

 

 

 

 

 

 

99,7

 

 

 

 

 

 

С

 

 

 

 

 

Сопоставление данных граф 3 и 4 позволяет судить о наличии или отсутствии нормальности распределения. На практике часто встречаются случаи отклонения закона распределения факторов от нормального, однако это не означает, что следует отказаться от применения корреляционного анализа.

42

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]