Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Шелехова Л.В. Математические методы (в схемах)

.pdf
Скачиваний:
204
Добавлен:
30.05.2015
Размер:
3.74 Mб
Скачать

 

R

 

 

 

 

на-

S эмп ходиться в зоне значимости, следовательно, с заданным уровнем значимости

0,05 гипотеза о нормальности распределения принимается.

Вкачестве показателя точности модели используем среднюю абсолютную ошибку:

 

 

1

n

 

 

 

4

 

 

 

 

 

абс

 

 

 

i

 

 

 

0,4

. На 0,4 в среднем отклоняются фактические значения от модели.

 

 

 

 

 

ni 1

 

 

 

10

 

 

 

 

 

 

 

 

5.3. НЕЛИНЕЙНЫЕ МОДЕЛИ РЕГРЕССИИ

В психолого-педагогических исследованиях соотношения между изучаемыми признаками, как правило, выражаются нелинейными функциями.

Классы нелинейных регрессий

регрессии, нелинейные по переменным, включенным в анализ, но линейные по оцениваемым параметрам

Полиномы разных степеней

у а bx cx2

у а bx cx2 dx3

Равносторонняя гипербола

у а b

х

Введением новых переменных данную модель сводят к линейной модели, для оценки параметров которой можно использовать метод наименьших квадратов.

регрессии, нелинейные по оцениваемым

параметрам

Степенная функция

у а xb

Показательная функция

у а bx

Экспоненциальная функция

у еа bx

Линеаризация модели с помощью логарифмирования обеих частей уравнения.

Пример. Была обследована выборка из 10 респондентов по степени владения двумя коммуникативными навыками: активное слушание и снижение эмоционального напряжения. Измерения проводились по 10-балльной шкале и представлены в таблице:

№ респондента

1

2

3

4

5

6

7

8

9

10

Активное слушание

6

3

4

4

6

4

3

6

6

5

Снижение эмоционального напряжения

5

1

4

4

4

5

5

5

5

6

 

 

 

 

 

 

 

 

 

 

 

Построение парной линейной регрессии, оценивание ее параметров и их значимости можно выполнить с помощью программы «Анализ данных в EXCEL», инструмента «Регрессия». С этой целью построим вспомогательную таблицу:

130

 

у

 

х

lg(y)

lg(x)

 

z

 

 

z

1

 

 

 

x

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

5

0,778151

0,69897

 

2,236068

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

1

0,477121

0

 

1

 

 

1

 

 

 

 

4

 

4

0,60206

0,60206

 

2

 

 

0,5

 

 

 

4

 

4

0,60206

0,60206

 

2

 

 

0,5

 

 

 

6

 

4

0,778151

0,60206

 

2

 

 

0,5

 

 

 

6

 

5

0,778151

0,69897

 

2,236068

0,2

 

 

 

3

 

5

0,477121

0,69897

 

2,236068

0,2

 

 

 

6

 

5

0,778151

0,69897

 

2,236068

0,2

 

 

 

6

 

5

0,778151

0,69897

 

2,236068

0,2

 

 

 

5

 

6

0,69897

0,778151

 

2,44949

0,166

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим различные варианты уравнения регрессии:

 

 

 

 

 

 

 

 

а) Линейное уравнение регрессии.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

 

Множественный R

 

 

0,537359

 

 

 

 

 

 

 

 

 

R-квадрат

 

 

0,288754

 

 

 

 

 

 

 

 

 

Нормированный R-квадрат

 

0,199849

 

 

 

 

 

 

 

 

 

Стандартная ошибка

 

 

1,150954

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

 

Стандартная ошибка

 

 

Y-пересечение

 

 

2,646341

 

 

 

 

1,302404

 

 

Переменная X 1

 

 

0,512195

 

 

 

 

0,284208

 

 

 

 

 

 

 

 

 

Линейное уравнение регрессии имеет вид: ˆу( х ) 2,65

0,51х.

 

 

 

 

б) Степенное уравнение регрессии.

Построению степенной модели ˆу а хbпредшествует процедура линеаризации переменных, которая производится путем логарифмирования обеих частей уравнения:

lg y lg a b lg x. После введения обозначений: У lg y,

Х lg x и А lg a уравне-

ние примет линейный вид: У А b X .

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

Множественный R

 

0,57526

 

 

 

 

R-квадрат

 

0,330924

 

 

 

 

Нормированный R-квадрат

 

0,24729

 

 

 

 

Стандартная ошибка

 

0,109256

 

 

 

 

 

 

Коэффициенты

 

Стандартная ошибка

 

 

Y-пересечение

 

0,475655

 

0,105913

 

 

Переменная X 1

 

0,327599

 

0,164692

 

 

 

 

 

 

 

 

 

В результате получили

уравнение У 0,48 0,32Х . Степенное уравнение регрес-

сии имеет вид: ˆу 3,02 х0,32.

в) Показательное уравнение регрессии.

Построению показательной модели ˆу а bхпредшествует процедура линеаризации

переменных, которая

производится путем логарифмирования обеих

частей уравнения:

lg y lg a x lg b.

После введения обозначений: У lg y, В lg b

и А lg a уравне-

ние примет линейный вид: У А B x.

131

 

Регрессионная статистика

 

Множественный R

0,560195

 

R-квадрат

0,313818

 

Нормированный R-квадрат

0,228045

 

Стандартная ошибка

0,110644

 

 

Коэффициенты

Стандартная ошибка

Y-пересечение

0,444864

0,125203

Переменная X 1

0,05226

0,027322

 

 

 

В результате получили

уравнение У 0,44 0,05х. Показательное уравнение рег-

рессии имеет вид: ˆу 100,44

100,05х 2,75 1,12 х .

г) Уравнение регрессии в виде полинома степени

1

.

 

 

 

 

 

2

 

 

 

Нахождению уравнения полинома степени 1

ˆу а b

х

предшествует процеду-

 

 

2

 

 

 

 

 

ра линеаризации переменных, которая производится путем замены переменной z х :

ˆу а b z.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

 

Множественный R

 

 

 

0,547106

 

 

 

 

 

 

 

 

R-квадрат

 

 

 

 

 

 

 

 

 

0,299325

 

 

 

 

 

 

 

 

Нормированный R-квадрат

 

 

 

0,21174

 

 

 

 

 

 

 

 

Стандартная ошибка

 

 

 

1,142369

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

 

 

Стандартная ошибка

 

 

Y-пересечение

 

 

 

 

 

 

 

1,270673

 

 

1,996177

 

 

Переменная X 1

 

 

 

 

 

 

1,759262

 

 

0,95164

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В результате получили

 

 

уравнение ˆу 1,27 1,76 z.

Уравнение регрессии в виде

 

 

1

 

 

 

ˆу 1,27 1,76

 

 

 

.

 

 

 

 

 

 

 

полинома степени

имеет вид

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

д) Уравнение регрессии в виде равносторонней гиперболы.

 

 

 

 

Нахождению уравнения равносторонней гиперболы

ˆу а b

1

предшествует про-

 

 

 

 

 

цедура

 

линеаризации переменных, которая производится

 

х

 

путем замены переменной

 

1

 

ˆ

 

а

 

b

 

z.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

 

 

 

 

Множественный R

 

 

 

0,564154

 

 

 

 

 

 

 

 

 

R-квадрат

 

 

 

 

 

 

 

 

0,31827

 

 

 

 

 

 

 

 

 

Нормированный R-квадрат

 

 

 

0,233054

 

 

 

 

 

 

 

 

 

Стандартная ошибка

 

 

 

1,126819

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициенты

 

 

 

 

 

 

Стандартная ошибка

 

 

 

 

Y-пересечение

 

 

 

5,902942

 

 

0,629522

 

 

 

 

Переменная X 1

 

 

 

-2,73579

 

 

1,41562

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В результате получили

уравнение ˆу 5,9 2,7 z. Уравнение регрессии в виде рав-

носторонней гиперболы имеет вид ˆу 5,9 2,7

 

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

 

 

 

 

 

Степенному уравнению регрессии соответствует максимальное из имеющихся значений, значение скорректированного коэффициента детерминации (0,24729), следовательно, данная модель наиболее точно отражает взаимосвязь между двумя коммуникативными навыками: активное слушание и снижение эмоционального напряжения.

132

5.4МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ

Уравнение множественной линейной регрессии

среднее значение изменения результативного признака y при изменении факторных признаковxi , i = 1;n на одну единицу их измерения

 

 

 

 

 

где

 

ˆyx a0 a1xi1 a2xi2 ... ak xik i, i 1;n

показывает

имеет вид

ŷ теоретическое значение результативного признака, полу-

ченное по уравнению регрессии

 

 

 

 

Коэффициент (параметр) уравнения регрессии. Коэффици-

ai, i =

 

 

 

ент регрессии аi показывает, на какую величину в среднем из-

0;k

 

 

 

 

 

менится значение результативного признака y при изменении

 

 

 

 

факторного признака xi на одну единицу его измерения при

 

 

 

 

фиксированном значении других факторов, входящих в уравне-

 

 

 

 

ние регрессии.

независимая, нормально распределенная случайная вели- εi чина (остаток i yi ˆyi с нулевым математическим ожиданием и постоянной дисперсией), отражает тот факт, что изменение у будет неточно описываться изменением х, изза присутствия других факторов, не учтенных в данной мо-

дели.

Формулы для определения значения параметров ai, i = 0;k

1 способ

1 Записать уравнение линейной множественной регрессии в матричной форме

 

y1

 

 

a0

 

 

1

x11

...

x1k

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y = AX + еили

y 2

 

 

a1

 

 

1

x21

...

x2k

 

 

2

 

 

...

 

 

 

 

 

 

 

...

...

...

 

 

 

 

 

 

 

 

...

 

 

...

 

 

...

 

 

 

 

 

 

 

 

 

1

xn1

...

xnk

 

 

 

n

 

 

yn

 

ak

 

 

 

 

 

 

 

где Y – вектор значений зависимой переменной.

X – матрица значений независимых переменных A– вектор неизвестных параметров

– вектор случайных отклонений

2 Вычислить параметры регрессионного уравнения по формуле:

А Х / Х -1 Х /Y .

2 способ

Параметры уравнения регрессии можно определить с помощью программы

«Анализ данных в EXCEL», инструмента «Регрессия».

133

ОЦЕНКА ЗНАЧИМОСТИ КАЖДОГО КОЭФФИЦИЕНТА УРАВНЕНИЯ РЕГРЕССИИ

 

 

 

t-критерия Стьюдента

 

 

 

 

 

 

 

гипотезы

 

 

 

 

Ho: ai, i = 0;k незначимый коэффициент регрессии

 

H1:ai, i = 0;k значимый коэффициент регрессии

 

 

 

 

t-статистика

 

 

 

 

для любого из коэффициентов регрессии ai, i = 0;k

Определить bii

- диагональные элементы матрицы X /

1

Х .

Вычислить S - стандартное (среднеквадратическое) отклонение

уравнения

регрессии,

определяемое

по

 

формуле:

 

у ˆу 2

 

 

 

 

n k 1

.

 

 

 

 

 

 

 

 

 

 

Вычислить значение t-критерия по формуле: tpac S

ai

b

 

 

 

 

 

 

 

ii

оценка значимости

Определить критические значения t1кр и t2кр, которые отвечают уровням значимости в 5% и 1% с числом степеней свободы df = n-k-1 по таблице № 22 приложения.

Расположить эмпирическое значение критерия tэмп и критические значения t1кр и t2кр на оси значимости.

Если tэмп находится в зоне незначимости, то принимается гипотеза Н0 о незначимости коэффициента регрессии. Если

tэмп находится в зоне значимости, то гипотеза Н0 отклоняется и принимается гипотеза Н1 о значимости коэффициента

регрессии. Если tэмп находится в зоне неопределенности, то существует вероятность принятия ложного решения.

134

Пример. Даны следующие условные данные о:

У – количестве решенных задач на контрольной работе; Х1 (ч) – количестве времени, затраченном на подготовку обучающегося к контрольной

работе;

Х2 (%) – степени использования информационных технологий в процессе подготовки к контрольной работе. Предполагая, что между У, Х1 и Х2 существует линейная корреляционная зависимость, найдите ее аналитическое выражение, используя данные, приведенные в таблице:

 

1

 

2

 

 

3

 

 

4

 

 

 

5

 

 

 

 

6

 

7

 

 

 

8

9

10

 

xi1

 

8

 

11

 

 

12

 

 

9

 

 

 

8

 

 

 

 

8

 

9

 

 

 

9

8

12

 

xi2

 

5

 

8

 

 

8

 

 

5

 

 

 

7

 

 

 

 

8

 

6

 

 

 

4

5

7

 

yi

 

5

 

10

 

 

10

 

 

7

 

 

 

5

 

 

 

 

6

 

6

 

 

 

5

6

8

 

 

Для

нахождения

параметров

регрессионного

уравнения воспользуемся

формулой

А Х / Х -1 Х /Y .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

1

...

1

1

8

5

 

 

10

94

63

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

11

8

 

 

 

 

 

 

 

 

 

 

 

 

 

Учитывая, что X / X

 

8

11

...

12

 

 

 

 

94

908

606

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

8

...

7

... ...

 

 

63

603

417

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

12

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

15027

1209

522

 

 

 

68

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X /

X

 

 

1209

201

108

и

Х /

У 664

 

получим

3738

 

 

 

 

 

522

108

 

 

 

 

 

 

 

 

 

 

 

 

 

244

 

 

 

445

 

 

1

 

13230

3,54

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

А

 

 

 

3192

 

 

0,85

.

 

 

 

 

 

 

 

3738

 

 

 

 

 

 

 

 

 

1372

 

 

0,37

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Уравнение регрессии примет вид ˆyx 3,54 0,85x1 0,37x2.

Данное уравнение показывает, что при увеличении только количества времени Х1, затраченного на подготовку обучающегося к контрольной работе (при неизменном Х2) на 1 ч, количество решенных задач на одного обучающегося увеличится в среднем на 0,85; а при увеличении только уровня использования информационных технологий в процессе подготовки к контрольной работе Х2 (при неизменном Х1) - в среднем на 0,37.

Для определения значимости каждого из коэффициентов уравнения регрессии составим вспомогательную таблицу.

 

1

 

2

 

3

 

4

 

5

 

6

 

7

8

 

9

 

 

10

 

xi1

 

8

 

11

 

12

 

9

 

8

 

8

 

9

9

 

8

 

 

12

 

xi2

 

5

 

8

 

8

 

5

 

7

 

8

 

6

4

 

5

 

 

7

 

yi

 

5

 

10

 

10

 

7

 

5

 

6

 

6

5

 

6

 

 

8

 

ˆy

 

5,13

 

8,79

 

9,64

 

5,98

 

5,86

 

6,23

6,35

5,61

5,13

 

9,28

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i2

 

0,016

1,464

 

1,127

1,038

0,741

0,052

0,121

0,377

0,762

 

1,631

7,329

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

tpac

 

 

 

3,54

0,004;

tpac

 

 

0,85

 

0,008; tpac

 

 

0,37

0,003.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

7,329 15027

 

 

 

1

7,329 201

 

2

7,329 244

 

 

 

 

Расчетные значения t-критерия сравним с табличным значением t ,

2,365 при усло-

вии, что df 10 2 1 7

и уровень значимости 0,05. Расчетные значение t-критерия

135

меньше, чем его табличное значение t , , поэтому параметры признаются незначимыми, то

есть найденные значения параметров обусловлены случайными совпадениями. Сделанные выводы о взаимосвязи факторных переменных и результативного признака несостоятельны.

Из-за различия единиц измерения исследуемых показателей и разной степени колеблемости нельзя сопоставить факторные признаки по степени их влияния на зависимую переменную. Для это используют коэффициент эластичности или β-коэффициент.

Коэффициент эластичности

показывает

на сколько процентов изменяется результативный признак у при изменении факторного признака хi на один процент

вычисляется по формуле

Эi ai xi y

β-коэффициент

показывает

на какую часть своего среднеквадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака хi на величину своего среднеквадратичного отклонения при фиксированном значении остальных независимых переменных

вычисляется по формуле

i аi xi

y

Указанные коэффициенты позволяют проранжировать факторы по степени влияния факторов на зависимую переменную.

Дельта-коэффициент

показывает

 

 

вычисляется по формуле

 

 

 

 

 

 

 

 

 

долю влияния фактора в суммар-

 

 

i

 

 

 

ном влиянии всех факторов

r

 

, где r

yi

– коэффициент

i R2

 

 

 

i

 

 

парной корреляции между фактором хi

и зависимой переменной, R2 – коэффициент множественный детерминации

136

Коэффициент множественный детерминации используют для оценки качества множественных регрессионных моделей.

Коэффициент множественный детерминации

 

 

 

показывает

 

 

 

вычисляется по формуле

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

долю

вариации результативного

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 2

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

признака, находящегося под воз-

 

 

 

 

 

 

ˆ

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

действием факторных признаков,

 

 

R2 1

 

 

i

 

 

yi

- y

 

 

 

то есть определяет, какая доля ва-

 

 

 

 

i 1

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

риации признака у учтена в модели

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

и обусловлена влиянием на него

 

 

 

yi -

 

2

 

yi -

 

 

 

 

 

 

 

y

y

 

 

 

факторов, включенных в модель

 

 

 

 

i 1

 

i 1

 

 

 

 

 

 

 

 

 

 

 

 

Чем ближе R2 к 1, тем выше качество модели.

R2 увеличивается,

 

 

 

При добавлении независимых переменных

значение

 

поэтому коэффициент R2 должен быть скорректирован с учетом числа незави-

 

симых переменных по формуле: Rкор2

1 1 R2

 

п 1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Определение значимости уравнения регрессии в целом

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F-критерий Фишера

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

Сформулировать гипотезы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H0

Уравнение регрессии в целом незначимо.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H1

Уравнение регрессии в целом значимо.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 В случае множественной линейной регрессии значимость модели определя-

ется по формуле: Fрасч

R2

 

 

n k 1

 

 

 

.

1 R

2

 

 

 

k

3Определить критические значения F1кр и F2кр, которые отвечают уровням значимости в 5% и 1% по таблице № 23 приложения при df1 k и df2 n k 1.

4Расположить значения критерия Fрасч, критические значения F1кр и F2кр на оси значимости.

5Если Fрасч находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии значимости уравнения регрессии. Если Fрасч находится в зоне значимости, то гипотеза об отсутствии значимости уравнения регресии Н0 отклоняется и принимается гипотеза Н1 о наличии значимости уравнения регрессии. Если Fрасч находится в зоне неопределенности, то существует вероятность принятия ложного решения.

137

Мультиколлинеарность это

тесная зависимость между факторными признаками, включенными в модель

Изменения, возникающие под воздействием мультиколлинеарности

муьтиколлинеарность

способствует завышению значений параметров модели

приводит к искажению смысла психолого-педагогической интерпретации коэффициентов регрессии

осложняет процесс определения наиболее существенных факторных признаков

вызывает слабую обусловленность системы нормальных уравнений

ПРИЧИНЫ ВОЗНИКНОВЕНИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ МЕЖДУ ПРИЗНАКАМИ

изучаемые факторные признаки характеризуют одну и ту же сторону явления или процесса

использование в качестве факторных признаков, суммарное значение которых представляет собой постоянную величину

факторные признаки являются элементами друг друга

СПОСОБЫ ОПРЕДЕЛЕНИЯ НАЛИЧИЯ ИЛИ ОТСУТСТВИЯ МУЛЬТИКОЛЛИНЕАРНОСТИ

 

 

 

 

 

исследование матрицы (X / X)

 

анализ матрицы коэффициентов

 

 

 

парной корреляции

 

 

 

 

 

если определитель матрицы (X / X)

 

 

 

 

 

 

 

факторы

xi и xj могут быть

 

близок к нулю, то это свидетельст-

 

признаны мультиколлинеарными,

вует о мультиколлинеарности

 

если rxi xj

0,8

 

 

 

138

Метод уменьшения (устранения) мультиколлинеарности

Построить множественную линейную регрессию, включая все факторы, с помощью программы «Анализ данных в EXCEL», инструмента «Регрессия».

Построить множественную линейную регрессию, используя оставшиеся факторы, с помощью программы «Анализ данных в EXCEL», инструмент «Регрессия».

Проверить значимость коэффициентов уравнения регрессии при помощи t-критерия Стьюдента

существует незначимый коэффициент уравнения регрессии

из модели исключить фактор, коэффициент при котором незначим и имеет наименьшее значение t-критерия.

все коэффициенты уравнения регрессии значимы

модель признается близкой к оптимальной

Пример. Была обследована выборка из 10 респондентов по степени владения тремя важнейшими коммуникативными навыками. Измерения проводились по 10-балльной шкале и представлены в таблице:

Активное слушание

Снижение эмоционального

Аргументация

напряжения

 

 

 

1

6

5

5

 

 

 

 

2

3

1

2

 

 

 

 

3

4

4

5

4

4

4

5

 

 

 

 

5

5

4

4

 

 

 

 

6

6

4

3

7

4

3

2

 

 

 

 

8

6

5

4

 

 

 

 

9

5

3

4

 

 

 

 

10

5

5

3

Построение множественной линейной регрессии, оценивание ее параметров и их значимости выполним с помощью программы «Анализ данных в EXCEL», инструмент «Регрессия» (при заполнении значений факторных переменных необходимо указать не один столбец, а все столбцы, содержащие значения данных переменных).

139