Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Макарова Н.В. Статистика в Excel-1

.pdf
Скачиваний:
2
Добавлен:
11.04.2024
Размер:
11.91 Mб
Скачать

значимости коэффициента детерминации ^ включает в себя так­ же и проверку значимости каждого коэффициента рефессии.

Значимость коэффициентов рефессии проверяется с помо­ щью /-критерия Стьюдента:

где С5^. - стандартное значение ошибки для коэффициента рефес­ сии А/.

Вматематической статистике доказывается, что если гипотеза

Щla^ — O выполняется, то величина / имеет распределение Стью­ дента с А: = п—т-1 числом степеней свободы, т. е.

^.^tik^rt'-m-l).

Гипотеза Щ:а^==0 о незначимости коэффициента регрессии отвергается, если |/р( > (/^|.

Кроме того, зная значение /^, можно найти фаницы довери­ тельных интервалов для коэффициентов рефессии:

_min ^ „ ^ —

„max „ ^ ««

При экономической интерпретации уравнения регрессии так­ же широко используются частные коэффициенты эластичности,

показывающие, на сколько процентов в среднем изменится значе­ ние результативного признака при изменении значения соответст­ вующего факторного признака на 1%, и определяемые по формуле

У

где Xf — среднее значение соответствующего факторного признака; у' - среднее значение результативного признака; а,- - коэффициент регрессии при соответствующем факторном

признаке.

270

14.2.

Справочная информация по технологии работы

Режим работы «Регрессия» служит для расчета параметров уравнения линейной регрессии и проверки его адекватности иссле­ дуемому процессу

В диалоговом окне данного режима (рис. 14.1) задаются следу­ ющие параметры:

1.Входной интервал Y— вводится ссылка на ячейки, содержа­ щие данные по результативному признаку Диапазон должен со­ стоять из одного столбца.

2.Входной интервал Х— вводится ссылка на ячейки, содержа­ щие факторные признаки. Максимальное число входных диапа­ зонов (столбцов) равно 16.

3.Метки в первой строке/Метки в первом столбце — см. под-

разд. 1.L2.

4.Уровень надежности — установите данный флажок в актив­ ное состояние, если в поле, расположенное напротив флажка, не­ обходимо ввести уровень надежности, отличный от уровня 95 %, применяемого по умолчанию. Установленный уровень надежнос­ ти используется для проверки значимости коэффициента детер­ минации В^ и коэффициентов регрессии а^.

Примечание. При неактивном флажке Уровень надежности в таблице па­ раметров уравнения регрессии (см. табл. 14.4, 14.9) генерируются две одина­ ковые пары столбцов для границ доверительных интервалов.

5.Константа-ноль — установите данный флажок в активное состояние, если требуется, чтобы линия регрессии прошла через начало координат (т. е. ^о = 0).

6.Выходной интервал/Новый рабочий лист/Новая рабочая кни­ га - см. подразд. 1.1.2.

7.Остатки — установите данный флажок в активное состоя­ ние, если требуется включить в выходной диапазон столбец остат­ ков (см. столбец Остатки в табл. 14.5).

8.Стандартизованные остатки — установите данный флажок

вактивное состояние, если требуется включить в выходной диапа­

зон столбец стандартизованных остатков (см. столбец Стандарти­ зованные остатки в табл. 14.5).

271

Регрессия

 

 

 

 

 

 

i |5>днсй интеграл Y:

^

 

 

 

 

 

 

 

 

От!1вна

:•' е^днс^ интервал X:

 

 

 

1 ^ \

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

Кщстакта - ноль

:

Г--Г—^;

ЙП ^^э«я9ень надежности!

95

 

 

 

 

гЙаранетры ш>шода -

 

 

 

 

 

 

й^уГ" •^{)^йднои интервал'! • •

 

 

.«лы

 

 

I; Г Новая райоч^ щ^га

 

 

 

 

 

,;1-:гОстатки '--;•- — -

-

 

 

 

 

 

|1 Г" Остатки

 

 

Р

График остапгков

 

 

\; Г" Cx^Д^И30fea^«^Ы6 остатки

Р

График аоДбора

 

 

;|i:;Hopнam>^шйёep0^

!; Р rp^j«^ (^рр»1альной е«1Хятности

Рис. 14.1

9. График остатков — установите данный флажок в активное состояние, если требуется вывести на рабочий лист точечные фафики зависимости остатков от факторных признаков х^.

10.График подбора - установите данный флажок в активное состояние, если требуется вывести на рабочий лист точечные гра­ фики зависимости теоретических результативных значений у от факторных признаков JC/.

11.График нормальной вероятности — установите данный фла­ жок в активное состояние, если требуется вывести на рабочий лист точечный график зависимости наблюдаемых значений ;; от автоматически формируемых интервалов персентилей. График строится на основе генерируемой таблицы «Вывод вероятности» (см. табл. 14.6).

Пример 14.1. Данные о прибыли предприятий Y, величине оборотных средств Xi и стоимости основных фондов Xj приведены в табл. 14.1, сформированной на рабочем листе Microsoft Excel.

272

 

 

 

 

 

Таблица 14.1

 

 

 

 

Величина

f^...L-'.-S;;:-:-^-^:^

 

 

 

 

Стоимость

 

••г. J-"-^':

Номер

Прибыль Y,

оборотных

основных

 

предприятия

млн руб.

средств Xi у

фондов ^2,

 

 

 

 

 

 

 

 

млн руб.

млн руб.

 

' • • • • • : • - ^ . U i

••'

1

188

129

510

 

 

 

 

 

 

i.;;:;4:;:;:-

2

78

64

190

1

•}::Ш::

3

93

69

240

 

;-'^-*'V:

4

152

87

470

 

У Ж

I

5

55

47

ПО

 

 

 

6

161

102

420

 

По представленным данным необходимо определить парамет­ ры уравнения линейной рефессии и провести его анализ.

Для решения задачи используем режим работы «Регрессия». Значения параметров, установленных в одноименном диалоговом окне, представлены на рис. 14.2, а рассчитанные в данном режиме показатели - в табл. 14.2—14.6.

Щх^'

•'' ' ""'

Таблица 14,2

^.,:..^,.......^..^^^^^^

^^^ш вывод итогов

^^в

Регрессионная статистика

 

 

 

 

Множественный R

0,997

 

 

У?-квадрат

0,995

1

 

Нормированный

 

 

 

/?-квадрат

0,991

 

 

Стандартная ошибка

5,050

'

^^шш^ш Наблюдения

6

 

273

Регрессия

От?«ка

ffyasg^ J3

П Ka»«T«ffa - «ОЛЬ

^уГ*>Йовдз»р<' •'

-ига

Рис. 14.2

В табл. 14.2 сгенерированы результаты по рефессионной ста­ тистике. Эти результаты соответствуют следующим статистичес­ ким показателям:

Множественный R - коэффициенту корреляции R;

К'Квадрат - коэффициенту детерминации Л^;

Стандартная ошибка — остаточному стандартному откло­ нению

СГп =

Наблюдения - числу наблюдений п.

Втабл. 14.3 сгенерированы результаты дисперсионного анали­ за, которые используются для проверки значимости коэффициен­ та детерминации R^.

274

Таблица 14.3

в

С

0

Е

F ' ]

G

 

 

Дисперсионный анализ

 

^^Ш

 

 

 

 

Значи­

#

55

Л/5

F

мость F

 

 

 

Рефсссия

2

13962,33

6981,16

273,74

0,0004

Остаток

3

76,51

25,50

 

 

^шш Итого

5

14038,83

 

 

 

Столбцы табл. 14.3 имеют следующую интерпретацию:

1. Столбец df-- число степеней свободы.

Для строки Регрессия число степеней свободы определяется количеством факторных признаков т в уравнении регрессии

Для строки Остаток число степеней свободы определяется числом наблюдений п и количеством переменных в уравнении ре­ грессии m + 1: А:о = л-(/^+1).

Для строки Итого число степеней свободы определяется сум­ мой ку — кф-^ kQ.

2. Столбец SS - сумма квадратов отклонений.

Для строки Регрессия — это сумма квадратов отклонений тео­ ретических данных от среднего:

ssi^ZiPi-y)Т7\2

ы

Для строки Остаток - это сумма квадратов отклонений эмпи­ рических данных от теоретических:

/=1

Для строки Итого - это сумма квадратов отклонений эмпири­ ческих данных от среднего:

275

3. Столбец МУдисперсии, рассчитываемые по формуле

Для строки Регрессия — это факторная дисперсия аф.

Для строки Остаток - это остаточная дисперсия GQ.

4. Столбец F - расчетное значение /'-критерия Фишера Fp, вычисляемое по формуле

МУ(Регрессия) /п=- М8{0статки)

5. Столбец Значимость F- значение уровня значимости, соот­ ветствующее вычисленному значению F^, Определяется с помо­ щью функции

=РРАСП(/'р; а5^регрессия);4^остаток)),

Втабл. 14.4 сгенерированы значения коэффициентов регрес­ сии а^ и их статистические оценки.

Таблица 14.4

 

i£^

^ferfa.

 

 

^^^ш^

 

ущ^^Мт^щ.

 

 

 

 

 

yj^

••^4Мш^^т

 

 

 

 

 

 

 

Коэф­ Стан­ t-cma- Р-зна- Ниж­

Верх­ Ниж­ Верх-'

 

фици­ дарт­

тис-

чение

ние

ние

ние

иие

 

енты

ная

тика

 

95%

95%

95,0% 95,0V

 

 

ошиб­

 

 

 

 

 

 

 

 

ка

 

 

 

 

 

 

:;--|р: Y-пересече-

-1,94

7,63

-0,25

0,82

-26,21

22,32

-26,21

22,32 i

ние

 

 

 

 

 

 

 

 

Величина

 

 

 

 

 

 

 

 

оборотных

 

0,20

 

 

 

 

0,07

U32

средств A'l,

0,69

3,53

0,04

0,07

1,32

млн руб.

 

 

 

 

 

 

 

 

Стоимость

 

 

 

 

 

 

 

 

основных

0,20

0,04

5,75

0,01

0,09

0,31

0,09

0,31

фондов ^2,

млн руб.

 

 

 

 

 

 

 

 

276

Столбцы табл. 14.4 имеют следующую интерпретацию: L Коэффициенты - значения коэффициентов а^.

2, Стандартная ошибка - стандартные ошибки коэффициен­ тов а^,

3. t-статистика - расчетные значения Г-критерия, вычисляе­ мые по формуле

Коэффициенты /-статистика = Стандартная ошибка

5. Р'Значение - значения уровней значимости, соответствующие вычисленным значениям /р. Определяются с помощью функции

=СТЬЮДРАСП(Гр;л-т-1).

6. Нижние 95 % VL Верхние 95 % — соответственно нижние и верхние границы доверительных интервалов для коэффициентов регрессии а^. Для нахождения границ доверительных интервалов с помощью функции = СТЬДРАСПОБР (а; « - /w - 1) рассчитыва­ ется критическое значение /-критерия /^р? а затем по формулам

Нижние 95% = Коэффициент - Стандартная ошибка • t^; Верхние 95% = Коэффициент + Стандартная ошибка • /Jф

вычисляются соответственно нижние и верхние границы довери­ тельных интервалов.

Таблица 14.5

Предсказанная

 

Стандарт­

Наблюдение прибыль У,

Остатки

ные остатки

млн руб.

 

 

 

190,91

-2,91

-0,74

80,98

-2,98

-0,76

94Д7

-1,57

-0,40

153,62

-1,62

-0,42

52,98

2,02

0,52

153,93

7,07

1,81

277

в табл. 14.5 сгенерированы теоретические значения р/ резуль­ тативного признака Y и значения остатков. Последние вычисля­ ются как разность между эмпирическими у и теоретическими у^ значениями результативного признака К

G :

вы в о д ВЕРОЯТНОСТИ

Таблица 14.6

н

Э4

t::;35

Персентиль

Прибыль К, млн руб.

 

8,33

55

17

25

78

41,67

93

 

Ш 40..

58,33

152

75

161

:Л4.1.:..

91,67

188

В табл. 14.6 сгенерированы интервалы персентилей и соответ­ ствующие им эмпирические значения >^.

Перейдем к анализу сгенерированных таблиц.

Рассчитанные в табл. 14.4 (ячейки С27:С29) коэффициенты регрессии Д/ позволяют построить уравнение, выражающее зави­ симость прибыли предприятий Уот величины оборотных средств Xi и стоимости основных фондов Х2^

5? =^1,94+ 0,69x1+ 0,20x2.

Значение множественного коэффициента детерминации f^ - 0,995 (ячейка С15 в табл. 14.2) показывает, что 99,5 % общей вариации результативного признака объясняется вариацией фак­ торных признаков Xi и Х2, Значит, выбранные факторы сущест­ венно влияют на прибыль предприятий, что подтверждает пра­ вильность их включения в построенную модель.

Рассчитанный уровень значимости Ор = 0,0004 < 0,05 (показа­ тель Значимость FB табл. 14.3) подтверждает значимость R^,

Другой подход к проверке значимости R^ (как это делалось во всех ранее рассмотренных режимах надстройки «Пакет анализа»)

основан на проверке попадания /р (показатель FB табл. 14.3) в критическую область (F^^ ^^ + оо). Для рассматриваемого приме­ ра / ^ д = 9,55, которое рассчитывается по формуле

=РРАСПОБР(0,05;С22;С23),

где в ячейке С22 вычисляется число степеней свободы /:ф = m = 2, а в ячейке С23 — число степеней свободы ifco=«-~(/w+l)=6—(2 +1) =3.

Так как F^ = 273,74 попадает в критический интервал (9,55; + оо), то гипотеза Щ\Р^ — 0 отвергается, т. е. коэффициент детер­ минации i?^ является значимым.

Показатель средней ошибки аппроксимации с" = 2,7 % также подтверждает достаточно высокую адекватность построенного уравнения. Данный показатель может быть рассчитан по формуле

{=CyMM(ABS(D36:D41)/(C3:C8))/C4ET(C3:C8)*100},

где в массиве D36: D41 табл. 14.5 рассчитаны разности между эмпи­ рическими и теоретическими значениями результативного при­ знака.

Следующим этапом является проверка значимости коэффи­ циентов регрессии: а^^а^У^^ ^2- Сравнивая попарно элементы мас­ сивов С27:С29 и D27:D29 (см. табл. 14.4), видим, что абсолютное значение свободного члена ^о меньше, чем его стандартная ошиб­ ка. Таким образом, свободный член а^ следует исключить из урав­ нения регрессии.

Стандартные ошибки коэффициентов ai и aj меньше своих стандартных ошибок. К тому же эти коэффициенты являются зна­ чимыми, о чем можно судить по значениям показателя Р-значение в табл. 14.4, которые меньше заданного уровня значимости а = 0,05.

Другой распространенный способ проверки значимости коэффициентов регрессии основан на проверке попадания /р (показатель t'CmamucmuKa в табл. 14.4) в критическую область (-00, /^^3^ ^12) ^{t^^ ф, +оо). В генерируемых таблицах режима не приводится значение /^, но его можно легко вычислить с помо­ щью функции СТЬЮДРАСПОБР. Для рассматриваемого примера значение |/^| = 3,18, которое рассчитывается по формуле

 

 

=СТЬЮДРАСПОБР(0,05;6-2-1),

где 0,05 -

заданный уровень значимости;

6

-

число наблюдений;

2

-

число факторов в уравнении ретрессии;

1

-

число свободных членов в уравнении регрессии.

279