Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
1Предмет, метод и задачи ст_ки.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
7.06 Mб
Скачать

4. Регрессионный анализ

.

Регрессионный анализ является составляющим элементом более общего метода количественного статистического анализа связей – корреляционно – регрессионного и заключается в определении аналитического выражения связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).

Целью регрессионного анализа является оценка функциональной зависимости условного среднего значения результативного признака (У) от факторных (х1 , х2 , …, хk).

Одним из важных вопросов построения моделей является их размерность. Практика выработала определенный критерий, позволяющий установить оптимальное соотношение между числом факторных признаков, включаемых в модель, и объемом исследуемой совокупности. Согласно данному критерию число факторных признаков k должно быть в 5 .. 6 раз меньше объема изучаемой совокупности.

Остановимся более подробно на модели парной линейной регрессии.

Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитическая связь между ними может описывается следующими элементарными уравнениями:

  • Прямой 0 + а1х;

  • Гиперболы = а0 + а1./ х; (52)

  • Параболы = а0 + а1х + а1х2; и т. д.

Оценка неизвестных параметров уравнения регрессии ( а0, а1, …аn) осуществляется на основе метода наименьших квадратов.

Сущность метода наименьших квадратов заключается в нахождении параметров модели а0, а1, …аn , при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии.

S =

Для линейной зависимости имеем

S = (53)

Производя частное дифференцирование зависимости (53) по параметрам а0, а1, …аn приходим к системе нормальных уравнений. Для линейной парной регрессии система нормальных уравнений имеет вид

;

(54)

где n – объем исследуемой совокупности ( число единиц наблюдения)

Пример. Имеются данные, характеризующие деловую активность акционерных обществ закрытого типа прибыль ( тыс. рубл.) и затраты на 1 руб. произведенной продукции (коп.) . Эти данные приведены в таблице 26 Предположим наличие линейной зависимости между рассматриваемыми признаками.

Таблица 26 - Расчет сумм для определения параметров парного линейного уравнения регрессии

п/п

Затраты на 1 руб. произведенной продукции, коп.

Х

Прибыль, тыс. руб.,

У

Х2

ХУ

1

2

3

4

5

6

77

77

81

82

89

96

1070

1001

789

779

606

221

5929

5929

5561

6724

7921

9216

82390

77077

63909

63878

53934

21216

1016

1016

853

812

527

242

Итого

502

4466

42280

362404

4466

Система нормальных уравнений для данного примера имеет вид (54 ) а в числовом варианте

0 + 502а1 = 4466;

502 а0 + 42280 а1 = 362 404

Откуда: а0 = 4153,88; а1 = - 40,75.

Следовательно, уравнение регрессии имеет вид

= 4153,88 – 40, 75х .

Оценка адекватности моделей построенных на основе уравнений регрессии начинается с проверки значимости коэффициентов регрессии.

Значимость коэффициентов регрессии осуществляется с помощью t - критерия Стьюдента

, (55)

где - дисперсия коэффициента регрессии.

Параметр модели признается статически значимым, если выполняется условие

tр  tkp (; n =n-2), (56 )

где  - уровень значимости.

n = (n -2) - число степеней свободы, которое характеризует число свободно варьирующих элементов совокупности.

Дисперсию можно определить можно определить по зависимости

, (57)

Проверка адекватности регрессионной модели в целом осуществляется с помощью расчета F - критерия ФИШЕРА и величины средней ошибки аппроксимации .

Если FрF при  = 0,05 или  = 0,01, то H0 - гипотеза о несоответствии заложенных в уравнении регрессии связей реально существующим отвергается. Величина F определяется по специальным статистическим таблицам.

Значение средней ошибки аппроксимации не должно превышать (12…15)%