- •Министерство образования российской федерации контрольное задание и методические указания
- •Набережные Челны Введение
- •Общие указания по выполнению контрольной работы
- •Задание 1.
- •Реализация типовой задачи на компьютере с использованием ппп msExcel.
- •Задание 2.
- •Вариант №2
- •Вариант №3
- •Вариант №4
- •Вариант №5
- •Задание 3.
- •Реализация типовой задачи на компьютере с использованием ппп ms excel
- •Задание 4.
- •Статистико-математические таблицы
- •1. Таблица значений f-критерия Фишера при уровне значимости
- •2. Критические значения t-критерия Стьюдента при уровне значимости 0,10; 0,05; 0,01 (двухсторонний)
- •Значение критерия Дарбина-Уотсона ипри 5% уровне значимости
Задание 1.
Вариант 1.
По территориям Центрального района известны данные за 1995 г.:
Район |
Средний размер назначенных пенсий, тыс.руб., (у) |
Прожиточный минимум на одного пенсионера, тыс. руб., (х) |
1 |
2 |
3 |
Владимирская область |
226 |
202 |
Ивановская область |
221 |
197 |
Калужская область |
226 |
201 |
Костромская область |
220 |
189 |
г. Москва |
250 |
302 |
Московская область |
237 |
215 |
Смоленская область |
220 |
180 |
Тверская область |
222 |
181 |
Тульская область |
231 |
186 |
Ярославская область |
229 |
250 |
1. Рассчитать параметры парной линейной регрессии.
2. Оценить тесноту связи с помощью показателей корреляции и детерминации.
3.С помощью средних коэффициентов эластичности дать сравнительную оценку силы связи фактора с результатом.
4 Оценить с помощью средней ошибки аппроксимации качество уравнений.
5. С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования.
6. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α = 0,05.
Вариант 2.
По территориям Волго-Вятского, Центрально-Черноземного и поволжского районов известны данные за ноябрь 1997 г.
Район |
Потребительские расходы в расчете на душу населения, тыс.руб. (у) |
Средняя заработная плата и выплаты социального характера, тыс. руб. (х) |
1 |
2 |
3 |
Республика Марий Эл |
302 |
554 |
Республика Мордовия |
360 |
560 |
Чувашская республика |
310 |
545 |
Кировская республика |
415 |
672 |
Нижегородская область |
452 |
796 |
Белгородская область |
502 |
777 |
Воронежская область |
355 |
632 |
Курская область |
416 |
688 |
Липецкая область |
501 |
833 |
Тамбовская область |
403 |
577 |
Республика Татарстан |
462 |
949 |
Астраханская область |
368 |
888 |
Волгоградская область |
399 |
831 |
Пензенская область |
342 |
562 |
Саратовская область |
354 |
665 |
1. Рассчитать параметры парной линейной регрессии.
2. Оценить тесноту связи с помощью показателей корреляции и детерминации.
3. С помощью средних коэффициентов эластичности дать сравнительную оценку силы связи фактора с результатом.
4. Оценить с помощью средней ошибки аппроксимации качество уравнений.
5. С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования.
6. Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α = 0,05.
Вариант 3.
По территориям Северного, Северо-западного и Центрального районов известны данные за ноябрь 1997 г.:
Район |
Потребительские расходы на душу населения, тыс.руб., (y) |
Денежные доходы на душу населения, тыс, руб.,(х) |
1 |
2 |
3 |
Северный |
|
|
Республика Карелия |
596 |
913 |
Республика Коми |
608 |
1095 |
Архангельская область |
354 |
606 |
Вологодская область |
526 |
876 |
Мурманская область |
934 |
1314 |
Северо - Западный |
|
|
Ленинградская область |
412 |
593 |
Новгородская область |
525 |
754 |
Псковская область |
367 |
528 |
Центральный |
|
|
Брянская область |
364 |
520 |
Владимирская область |
336 |
539 |
Ивановская область |
409 |
540 |
Калужская область |
452 |
682 |
Костромская область |
367 |
537 |
Московская область |
328 |
589 |
Орловская область |
460 |
626 |
Рязанская область |
380 |
521 |
Смоленская область |
439 |
626 |
Тверская область |
344 |
521 |
Тульская область |
401 |
658 |
Ярославская область |
514 |
746 |
Рассчитать параметры парной линейной регрессии.
Оценить тесноту связи с помощью показателей корреляции и детерминации.
С помощью средних коэффициентов эластичности дать сравнительную оценку силы связи фактора с результатом.
Оценить с помощью средней ошибки аппроксимации качество уравнений.
С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования
Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 4% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α = 0,05.
Вариант 4.
По территориям Восточно-Сибирского и Дальневосточного районов известны данные за ноябрь 1997 г.:
Район |
Потребительские расходы на душу населения, тыс.руб., (у) |
Денежные расходы на душу населения, тыс. руб.,(х) |
1 |
2 |
3 |
Восточно-Сибирский |
|
|
Республика Бурятия |
408 |
524 |
Республика Тыва |
249 |
371 |
Республика Хакасия |
253 |
453 |
Красноярский край |
580 |
1006 |
Иркутская область |
651 |
997 |
Усть-Ордынский Бурятский автономный округ |
139 |
217 |
Читинская область |
322 |
486 |
Дальневосточный |
|
|
Республик Саха (Якутия) |
899 |
1989 |
Еврейская авт. обл. |
330 |
595 |
Приморский край |
642 |
937 |
Хабаровский край |
542 |
761 |
Амурская область |
504 |
767 |
Камчатская область |
861 |
1720 |
Магаданская область |
707 |
1735 |
Сахалинская область |
557 |
1052 |
Рассчитать параметры парной линейной регрессии.
Оценить тесноту связи с помощью показателей корреляции и детерминации.
С помощью средних коэффициентов эластичности дать сравнительную оценку силы связи фактора с результатом.
Оценить с помощью средней ошибки аппроксимации качество уравнений.
С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования.
Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α = 0,05
Вариант 5.
По территориям Уральского и Западно-Сибирского районов известны данные за ноябрь 1997 г.:
Район |
Потребительские расходы на душу населения, тыс.руб., (у) |
Денежные расходы на душу населения, тыс. руб.,(х) |
1 |
2 |
3 |
Уральский |
|
|
Респ. Башкортостан |
461 |
632 |
Удмуртская область |
524 |
738 |
Курганская область |
298 |
515 |
Оренбургская область |
351 |
640 |
Пермская область |
624 |
942 |
Свердловская область |
584 |
888 |
Челябинская область |
425 |
704 |
Западно-Сибирский |
|
|
Республика Алтай |
277 |
603 |
Алтайский край |
321 |
439 |
Кемеровская область |
573 |
985 |
Новосибирская область |
576 |
735 |
Омская область |
588 |
760 |
Томская область |
497 |
830 |
Тюменская область |
863 |
2093 |
Рассчитайте параметры парной линейной регрессии.
Оценить тесноту связи с помощью показателей корреляции и детерминации.
С помощью средних коэффициентов эластичности дать сравнительную оценку силы связи фактора с результатом.
Оценить с помощью средней ошибки аппроксимации качество уравнений.
С помощью F-критерия Фишера оценить статистическую надежность результатов регрессионного моделирования.
Рассчитать прогнозное значение результата, если прогнозное значение фактора увеличится на 8% от его среднего уровня. Определить доверительный интервал прогноза для уровня значимости α = 0,05
Второе заданиепредполагает изучение многофакторного корреляционно-регрессионного анализа и расчет характеристик уравнения множественной регрессии с целью получения достоверных статистических выводов о наличии зависимости между результативным и факторными признаками.
Уравнение множественной регрессии имеет следующий вид:
(16)
где у -зависимая переменная (результативный признак);
- независимые переменные (факторы);
- параметры;
- случайная величина (ошибка).
Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений строится следующая система нормальных уравнений, решение которых позволяет получить оценки параметров регрессии:
(17)
Параметры этой системы могут быть найдены, например, методом К. Гаусса.
Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизованном масштабе:
(18)
где ,- стандартизованные переменные;
- стандартизованные коэффициенты регрессии.
К уравнению множественной регрессии в стандартизованном масштабе применим МНК.
Связь коэффициентов множественной регрессии со стандартизованными коэффициентамиописывается соотношением
(19)
Параметр аопределяется как
(20)
Средние частные коэффициенты эластичности для линейной регрессии рассчитываются по следующей формуле:
(21)
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:
(22)
Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:
Индекс множественной корреляции для стандартизованном масштабе можно записать в виде
(23)
Частные коэффициенты (или индексы) корреляции, измеряющие влияние на уфактораопределяются по следующим формулам:
Частный коэффициент корреляции первого порядка между признаками и упри исключении влияния признакавычисляют по формуле:
; (24)
то же - зависимость уотпри исключении влияния:
(25)
Взаимосвязь факторных признаков при устранении влияния результативного признака:
, (26)
где r- парные коэффициенты корреляции между соответствующими признаками.
Частные коэффициенты корреляции изменяются в пределах от -1 до 1.
Парные коэффициенты корреляции рассчитываются по следующим формулам:
; (27)
; (28)
(29)
Среднеквадратические отклонения вычисляются по формулам:
(30)
(31)
(32)
На основе парных коэффициентов корреляции и средних квадратических отклонений можно рассчитать параметры уравнения двухфакторной связи по формулам:
; (33)
; (34)
(35)
Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:
(36)
Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:
(37)
где n- число наблюдений;
m- число факторов (независимых переменных в уравнении).
Решение типового примера 2.
По 20 предприятиям региона (табл. 1) изучается зависимость выработки продукции на одного работника у(тыс. руб.) от ввода в действие новых основных фондов(% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих(%).
Таблица 1
Номер предприятия |
у | ||
1 |
7.0 |
3,9 |
10,0 |
2 |
7.0 |
3.9 |
14,0 |
3 |
7,0 |
3.7 |
15.0 |
4 |
7,0 |
4,0 |
16.0 |
5 |
7,0 |
3,8 |
17,0 |
6 |
7,0 |
4,8 |
19,0 |
7 |
8,0 |
5,4 |
19,0 |
8 |
8,0 |
4,4 |
20,0 |
9 |
8,0 |
5,3 |
20,0 |
10 |
10,0 |
6,8 |
20,0 |
11 |
9,0 |
6,0 |
21,0 |
12 |
11,0 |
6,4 |
22,0 |
13 |
9,0 |
6,8 |
22,0 |
14 |
11,0 |
7,2 |
25,0 |
15 |
12,0 |
8,0 |
28,0 |
16 |
12,0 |
8,2 |
29,0 |
17 |
12,0 |
8,1 |
30,0 |
18 |
12,0 |
8,5 |
31,0 |
19 |
14,0 |
9,6 |
32,0 |
20 |
14,0 |
9,0 |
36,0 |
Требуется:
Построить линейное уравнение множественной регрессии и пояснить экономический смысл его параметров.
Рассчитать средние частные коэффициенты эластичности.
Определить стандартизованные коэффициенты регрессии.
В пп. 2. и 3. на основе полученных результатов сделать вывод о силе связи результата с каждым из факторов.
Определить парные и частные коэффициенты корреляции, а также множественный коэффициент корреляции; сделать выводы.
Дать оценку полученного уравнения на основе коэффициента детерминации и общего F-критерия Фишера.
Решение.
1. Для построения линейного уравнения множественной регрессии необходимо рассчитать параметры уравнения по формулам (33), (34), (35).
Среднеквадратические отклонения определяются по формулам (30), (31), (32); расчет средних величин осуществляется по формулам, приведенным в решении типового примера 1 задания 1 настоящего пособия ((14), (15)).
Представим полученные результаты в расчетной таблице 2:
Таблица 2
|
y | ||||||||
1 |
7 |
3,9 |
10 |
27,3 |
70 |
39 |
49 |
15,21 |
100 |
2 |
7 |
3,9 |
14 |
27,3 |
98 |
54,6 |
49 |
15,21 |
196 |
3 |
7 |
3,7 |
15 |
25,9 |
105 |
55,5 |
49 |
13,89 |
225 |
4 |
7 |
4 |
18 |
28 |
112 |
64 |
49 |
16 |
256 |
5 |
7 |
3,8 |
17 |
26,6 |
119 |
64,6 |
49 |
14,44 |
289 |
6 |
7 |
4,8 |
19 |
33,6 |
133 |
91,2 |
49 |
23,04 |
361 |
7 |
8 |
5,4 |
19 |
43,2 |
152 |
102,6 |
64 |
29,16 |
361 |
8 |
8 |
4,4 |
20 |
35,2 |
160 |
88 |
64 |
19,36 |
400 |
9 |
8 |
5,3 |
20 |
42,4 |
160 |
106 |
64 |
28,09 |
400 |
10 |
10 |
6,8 |
20 |
68 |
200 |
136 |
100 |
46,24 |
400 |
11 |
9 |
6 |
21 |
54 |
189 |
126 |
81 |
36 |
441 |
12 |
11 |
6,4 |
22 |
70,4 |
242 |
140,8 |
121 |
40,96 |
484 |
13 |
9 |
6,8 |
22 |
61,2 |
198 |
149,6 |
81 |
48,24 |
484 |
14 |
11 |
7,2 |
25 |
79,2 |
275 |
180 |
121 |
51,84 |
625 |
15 |
12 |
8 |
28 |
96 |
336 |
224 |
144 |
64 |
784 |
16 |
12 |
8,2 |
29 |
98,4 |
348 |
237,8 |
144 |
67,24 |
841 |
17 |
12 |
8,1 |
30 |
97,2 |
360 |
243 |
144 |
65.61 |
900 |
18 |
12 |
8,5 |
31 |
102 |
372 |
263,5 |
144 |
72.25 |
961 |
19 |
14 |
9,6 |
32 |
134,4 |
448 |
307,2 |
196 |
92,16 |
1024 |
20 |
14 |
9 |
36 |
126 |
504 |
324 |
196 |
81 |
1296 |
Итого |
192 |
123,8 |
446 |
1276,3 |
4581 |
2997,4 |
1958 |
837,74 |
10828 |
ср.значен.. |
9,6 |
6,19 |
22,3 |
63,815 |
229,05 |
149,87 |
97,9 |
41,887 |
541,4 |
5,74 |
3,5709 |
44,11 |
|
|
|
|
|
| |
2,39583 |
1,889683 |
6,641536 |
|
|
|
|
|
|
Парные линейные коэффициенты ()рассчитываются соответственно по формулам (27), (28), (29).
Подставляя соответствующие расчетные значения в исходные формулы, имеем:
Таким образом, линейное уравнение множественной регрессии, выражающее зависимость выработки продукции на одного работника уот ввода в действие новых основных фондови удельного веса рабочих высокой квалификации в общей численности рабочих примет вид:
Анализ коэффициентов уравнения множественной регрессии позволяет сделать вывод о степени влияния каждого их факторов на показатель выработки продукции на одного работника. Параметр свидетельствует о том, что с увеличением ввода в действие новых основных фондов на 1 процентный пункт следует ожидать увеличения выработки продукции на одного работника на 0,9459 тыс. руб. (или 945,9 руб.). Увеличение же удельного веса рабочих высокой квалификации на 1 процентный пункт может привести к увеличению выработки на 0,0857. руб. (или на 85,7 руб.). Отсюда можно сделать соответствующие практические выводы и осуществить мероприятия, направленные на повышение выработки.
2. Средние частные коэффициенты эластичности показывают, на сколько процентов от значения своей среднейизменяется результат при изменении факторана 1% от своей среднейи при фиксированном воздействии навсех прочих факторов, включенных в уравнение регрессии.
Средние коэффициенты эластичности для каждого фактора рассчитаем по формуле (21):
С увеличением ввода в действие новых основных фондов на 1% от его среднего уровня выработка на одного работника возрастает на 0,61% от своего среднего уровня; при повышении удельного веса рабочих высокой квалификации в общей численности рабочих на 1% выработкау увеличивается только на 0,19% от своего среднего уровня. По значениям частных коэффициентов эластичности можно сделать вывод о более сильном влиянии на результатупризнака фактора,чем признака фактора: 0,6% против 0,19%.
3. Связь стандартизованных коэффициентов с коэффициентами множественной регрессииописывается формулой (19), из которой следует:
Анализ показывает, что на выработку продукции на одного работника наибольшее влияние из двух исследуемых факторов с учетом уровня их вариации способен оказать фактор- ввод в действие основных фондов, так как ему соответствует наибольшее (по абсолютной величине) значение-коэффициента.
4. Расчет линейных коэффициентов парной корреляции определяет тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии. Парные коэффициенты определены нами ранее (см. п. 1. типового примера):
Линейные коэффициенты частной корреляции оценивают тесноту связи значений двух переменных, исключая влияние всех других переменных, представленных в уравнении множественной регрессии. Расчет частных коэффициентов корреляции проведем по формулам (24), (25), (26):
Значения коэффициентов парной корреляции указывают на весьма тесную связь выработки укак с коэффициентом обновления основных фондов, так и с долей рабочих высокой квалификации (и).Но в то же время межфакторная связьвесьма тесная и превышает тесноту связи су. В связи с этим для улучшения данной модели можно исключить из нее факторкак малоинформативный, недостаточно статистически надежный.
Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленными в модели. Наиболее тесно связаны уи:связьуигораздо слабее:а межфакторная зависимостьи выше, чем парнаяуи:. Все это приводит к выводу о необходимости исключить фактор -доля высококвалифицированных рабочих - из правой части уравнения множественной регрессии.
Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи:
;;;.
Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной зависимости.
Индекс множественной корреляции может быть рассчитан по формуле (22) или через стандартизованные коэффициенты по формуле (23). Определим его, например, по формуле (23):
Индекс множественной корреляции измеряет одновременное влияние факторных признаков на результативный.
5. Коэффициент множественной детерминации рассчитывается по формуле (36) как квадрат индекса множественной корреляции:
.
Коэффициент множественной детерминации оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 94,7% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, другими словами - на весьма тесную связь факторов с результатом.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера, определяемый по формуле (37):
Анализ выполняется при сравнении фактического и табличного (критического) значений F-критерия Фишера.
>
Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения множественной регрессии и показателя тесноты связи .