- •Содержание
- •Введение
- •Общие указания к выполнению работы
- •1 Работа с матрицами в табличном процессоре
- •1.1 Общие замечания по работе с массивами
- •Истина Ложь
- •1.2 Умножение матрицы (массива) на вещественное число
- •1.3 Сложение матриц (массивов)
- •1.4 Поэлементное умножение и деление массивов
- •2 Балансовые модели в экономике
- •3 Использование функции «подбор параметра» ms excel
- •4 Решение задач оптимизации с помощью программы «Поиск решения»
- •Установка программы «Поиск решения»
- •Настройка экономико-математической модели
- •Ввод и редактирование ограничений
- •Настройка параметров алгоритма и программы
- •Сохранение и загрузка модели
- •Загрузка модели оптимизации
- •Вычисления и результаты решения задачи
- •Просмотр промежуточных результатов «Поиска решения»
- •Возникающие проблемы и сообщения процедуры «Поиска решения»
- •Итоговые сообщения процедуры «Поиска решения»
- •5 Использование пакета анализа ms excel
- •5.1 Общие вопросы применения Пакета анализа
- •5.2 Применение инструмента Описательная статистика
- •5.3 Использование инструмента Корреляция
- •5.4 Использование инструмента Регрессия
- •Расчетно-графическая работа № 1
- •Расчетно-графическая работа №2
- •Расчетно-графическая работа №3
- •Тестовые задания
- •Словарь основных терминов и понятий
- •Список литературы Список основной литературы
- •Список дополнительной литературы
- •Список периодических изданий
- •Редактор л.А. Маркешина
- •450062, Республика Башкортостан, г. Уфа, ул. Космонавтов, 1
5.4 Использование инструмента Регрессия
С помощью этого инструмента выполняется линейный регрессионный анализ. Регрессия подбирает график для набора наблюдений с помощью метода наименьших квадратов. Регрессия используется в широком диапазоне приложений для анализа воздействия на отдельную зависимую переменную факторов, значений одной или более независимых переменных.
Регрессионный анализ предназначен для исследования зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в виде регрессионной модели.
Рассмотрим модель линейной парной регрессии:
, (24)
где - свободный член уравнения, - коэффициент регрессии, - независимая, нормально распределенная случайная величина – остаток с нулевым математическим ожиданием и постоянной дисперсией ( , ).
Оценка параметров линейной модели осуществляется методом наименьших квадратов (МНК). Согласно принципу МНК оценки параметров уравнения и находятся путем минимизации суммы квадратов:
. (25)
Отсюда имеем систему уравнений:
. (26)
Решая систему, получим:
, . (27)
Такое решение может существовать лишь при выполнении условия . Это условие называется условием идентифицируемости модели и означает, что не все значения совпадают между собой. В случае нарушения этого условия все точки лежат на одной вертикальной прямой . Отсюда видно, что .
Качество уравнения регрессии оценивается с помощью коэффициента детерминации:
. (28)
Чем ближе к единице, тем лучше.
Оценка существенности параметров линейной регрессии. -критерия Фишера. Оценка значимости уравнения регрессии в целом дается с помощью -критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю и, следовательно, фактор не оказывает влияние на результат .
-критерия Фишера представляет собой отношение факторной и остаточной дисперсий в расчете на одну степень свободы:
. (29)
Если , уравнение регрессии считается статистически значимым, в противном случае – статистически незначимым.
Проверка значимости отдельных коэффициентов регрессии осуществляется с помощью -критерия Стьюдента. Расчетные значения сравниваются с табличными, определенными при степенях свободы и соответствующем уровне значимости .
Различают два класса нелинейных регрессий:
Регрессии нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам:
а) полиномы, ;
б) равносторонняя гипербола, ;
Регрессии, нелинейные по оцениваемым параметрам:
а) степенная, ;
б) показательная, ;
в) экспоненциальная, .
Параметры регрессионных уравнений определяются также методом наименьших квадратов. Так, для полинома второго порядка имеем следующую систему уравнений:
.
Ряд уравнений нелинейной регрессии могут быть сведены к линейным, путем замен переменных (таблица 27).
Таблица 27 - Линеаризация ( ) некоторых наиболее употребительных регрессионных зависимостей
Вид зависимости |
|
|
|
|
Гипербола, |
|
|
|
|
Показательная, |
|
|
|
|
Степенная, |
|
|
|
|
Полулогарифмическая,
|
|
|
|
|
Обратная, |
|
|
|
|
Среди нелинейных функций, сводящихся к линейным, в экономических исследованиях очень широко используется степенная функция. Это связано с тем, что параметр в ней имеет четкое экономическое истолкование. Он является коэффициентом эластичности. Т.е. величина коэффициента показывает, на сколько % изменится результат в среднем, если фактор изменится на 1 %.
Коэффициент эластичности рассчитывается по следующей формуле:
. (30)
Уравнение нелинейной регрессии, так же как и в линейной зависимости, дополняется показателем корреляции – индексом корреляции ( ):
. (31)
Величина данного показателя находится в границах: . Чем ближе данный показатель к единице, тем теснее связь рассматриваемых признаков, тем более надежно найденное уравнение регрессии.
При использовании инструмента Регрессия выбираются отдельно интервалы для независимых переменных (х) и зависимой переменной (y). Предельное число независимых переменных – 18. Выделенные интервалы могут быть помечены метками. MS Excel автоматически упорядочивает независимые переменные по возрастанию слева направо и присваивает им в выходной таблице имена х1, х2, х3 и т.д.
Для того, чтобы линия регрессии проходила через начало координат, в соответствующем диалоговом окне можно выделить флажок Константа – Ноль.
Особое внимание следует уделять выходному интервалу. Для этого вводится ссылка для верхней левой ячейки интервала, в которой будут представлены выходные таблицы. Необходимо отвести по крайней мере семь столбцов для выходной таблицы дисперсионного анализа (ANOVA – analysis of variance); не менее 4 столбцов выходной таблицы остатков, содержащей остатки, стандартизированные остатки и предсказанные значения; не менее двух столбцов для выходной таблицы распределения данных. Кроме того, данный инструмент по желанию пользователя может генерировать три графика остатков (диаграмм для независимых переменных в сравнении с разностью), три графика подбора (диаграмм для предсказанных значений по сравнению с наблюдениями), один график нормального распределения (диаграмму для нормальных вероятностей).
Поскольку размер выходных таблиц зависит от объема и типа входных данных, то во избежание их перекрытия рекомендуется размещать выходные интервалы на рабочем листе рядом, поскольку изменяется их длина, а не ширина.
Группа итоговых выходных таблиц (ВЫВОД ИТОГОВ) будет включать следующие таблицы: Регрессионная статистика: Множественный R, R-квадрат, Нормированный R-квадрат, Стандартная ошибка (оценка стандартного отклонения выборки), Наблюдения (счет); Дисперсионный анализ (Регрессия, Остаток, Итого (столбцы df, SS, MS, F значение критерия Фишера для выборки), Значимость F (вероятность ошибочного отклонения нулевой гипотезы для F)), Коэффициенты (коэффициенты регрессии для определения наличия взаимосвязи между массивами зависимой и независимыми переменными), Стандартная ошибка (см. формулу 1), t-статистика (критерий Стьюдента), Р-Значение, Нижние 95%, Верхние 95%, Нижние 95.000%, Верхние 95.000% (границы интервальных оценок для математического ожидания и дисперсии).
Пример. Определить регрессию между независимыми переменными x1, x2, х3 и зависимой переменной у. Входная информация представлена в таблице 28.
Таблица 28 – Входная информация при использовании инструмента Регрессия
|
A |
B |
C |
D |
E |
1 |
|
|
|
|
|
2 |
|
х1 |
x2 |
x3 |
y |
3 |
|
2 |
3 |
4 |
5 |
4 |
|
3 |
5 |
6 |
6 |
5 |
|
4 |
6 |
5 |
8 |
6 |
|
5 |
7 |
8 |
10 |
7 |
|
6 |
4 |
9 |
12 |
После обращения к команде Анализ данных и открытия соответствующего диалогового окна, в нем выбирается инструмент Регрессия. Вид диалогового окна Регрессия представлен на рисунке 20.
Рисунок 20 - Вид диалогового окна «Регрессия»
В диалоговом окне Регрессия указывается входной интервал Y: Е3:Е6 и входной интервал X:B2:D6. Включив переключатель Метки, можно указать выходной интервал G2 (ОК).
Как видно из ВЫВОДА ИТОГОВ уравнение регрессии выглядит следующим образом: у = 1,57 + 1,91 x1 – 0,15*х2 – 0,04х3 (таблица 29).
Таблица 29 - Фрагмент ВЫВОДА ИТОГОВ при использовании инструмента Регрессия
Коэффициенты |
|
Y-пересечение |
1,57 |
х1 |
1,91 |
х2 |
- 0,15 |
х3 |
- 0,04 |
Задание 1. Проанализировать функцию и сделать прогноз вперед можно с помощью линий тренда. Для создания линии тренда на основе данных диаграммы применяется один из пяти видов аппроксимации, предлагаемых Excel.
- линейная;
- полиномиальная;
- логарифмическая;
- экспоненциальная;
- степенная.
На диаграмме можно выделить любой ряд данных и добавить линию тренда, если выделенные данные представляют собой диаграмму с областями, график, гистограмму, линейчатую диаграмму или точечную диаграмму. Когда линия тренда добавляется к ряду данных, она связывается с ним, и поэтому при изменении значений любых точек ряда данных линия тренда автоматически пересчитывается и обновляется на диаграмме. Чтобы добавить линию тренда к ряду данных необходимо:
1 Активизировать диаграмму.
2 Выделить ряд данных, для которого строится линия тренда;
3 Выполнить команду Добавить линию тренда из контекстного меню. На экране появится диалоговое окно Линия тренда.
4 Выбрать в диалоговом окне вид аппроксимации;
5 Нажать кнопку ОК.
Задание 2
Построить регрессионную модель для прогнозирования затрат на переликвидацию скважины. Основываясь на критерии Фишера и t-критерии Стьюдента улучшить регрессионную модель.
Расчет регрессионной модели производится на основе факторов, имеющих наибольшее влияние на результирующую величину – затраты на переликвидацию. Выбор факторов производится на основе корреляционного анализа, т.е. расчета коэффициента корреляции для каждой пары xy. В регрессионную модель включаются только те факторы, которые имеют значение коэффициента корреляции не ниже определенного предела (по модулю). Дальнейший отбор значимых факторов производится уже в процессе и с помощью инструментов регрессионного анализа.
Исходные данные представлены в таблице 30.
Расчет статистических величин производится на основе определенной части генеральной совокупности – выборки, одной из обязательных характеристик которой должна быть репрезентативность, которая обеспечивается объемом выборки не меньше 30 значений признака. В данном примере данное условие не соблюдается по причине отсутствия информации по скважинам в достаточном объеме. Количество обрабатываемых данных сокращено до 15 скважин.
Расчет корреляционной матрицы производился с помощью инструмента Корреляция Microsoft Excel. Проанализируем коэффициенты корреляции между факторами х и результирующим фактором у.
Как видно из полученной корреляционной матрицы, наиболее тесные корреляционные связи наблюдаются между x2 и y (таблица 31). Для дальнейшего анализа оставим факторы, имеющие коэффициенты корреляции больше 0,4 по модулю. Это все факторы, кроме 5-го, 6-го и 10-го.
Таблица 30 – Факторы, включенные в корреляционно-регресионную модель для определения затрат на переликвидацию скважин
Номер скважины |
Срок эксплу-атации скважины, лет |
Период, прошедший с момента ликвидации скважины, лет |
Стои-мость ликвидацион-ных работ, руб. |
Продолжи-тельность ликвидации-онных работ, ч |
Коли-чество колонн, шт. |
Глуби-на скважи-ны, м |
Сте-пень слож-ности ликви-даци-онных работ, ед. |
Доля времени на геофизи-ческие исследо-вания в общей трудоем. ликв. работ, % |
Количество проведен-ных на скважине ремонтно-изоляцион-ных работ, шт. |
Период времени, прошед-ший с послед-него РИР, лет |
Стоимость перелик-видации, руб. |
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x9 |
x10 |
y |
|
560 |
41 |
11 |
714200 |
620,3 |
3 |
2037 |
1 |
8,7 |
3 |
14 |
935103 |
1405 |
23 |
1 |
583900 |
550,22 |
3 |
2500 |
2 |
5,6 |
0 |
0 |
0 |
730 |
38 |
9 |
492200 |
460,21 |
3 |
1990 |
2 |
6,2 |
2 |
7 |
653344 |
549 |
46 |
18 |
718150 |
675,40 |
4 |
2030 |
3 |
15,5 |
0 |
0 |
855120 |
51 |
42 |
11 |
576105 |
522,00 |
4 |
1580 |
2 |
12,0 |
3 |
9 |
689211 |
612 |
45 |
12 |
467005 |
534,23 |
3 |
1800 |
2 |
2,1 |
2 |
14 |
486238 |
73 |
37 |
2 |
406404 |
402,38 |
3 |
2200 |
3 |
3,6 |
0 |
0 |
0 |
12 |
25 |
5 |
537883 |
520,10 |
3 |
2985 |
2 |
4,2 |
2 |
10 |
0 |
2192 |
31 |
8 |
365105 |
360,50 |
3 |
3010 |
1 |
5,0 |
0 |
0 |
623800 |
5860 |
22 |
10 |
475356 |
480,55 |
3 |
2904 |
2 |
3,3 |
1 |
15 |
588922 |
128 |
19 |
1 |
432220 |
490,10 |
3 |
2459 |
3 |
7,1 |
1 |
6 |
0 |
593 |
26 |
9 |
425336 |
396,90 |
3 |
2623 |
2 |
9,1 |
2 |
12 |
602355 |
596 |
17 |
0 |
385509 |
380,70 |
3 |
2850 |
2 |
12,1 |
0 |
0 |
0 |
45 |
20 |
5 |
600300 |
588,50 |
3 |
3120 |
1 |
16,3 |
4 |
2 |
712682 |
612 |
24 |
3 |
515221 |
610,20 |
3 |
3070 |
2 |
15,2 |
2 |
7 |
692320 |
Таблица 31 – Корреляционная матрица
|
x1 |
x2 |
x3 |
x4 |
x5 |
x6 |
x7 |
x8 |
x9 |
x10 |
y |
x1 |
1,000 |
|
|
|
|
|
|
|
|
|
|
x2 |
0,753 |
1,000 |
|
|
|
|
|
|
|
|
|
x3 |
0,399 |
0,493 |
1,000 |
|
|
|
|
|
|
|
|
x4 |
0,295 |
0,386 |
0,896 |
1,000 |
|
|
|
|
|
|
|
x5 |
0,545 |
0,596 |
0,498 |
0,397 |
1,000 |
|
|
|
|
|
|
x6 |
-0,825 |
-0,507 |
-0,319 |
-0,202 |
-0,537 |
1,000 |
|
|
|
|
|
x7 |
0,108 |
-0,064 |
-0,123 |
-0,002 |
0,310 |
-0,317 |
1,000 |
|
|
|
|
x8 |
-0,095 |
0,084 |
0,446 |
0,475 |
0,455 |
0,134 |
-0,087 |
1,000 |
|
|
|
x9 |
0,093 |
0,204 |
0,386 |
0,383 |
0,010 |
-0,094 |
-0,503 |
0,305 |
1,000 |
|
|
x10 |
0,176 |
0,380 |
0,106 |
0,138 |
-0,134 |
-0,209 |
-0,189 |
-0,315 |
0,544 |
1,000 |
|
y |
0,489 |
0,761 |
0,500 |
0,443 |
0,367 |
-0,209 |
-0,442 |
0,427 |
0,494 |
0,327 |
1,000 |
Выведем регрессионное уравнение, отражающее зависимость затрат на переликвидацию от перечисленных факторов.
Основные результаты расчета по этому инструменту приведены на рисунке 21.
Рисунок 21 – Фрагмент рабочего листа с выводом итогов по инструменту Регрессия
Полученные значения коэффициентов регрессии позволяют записать уравнение регрессии в следующем виде:
y = 258684 + 3516,7x1 + 46753,8 x2 – 1,1 x3 + 958,8 x4 – 202806,6 x7 + + 25825,3 x8 + 21735,6 x9.
Значение коэффициента детерминации R-квадрат равно 0,871, что свидетельствует о том, что полученная зависимость с достаточной степенью аппроксимации отражает наблюдаемое явление. Другими словами, выбранные факторы существенно влияют на величину затрат и на переликвидацию.
Рассчитанный уровень значимости 0,0111<0,05 (показатель Значимость F в таблице приложения «Дисперсионный анализ») подтверждает значимость коэффициента детерминации R-квадрат.
Расчетное значение критерия Фишера (показатель F) может быть оценено по проверке попадания в критическую область ( ). Для данного примера может быть рассчитан с использованием функции FРАСПОБР, в которой Степени_свободы1 - число степеней свободы для строки Регрессия (kf = m = 2), а Степени_свободы2 - число степеней свободы для строки ОСТАТОК: df = n – (k +1) = 10 – (2 +1) = 7.
Таким образом, расчетное значение критерия Фишера 6,73 попадает в критический интервал (3,79; +¥). Это еще раз свидетельствует о том, что коэффициент детерминации найденной регрессионной связи является значимым.
Следующим этапом является проверка значимости коэффициентов регрессии аj. Сравнивая попарно t-статистики и p-значения для всех коэффициентов, оставим те, где значения t-статистики больше p-значения. Эти факторы значимы. Исключить из уравнения регрессии следует x 1, x 3, x 7, x 9.
Построим второй уточненный вариант регрессионного уравнения для х2, х4, х8 :
y = - 92117 +50376,2 x2 – 68,8 x4 + 27410,7 x8.
Регрессионная зависимость находится в области недостаточной аппроксимации (R-квадрат < 0,8). Другими словами, оставленные в модели факторы менее существенно влияют на величину затрат на переликвидацию скважин. И предыдущая регрессионная модель более адекватна исследуемому процессу.
Вместе с тем модель может быть улучшена, так как значения t-статистики для коэффициентов а0 и а4 меньше соответствующих p-значений. Исключим константу и х4.
Получим новое регрессионное уравнение (вариант 3):
y = 44773,2 x2 + 19350,4 x8.
Судя по значению коэффициента детерминации R-квадрат, равному 0,89, полученная регрессионная модель с большой степенью аппроксимации отражает исследуемое явление. Это подтверждает также расчетное значение критерия Фишера, равное 52,8, которое попадает в критический интервал (3,8; +¥).
Таким образом, полученное регрессионное уравнение ставит затраты на переликвидацию скважин в прямую зависимость от периода, прошедшего с момента ликвидации скважины, и доли затрат на геофизические исследования на ликвидированной скважине в общем объеме затрат на ликвидацию. Включение последнего фактора в регрессионную зависимость можно объяснить сложностью ликвидационных работ на скважине и связанной с этим последующей вероятностью переликвидации скважины.
Полученное уравнение читается следующим образом: увеличение на один год периода, прошедшего с момента ликвидации скважины приводит к увеличению затрат на переликвидацию на 44773,2 руб., а рост доли времени на геофизические исследования в общей трудоемкости ликвидационных работ на 1% - к росту затрат на переликвидацию на 19350,4 руб.
При экономической интерпретации уравнений регрессии часто пользуются коэффициентами эластичности, показывающими, на сколько процентов в среднем изменится значение результативного признака при изменении соответствующего факторного признака на 1%. Коэффициенты эластичности определяются по формуле
, (32)
где - среднее значение соответствующего факторного признака;
- среднее значение результативного признака;
aj – коэффициент регрессии при соответствующем факторном признаке.
При помощи функции СРЗНАЧ рассчитаем средние значения выборок x2, x8 и у:
= 7,0; 8 = 8,4; = 455939,7.
Тогда Эx2 = 0,69%, Эх8 = 0,36%.
Таким образом, увеличение периода, прошедшего с момента ликвидации скважины, на 1% приводит к увеличению затрат на переликвидацию на 0,69%, а рост доли времени на геофизические исследования в общей трудоемкости ликвидационных работ на 1% - к росту затрат на переликвидацию на 0,36%.
Задание 3
Построить и проанализировать данную модель с использованием инструментов Корреляция, Описательная статистика, Регрессия (написать уравнение регрессии и проанализировать).
Имеются данные (таблица 32) за 10 лет о денежных доходах населения (в среднем на душу населения в месяц в рублях) Y, численность постоянного населения X1 (тыс. чел.), общая численность безработных X2 (тыс. чел.), платные услуги населению X3 (млн руб.), денежные расходы населения X4 (в среднем на душу населения в месяц в рублях), среднемесячная заработная плата X5 (руб.), средний размер назначенной пенсии X6 (руб.), величина прожиточного минимума X7 (в среднем на душу населения в месяц в рублях), ввод основных фондов X8 (млн руб.), производство потребительских товаров X9 (млн руб.).
Таблица 32 – Исходные данные
Годы |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
X8 |
X9 |
1 |
385,1 |
4001,0 |
0,0 |
1,5 |
345,3 |
516,2 |
390,0 |
0,0 |
53,1 |
10 |
2 |
2,9 |
4034,2 |
78,4 |
11,6 |
2,3 |
5,6 |
3,6 |
0,0 |
1137,1 |
107 |
3 |
37,8 |
4048,0 |
73,3 |
137,2 |
31,6 |
57,2 |
42,0 |
0,0 |
31315,1 |
831 |
4 |
140,0 |
4072,9 |
114,6 |
683,3 |
118,7 |
185,8 |
112,5 |
0,0 |
137542,0 |
2388 |
5 |
325,0 |
4089,3 |
138,6 |
1966,8 |
286,0 |
415,9 |
226,1 |
0,0 |
314610,0 |
6265 |
6 |
501,0 |
4098,5 |
144,8 |
3282,3 |
442,3 |
668,4 |
307,3 |
0,0 |
302874,0 |
7137 |
7 |
626,0 |
4104,0 |
204,0 |
4721,5 |
445,9 |
813,5 |
358,1 |
305,6 |
301342,4 |
6853 |
8 |
694,6 |
4110,3 |
240,6 |
6104,6 |
641,8 |
879,0 |
387,0 |
370,8 |
381620,0 |
6413 |
9 |
1244,5 |
4109,6 |
234,4 |
8039,5 |
1138,9 |
1239,6 |
507,0 |
744,2 |
380707,0 |
12071 |
10 |
1738,2 |
4101,7 |
221,5 |
12087,5 |
1510,7 |
1932,9 |
783,1 |
876,0 |
432691,0 |
15776 |
11 |
2405,0 |
4090,6 |
202,0 |
18276,3 |
2123,0 |
2836,8 |
1051,9 |
1353,0 |
511544,0 |
19946 |
12 |
3159,8 |
4102,9 |
160,0 |
25423,7 |
2799,0 |
3717,9 |
1347,1 |
1519,0 |
580547,0 |
0 |
Y – зависимая (эндогенная), переменные X1, X2, X3, X4, X5, X6, X7, X8, X9 – независимые (экзогенные)
Задание 4
Построить и проанализировать данную модель с использованием инструментов Корреляция, Описательная статистика, Регрессия (написать уравнение регрессии и проанализировать).
Имеются данные (таблица 33) о валовом региональном продукте (млн руб.), численности населения (тыс. руб.), выпуске промышленной продукции (млн руб.), производстве потребительских товаров (млн руб.), продукции сельского хозяйства (млн руб.), инвестициях в основной капитал (млн руб.), обороте розничной торговли (млн. руб.) за 11лет по годам.
Таблица 33 – Исходные данные
Годы
|
ВРП
|
Инвест. в основ. капитал |
Численность населения
|
Выпуск пром. Продук- ции |
Проду-кция с/х
|
Оборот розн. торг. |
Произв. потреб. товаров |
1 |
6045000 |
9050000 |
1034200 |
4090000 |
7830000 |
1026000 |
1070000 |
2 |
4925700 |
9303000 |
4048000 |
4456000 |
6944000 |
1398000 |
8310000 |
3 |
1427500 |
3131900 |
4072900 |
1221800 |
2646100 |
4159000 |
2388000 |
4 |
3943590 |
8643000 |
4089300 |
3788000 |
7513100 |
9657500 |
6265000 |
5 |
5828470 |
1313950 |
4098500 |
4848200 |
1267020 |
1538030 |
7137000 |
6 |
6455730 |
1262930 |
4104000 |
4818800 |
1298520 |
1725700 |
6853000 |
7 |
6418810 |
1257480 |
4110300 |
4603800 |
1072710 |
2136100 |
6413000 |
8 |
1115189 |
1738350 |
4109600 |
8903200 |
2315620 |
3868800 |
1207100 |
9 |
1594981 |
3549740 |
4101700 |
1417920 |
2791770 |
4939990 |
1577600 |
10 |
1863324 |
4703870 |
4090600 |
1570590 |
3648790 |
6566280 |
1994600 |
11 |
2178644 |
5214210 |
4102900 |
1625980 |
4410190 |
8204760 |
2000000 |
В качестве зависимой (эндогенной) переменной рассматривается валовый региональный продукт, все остальные переменные являются экзогенными.
Задание 5
Построить и проанализировать данную модель с использованием инструментов Корреляция, Описательная статистика, Регрессия (написать уравнение регрессии и проанализировать).
Имеются данные (таблица 34) о валовом региональном продукте (млн руб.), численности населения (тыс. руб.), выпуске промышленной продукции (млн руб.), производстве потребительских товаров (млн руб.), продукции сельского хозяйства (млн руб.), инвестициях в основной капитал (млн руб.), обороте розничной торговли (млн. руб.) за 11 лет по годам.
Таблица 34 – Исходные данные
Годы
|
Инвест. в основ. капитал |
Численность населения
|
Выпуск пром. прод. |
Продукция с/х
|
Оборот розн. торговли |
Производ. потреб. товаров |
ВРП |
1 |
9050000 |
1034200 |
4090000 |
7830000 |
1026000 |
1070000 |
6045000 |
2 |
9303000 |
4048000 |
4456000 |
6844000 |
1389000 |
8310000 |
4925700 |
3 |
3131900 |
4072900 |
1221800 |
2646100 |
4159000 |
2388000 |
1427500 |
4 |
8463000 |
4089300 |
3788000 |
7513100 |
9657500 |
6265000 |
3843690 |
5 |
1313950 |
4089500 |
4848200 |
1267020 |
1536030 |
7137000 |
5828480 |
6 |
1262930 |
4104000 |
4818800 |
1298620 |
1725700 |
6863000 |
6455730 |
7 |
1257480 |
4110300 |
4603800 |
1072710 |
2136100 |
6413000 |
3418810 |
8 |
1738350 |
4109600 |
8903200 |
2315620 |
3868800 |
1207100 |
1115189 |
9 |
3549740 |
4101700 |
1417920 |
2791770 |
4999990 |
1577600 |
1594981 |
10 |
4703870 |
4090600 |
1570590 |
3648790 |
6566280 |
1994600 |
1863324 |
11 |
5214210 |
4102900 |
1625980 |
4410190 |
8204760 |
2000000 |
2178644 |
В качестве зависимой (эндогенной) переменной рассмотреть инвестиции в основной капитал, все остальные переменные являются экзогенными.
Построить графики ряда динамики и трендов. Выбрать наилучший вид тренда на основании графического изображения и значения коэффициента детерминации.
Задание 6
Построить и проанализировать данную модель с использованием инструментов «Корреляция», «Описательная статистика», «Регрессия» (написать уравнение регрессии и проанализировать).
Построить графики ряда динамики и трендов. Выбрать наилучший вид тренда на основании графического изображения и значения коэффициента детерминации.
Имеются данные (таблица 35) о денежных доходах населения (в среднем на душу населения в месяц – Y руб.), платные услуги населению – X1 млн руб., продукция сельского хозяйства – X2 млн руб., производство потребительских товаров – X3 млн руб., средняя численность занятых в экономике – X4 тыс. чел.
где переменная Y – зависимая (эндогенная), переменные X1, X2 , X3, X4, - независимые (экзогенные).
Таблица 35 – Исходные данные
Годы
|
Доходы населения
|
Пл. услуги населению
|
Прод. с/х
|
Пр-во потребит. товаров
|
Средняя численность занятых |
1 |
3851000 |
1500000 |
7700000 |
1000000 |
1914200 |
2 |
2900000 |
1160000 |
7830000 |
1070000 |
1894200 |
3 |
3780000 |
1372000 |
6944000 |
8310000 |
1860200 |
4 |
1400000 |
6833000 |
2646100 |
2388000 |
1790100 |
5 |
3250000 |
1966800 |
7513100 |
6265000 |
1747700 |
6 |
5010000 |
3282300 |
1267020 |
7137000 |
1642000 |
7 |
6260000 |
4721500 |
1298520 |
6853000 |
1680500 |
8 |
6946000 |
6104600 |
1072710 |
6413000 |
1665900 |
9 |
1244500 |
8039500 |
2315620 |
1207100 |
1742600 |
10 |
1738200 |
1208750 |
2791770 |
1577600 |
1746200 |
11 |
2405000 |
1827630 |
3648790 |
1994600 |
1747000 |
12 |
3159800 |
2542370 |
4410190 |
5576540 |
1764300 |
Задание 7
Динамика выпуска продукции характеризуется данными, представленными в таблице 36.
Таблица 36 – Исходные данные
Годы |
Выпуск продукции |
Годы |
Выпуск продукции |
1 |
1054 |
17 |
11172 |
2 |
1104 |
18 |
14150 |
3 |
1149 |
19 |
14004 |
4 |
1291 |
20 |
13088 |
5 |
1427 |
21 |
12518 |
6 |
1505 |
22 |
13471 |
7 |
1513 |
23 |
13617 |
8 |
1635 |
24 |
16356 |
9 |
1987 |
25 |
20037 |
10 |
2306 |
26 |
21748 |
11 |
2367 |
27 |
23298 |
12 |
2913 |
28 |
26570 |
13 |
3837 |
29 |
23080 |
14 |
5490 |
30 |
23981 |
15 |
5502 |
31 |
23446 |
16 |
6342 |
32 |
29658 |
1 Провести расчет параметров линейного и экспоненциального трендов.
2 Построить графики ряда динамики и трендов.
3 Выбрать наилучший вид тренда на основании графического изображения и значения коэффициента детерминации.
Задание 8
По территориям Уральского и Западно-Сибирского районов известны следующие данные (таблица 37).
Таблица 37 – Исходные данные
Район |
Потребительские расходы на душу населения, тыс. руб. (Y)
|
Денежные доходы на душу населения, тыс. руб. (X)
|
1 |
2 |
3 |
Уральский |
|
|
Респ. Башкортостан |
461 |
632 |
Удмуртская респ. |
524 |
738 |
Курганская обл. |
298 |
515 |
Оренбургская обл. |
351 |
640 |
Пермская обл. |
624 |
942 |
Свердловская обл. |
584 |
888 |
Челябинская обл. |
425 |
704 |
Западно-Сибирский |
|
|
Респ. Алтай |
277 |
603 |
Продолжение таблицы 37
1 |
2 |
3 |
Алтайский край |
321 |
439 |
Кемеровская обл. |
573 |
985 |
Новосибирская обл. |
576 |
735 |
Омская обл. |
588 |
760 |
Томская обл. |
497 |
830 |
Тюменская обл. |
863 |
2093 |
1 Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2 Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3 Оцените тесноту связи с помощью показателей корреляции и детерминации.
4 Дайте c помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5 Оцените качество уравнений с помощью средней ошибки аппроксимации.
6 Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7 Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 8% от его среднего уровня.
8 Оцените полученные результаты, выводы оформите в аналитической записке.
Задание 9
Построить и проанализировать модель (таблица 38) по Кировской области (ПФО) с использованием инструментов Корреляция, Регрессия.
Таблица 38 – Исходные данные
Год |
Валовый региональ- ный продукт (тыс. руб., до 1998 г. –млн руб.) |
Затраты на технологические иннова- ции (тыс.руб., до 1998 г. – млн руб.) |
Внутренние текущие затраты на исследования и разработки по видам работ –фундаменталь- ные исследования, (тыс. руб., до 1998 г. –млн руб.) |
Внутренние Текущие затраты на исследова- ния и разработки по видам работ- разработки (тыс.руб., до 1998 г. –млн руб.) |
Средняя з/п персонала, занимающегося исследова- ниями и разработками (руб. до 1998 г. тыс. руб. |
Число организаций, выполняю- щих исследования и разработки |
|
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
1 |
18959202 |
36958 |
750 |
23660 |
340,5 |
22 |
2 |
24270811 |
79785 |
1092 |
35637 |
616,6 |
26 |
3 |
27161307 |
43547 |
1390 |
35426 |
653,9 |
22 |
4 |
27366158 |
152550 |
1578 |
34680 |
761,9 |
22 |
5 |
43675338 |
234762 |
10339 |
52720 |
939,7 |
23 |
6 |
60598080 |
329795 |
8429 |
84041 |
1709 |
22 |
7 |
69466928 |
328310 |
14086 |
139662 |
2590,8 |
20 |
8 |
83831280 |
285725 |
19153 |
173197 |
3506,6 |
21 |
Задание 10
Результаты обследования десяти статистически однородных филиалов компании (таблица 39) приведены в таблице (цифры условные):
Таблица 39 – Исходные данные
№ филиала |
Производительность труда (Y) |
Фондовооруженность (X1) |
Энерговооруженность (X2) |
1 |
74 |
33 |
56 |
2 |
84 |
34 |
58 |
3 |
73 |
36 |
67 |
4 |
93 |
35 |
70 |
5 |
56 |
33 |
73 |
6 |
71 |
37 |
77 |
7 |
117 |
39 |
78 |
8 |
111 |
42 |
99 |
9 |
135 |
43 |
93 |
10 |
125 |
44 |
96 |
1 Рассчитать парные коэффициенты корреляции и пояснить их экономический смысл.
2 Найти коэффициент множественной корреляции и совокупный коэффициент детерминации и охарактеризовать степень совместного влияния факторов фондовооруженности и энерговооруженности на производительность труда.
3 Построить модель множественной линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
4 Рассчитать частные коэффициенты корреляции, детерминации, эластичности и частные бета-коэффициенты и с их помощью оценить влияние отдельных факторов (при неизвестном значении других).