Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка__Сарычева Т.В

..pdf
Скачиваний:
28
Добавлен:
03.06.2015
Размер:
1.38 Mб
Скачать

быть использована в случае множественной регрессии (две и более переменных Х) и является функцией массива. Она имеет следующий синтаксис.

ЛИНЕЙН(известные_знач_Y;известные_знач_X;Конст;Статистика)

Аргументы «Конст» и «Статистика» являются значениями типа Истина-Ложь, где «Конст» показывает, является ли смещение (параметр a) нулевым, а «Статистика» определяет, нужна ли дополнительная статистика.

Для получения результатов, показанных на рис. 13:

выделите H13:I17,

вызовите статистическую функцию ЛИНЕЙН, используя меню Вставка – Функция.;

заполните необходимые поля;

нажмите Ok;

Рисунок 13 – Регрессия построения , использующая функцию ЛИНЕЙН

нажмите клавишу F2 на клавиатуре;

61

удерживая клавиши Ctrl и Shift, нажмите Enter.

значения функций скопируйте, используя Специальную вставку в ячейки Н19:I19, как показано на рис.15. Те же самые числа с метками были в результатах инструмента

анализа Регрессия на рис. 7 .

Для построения прогнозных оценок значения коэффициента естественного прироста населения для доли трудоспособного населения в 63,45%:

В столбцах F, Н и I сформируйте таблицы, как показано на рис. 14.

Рисунок 14 – Образец формирования таблиц

Построить прогноз коэффициента естественного прироста для заданного значения доли трудоспособного населения можно несколькими способами:

Если смещение (параметр а) и наклон (коэффициент регрессии b ) в уравнении регрессии уже вычислены, то можно ввести формулу «=смещение+наклон*X» в ячейку (I8) с соответствующими ссылками на ячейки.

Для доли населения трудоспособного возраста 63,45% предсказанное значение коэффициента естественного прироста приблизительно равен -4,01 ед. на 1000 человек населения

Другой способ получения предсказанного значения для простой линейной регрессии основывается на функции ПРЕДСКАЗ, имеющей следующий синтаксис

ПРЕДСКАЗ(X; Известные _значения_y; Известные _значения_x;).

62

Данный метод, применяемый в ячейке I9, вычисляет смещение и наклон с помощью наименьших квадратов и возвращает предсказанное значение y для указанного x.

Еще одним способом получения предсказанных значений Y является использование функции ТЕНДЕНЦИЯ со следующим синтаксисом

ТЕНДЕНЦИЯ(Известные_значения_Y; Известные_значения_X; Новые_значения_х;Конст).

Данная функция, в отличие от функции ПРЕДСКАЗ, может быть использована в случае множественной регрессии (две и более переменных Х). Так как функция ТЕНДЕНЦИЯ использует массивы.

Результаты построения прогнозных оценко представлены на рис. 15.

Рисунок 14 – Результаты построения прогнозных оценок с использованием встроенных статистических функций

Самостоятельно

В Приложении В данного пособия представлены задания для выполнения данной лабораторной работы по вариантам.

По результатам выполнения необходимо сформировать отчет в формате документа MS Word, где нужно отразить результаты решения поставленной задачи тремя способами и их описание.

63

Лабораторная работа № 2. Построение нелинейного уравнения парной регрессии в MS Excel

Важным шагом при выборе необходимой нелинейной формы зависимости является изучение графика. На рис. 1 изображены четыре выпуклые нелинейные кривые, которые могут быть получены на графике. На каждой части метка обозначает направление выпуклости, которое может быть использовано при определении соответствующей нелинейной формы.

 

 

 

 

 

 

 

 

 

 

СЗ

 

 

 

 

 

 

 

 

 

 

СВ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ЮЗ

 

СВЗ

 

 

 

Рисунок 1 – Выпуклые нелинейные кривые

Так для левой верхней части данные имеют выпуклость в сторону северо-запада (СЗ). Этому случаю соответствуют показательные (для x 1) и логарифмические функции. В левой нижней части данные имеют выпуклость в сторону юго-запада (ЮЗ), и в этом случае используются показательные, логарифмические или экспоненциальные функции. В правой нижней части рисунка данные имеют выпуклость в сторону юговостока (ЮВ); этому случаю соответствуют показательные (для x 1) и экспоненциальные функции. Вдобавок, все четыре кривые

64

данных могут быть смоделированы квадратичной функцией (многочленом второй степени).

Если же вид данных на графике не подходит ни к одному из одновыпуклых примеров на рис. 1, то следует использовать какую либо другую форму зависимости. Например, если данные имеют две выпуклости (S -форма), то можно применить кубическую функцию (полином степени 3).

Общий подход добавления линии тренда состоит в следующем. Сначала строится график. (Расположите данные на листе так, чтобы столбец с данными x был слева, а y - справа.

Выделите данные x и y и постройте точечную диаграмму с помощью Мастера диаграмм.) Затем щелкните по точке данных на диаграмме, чтобы выделить ряд данных и выберите Добавить линию тренда в меню Диаграмма; или щелкните правой кнопкой по ряду данных и выберите Добавить линию тренда в контекстном меню. Верхняя часть вкладки Тип диалогового окна Линия тренда представлена на рис.2.

Рисунок 2 – Вкладка Тип окна «Линия тренда»

Для получения линии тренда, описываемой в данной лабораторной работе, выберите соответствующий тип (полиномиальный, логарифмический, показательный или экспоненциальный) и на вкладке Параметры отметьте пункты

Показывать уравнение на диаграмме и Поместить на диаграмму величину достоверности аппроксимации (R^2).

Задача:

65

В файле Задача 1,2.xls (Приложение А) представлены данные за 2008 г. характеризующие долю населения в трудоспособном возрасте (%) и коэффициенты естественного прироста населения (на 1000 человек населения) Республики Марий Эл.

Необходимо:

1.Построить уравнения регрессии в форме:

полиномиальной функции второй степени;

логарифмической функции;

отражающие зависимость y – коэффициента естественного прироста населения (на 1000 человек населения) от x - доли населения в трудоспособном возрасте (%).

2.Оценить качество, точность, надежность и статистическую значимость каждого уравнения регрессии.

3.Построить прогноз относительно коэффициента естественного прироста населения при доли населения в трудоспособном возрасте 63,45% по каждому из уравнений.

Решение:

1. Полиномиальное приближение

Переименуйте Лист 1 на Полиномиальная функция

Вполиномиальной модели второй степени уравнение линии тренда в общем виде имеет следующий вид

yˆx a b x c x2 ,

На рис.3 приведены результаты приближения квадратичной функцией (многочленом второй степени):

yx 416,06 11,655x 0,0812x2

Значение индекса детерминации R2 0,8315 значительно

лучше коэффициента детерминации R2 0,8065, полученного при линейном приближении.

Для получения более полных характеристик регрессии для квадратичной модели:

66

выделите область со значения результативного признака столбца С и выберите из контекстного меню Добавить ячейки;

 

 

5

 

 

 

 

 

 

 

 

, на 1000

 

0

y = - 416,06 + 11,655x -0,0812x2

 

 

 

 

 

населения

 

R

2

= 0,8315

 

 

 

 

 

 

 

 

 

 

 

 

 

человек населения

 

 

 

 

 

 

 

 

 

естественного прироста

-5

 

 

 

 

 

 

 

 

-10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент

 

-15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-20

 

 

 

 

 

 

 

 

 

 

54

56

 

58

60

62

64

66

68

 

 

 

 

 

Доля населения в трудоспособном возрасте, %

 

 

Рисунок 3 – Полиномиальная линия тренда

введите данные в столбец С, как показано на рис. 4.:

в ячейку С1 введите метку «х^2»;

в ячейку С2 и введите формулу «=В2^2».

скопируйте формулу в остальные ячейки столбца С, выделив С2 и дважды щелкнув по маркеру заполнения в правом нижнем углу. Квадраты значений доли трудоспособного населения появятся в столбце D.

В меню Сервис выберите Анализ данных. В диалоговом окне Анализа данных прокрутите список, выберите пункт Регрессия и нажмите Ok. Появится диалоговое окно

Регрессии.

67

Входной интервал Y: укажите или введите ссылки на область со значениями зависимой переменной (D1:DI3), включая метку в первой строке.

Входной интервал Х: укажите или введите ссылки на область со значениями независимой переменной (B1:CI3), включая метки в первой строке.

Метки: отметьте этот пункт, так как метки были включены во входные интервалы для x и y .

Не выбирайте опции Константа - ноль и Уровень надежности.

Параметры вывода: щелкните по кнопке Выходной интервал, выделите строку справа и укажите или введите ссылку на левый верхний угол области шириной в 16 столбцов, куда будут помещены результаты (Е1).

Можно включить опции для получения Остатков.

Yажмите Ok.

На рис. 4 приведены результаты регрессии. По сравнению с линейной моделью, данная квадратичная модель имеет немного большую стандартную ошибку и меньшее R2; исходя из этого, можно сказать, что квадратичная модель не лучше линейной.

Рисунок 4 – Результаты для полиномиальной регрессии

68

Детальный анализ построенной модели зависимости коэффициента естественного прироста населения от доли трудоспособного населения в форме полинома второй степени выполните самостоятельно.

Чтобы осуществить прогноз коэффициента естественного прироста населения от доли трудоспособного населения на уровне 63,45% в квадратичной модели:

введите значение 63,45 в ячейку (например, B14)

в ячейке С14 рассчитайте квадрат значения, представленного в ячейке B14: «=B14^2»;

введите формулу для предсказанного коэффициента естественного прироста населения в ячейке D14

«=F17+F18*B14+F19*C14».

Квадратичная модель, использующая в качестве независимых

переменных x и x2 , применяется к широкому ряду одновыпуклых форм данных. Если же rpафик данных имеет две выпуклости (в форме S) подобно пиктоrpамме Полиномиальная на рис. 2, то можно применить кубическую модель. При этом команда Добавить линию тренда может работать неправильно для многочленов 3-го порядка, поэтому следует использовать

инструмент Регрессии с x, x2 и x3 в качестве независимых переменных.

2.Логарифмическое приближение

Влогарифмической модели уравнение линии тренда имеет следующий вид

yˆx a b ln x,

где ln - натуральный логарифм по основанию е (приближенно

2,718).

Так как логарифм определен только для положительных х, то значения независимой переменной должны быть положительными. Если же среди значений х имеются нулевые или отрицательные, то на вкладке Тип окна Линии Тренда пиктограмма Логарифмическая будет выделена серым. (Чтобы обойти это ограничение, можно добавить какое-либо число ко всем х.) .

69

Скопируйте исходные данные на Лист2.

Переименуйте Лист 2 на Логарифмическая функция

 

 

Результаты добавления логарифмической линии тренда на

график 'стоимости объектов недвижимости приведены на рис. 5.

 

 

 

5

 

 

 

 

 

 

 

, на 1000

 

 

y = - 429,67 + 102,58Ln(x)

 

 

 

 

 

населения

 

0

 

 

 

 

 

 

R2

= 0,814

 

 

 

 

 

 

 

 

 

 

 

 

человек населения

 

 

 

 

 

 

 

 

естественного прироста

-5

 

 

 

 

 

 

 

-10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Коэффициент

 

-15

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-20

 

 

 

 

 

 

 

 

 

54

56

58

60

62

64

66

68

 

 

 

 

Доля населения в трудоспособном возрасте, %

 

 

Рисунок 5 – Логарифмическая линия тренда

На рис.5 приведены результаты приближения логарифмической функцией (многочленом второй степени):

yx 429,67 102,58ln x

Значение индекса детерминации R2 0,814, хоть немного

лучше коэффициента детерминацииR2 0,8065, полученного при линейном приближении, но все же уступает индексу детерминации из полиномиального уравнения. .

Для получения более полных характеристик регрессии для логарифмической модели с помощью инструмента анализа Регрессия:

70