Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР6-2007Простая регрессия.doc
Скачиваний:
12
Добавлен:
26.11.2018
Размер:
202.75 Кб
Скачать

Интерпретация диаграмм регрессии

В случае линейной регрессии инструмент анализа Регрессия строит две диаграммы регрессии: График остатков и График подбора. Первоначально диаграммы располагаются справа от итоговых результатов в ячейках M1:S12.

  1. Выделите диаграмму Площадь График остатков и переместите ее в диапазон N16:S25. Чтобы обновить Лист2 после перемещения, закройте Excel с сохранением изменений, а затем вновь откройте файл Простая регрессия.xlsx.

График подбора аналогичен графику, построенному с добавлением линии тренда. Проведем форматирование диаграммы.

  1. Выделите диаграмму Площадь График подбора, откройте вкладку Вставка и выберите тип диаграммы График с маркерами.

  2. Щелкните правой кнопкой мыши на любом маркере ряда Предсказанное Цена и в контекстном меню выберите команду: Формат ряда данных… В диалоговом окне на вкладке Параметры маркера включите опцию Нет, на вкладке Цвет линии установите опцию Сплошная линия и выберите из палитры Цвет: красный, на вкладке Тип линии установите опцию Ширина: 1,5 пт. Щелкните на кнопке Закрыть.

  3. Щелкните правой кнопкой мыши на любом маркере ряда Цена и в контекстном меню выберите команду: Формат ряда данных… В диалоговом окне на вкладке Параметры маркера включите опцию Встроенный и установите параметр Размер, равным 4. На вкладке Цвет линии установите опцию Нет линий. Щелкните на кнопке Закрыть.

  4. Щелкните правой кнопкой мыши по Вертикальной оси (значений) и в контекстном меню выберите команду Формат оси… В диалоговом окне на вкладке Параметры оси параметр минимальное значение: установите в положение фиксированное и в текстовом поле введите значение 20. Параметр максимальное значение: установите в положение фиксированное и в текстовом поле введите значение 50. Параметр цена основных делений: установите в положение фиксированное и в текстовом поле введите значение 10. На вкладке Число в списке Числовые форматы: выберите формат Числовой и установите Число десятичных знаков: равным 0. Щелкните на кнопке Закрыть.

  5. Выделите заголовок диаграммы и смените название на Объекты недвижимости.

  6. Измените размеры диаграммы таким образом, чтобы она занимала диапазон N1:T14.

График остатков применяется для определения, является ли приемлемым приближение (в нашем случае использование МНК) для функции регрессии. Отформатируем диаграмму.

  1. Выделите заголовок диаграммы и смените название на График остатков.

  2. Измените размеры диаграммы таким образом, чтобы она занимала диапазон N16:S30.

Линейное приближение считается удовлетворительным, если График остатков имеет случайный разброс точек. В данном случае мы имеем «хорошее» приближение.

Использование статистических функций

Задание 3.

Исследовать линейную зависимость между стоимостью и площадью жилого объекта с помощью статистических функций.

  1. Откройте файл Простая регрессия.xlsx.

  2. Скопируйте данные с Листа1 (диапазон A1:B16) на Лист3 в такой же диапазон.

  3. В ячейку F1 введите метку Значение, а в ячейку H1 введите метку Функция.

  4. Выделите ячейку H2, вызовите Мастер функций и в списке статистических функций выберите функцию ОТРЕЗОК. В диалоговом окне Аргументы функции задайте соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H2 будет вычислен постоянный член уравнения регрессии b0= 18,78947.

  5. Выделите ячейку H3, вызовите Мастер функций и в списке статистических функций выберите функцию НАКЛОН. В диалоговом окне Аргументы функции задайте соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H3 будет вычислен коэффициент регрессии b1= 0,02101.

  6. Выделите ячейку H4, вызовите Мастер функций и в списке статистических функций выберите функцию СТОШYX. В диалоговом окне Аргументы функции задайте соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H4 будет вычислена стандартная ошибка оценки 3,2377744.

Как будет выглядеть уравнение регрессии? Сравните с результатами, полученными с помощью инструмента анализа Регрессия.

  1. Скопируйте значения из столбца H в столбец F. Для этого выделите ячейки с вычисленными значениями (H2:H4), откройте вкладку Главная и выполните команду: Копировать. Затем выделите ячейку F2 и выполните команду: ВставитьСпециальная вставка... В диалоговом окне включите опцию значения и щелкните на кнопке ОК.

  2. Чтобы в столбце H были отображены формулы, выделите диапазон H2:H4, откройте вкладку Формулы, щелкните на стрелке кнопки Зависимости формул и выберите команду Показать формулы. Увеличьте ширину столбца H, чтобы формулы были видны полностью.

Для предсказания цены используется функция ПРЕДСКАЗ. Допустим, мы хотим знать цену для объекта с жилой площадью в 1000 квадратных метров.

  1. В ячейку D8 введите метку Площадь, в ячейку F8 введите метку Предсказанная цена, а в ячейку H8 введите метку Функция.

  2. В ячейке D9 задайте значение жилой площади 1000.

  3. Выделите ячейку H9 и вызовите Мастер функций. В списке статистических функций выберите функцию ПРЕДСКАЗ. В диалоговом окне Аргументы функции задайте значение X, выделив ячейку D9, а также соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H9 будет выведена формула.

  4. Выделите ячейку с формулой H9 и выполните команду Копировать, а затем выделите ячейку F9 и выполните команду ВставитьСпециальная вставка... В диалоговом окне включите опцию значения и щелкните на кнопке ОК. Ответьте на вопрос.

  • Какую стоимость будет иметь объект с жилой площадью в 1000 квадратных метров?

Контрольные вопросы

  1. В чем разница между корреляционным анализом и регрессионным анализом?

  2. Какой вид анализа (корреляционный или регрессионный) применяется в каждой из описанных ниже ситуаций?

а) Выяснение наличия какой-либо взаимосвязи между расходами на рекламу и объемом продаж.

б) Разработка системы прогнозирования эффективности портфеля ценных бумаг, основанной на изменениях одного из ведущих индексов фондовой биржи.

в) Анализ данных с целью определения силы взаимосвязи между моральным состоянием работников и их производительностью.

  1. С какой целью используется МНК? Чем характеризуется этот метод?

  2. Чем отличается линия наименьших квадратов от других линий на диаграмме рассеяния?

  3. Как интерпретируются коэффициенты линейной регрессии b0, b1.

  4. Что показывает коэффициент детерминации R2? Какое значение R2 лучше, более низкое или более высокое?

  5. Каким образом осуществляется прогнозирование в построенной линейной модели регрессии?

Контрольные задания

Добавьте Лист4 и выполните задание с использованием базы данных служащих (файл База данных служащих.xlsx находится в папке Мои документы).

Вариант

Задание

1

Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте линию тренда для линейной регрессии. Проанализируйте полученное уравнение и коэффициент детерминации.

2

Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, найдите стандартную ошибку оценки. О чем свидетельствуют это значение?

3

Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, найдите стандартную ошибку коэффициента регрессии. О чем свидетельствует это значение?

4

Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте График остатков для линейной регрессии. Можно ли считать удовлетворительным полученное линейное приближение?

5

Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, с помощью статистических функций получите уравнение регрессии. Какую заработную плату можно ожидать для служащего со стажем работы 8 лет?

6

Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, с помощью статистических функций получите уравнение регрессии. На какую заработную плату может рассчитывать служащий с нулевым стажем работы?

7

Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, постройте линию тренда для линейной регрессии. Проанализируйте полученное уравнение и коэффициент детерминации.

8

Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, найдите стандартную ошибку оценки. О чем свидетельствуют это значение?

9

Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, найдите стандартную ошибку коэффициента регрессии. О чем свидетельствует это значение?

10

Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, постройте График остатков для линейной регрессии. Можно ли считать удовлетворительным полученное линейное приближение?

11

Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, с помощью статистических функций получите уравнение регрессии. Какую заработную плату можно ожидать для служащего в возрасте 42 лет?

12

Рассматривая стаж работы как переменную Y, а возраст – как переменную X, постройте линию тренда для линейной регрессии. Проанализируйте полученное уравнение и коэффициент детерминации.

13

Рассматривая стаж работы как переменную Y, а возраст – как переменную X, постройте График остатков для линейной регрессии. Можно ли считать удовлетворительным полученное линейное приближение?

14

Рассматривая стаж работы как переменную Y, а возраст – как переменную X, с помощью статистических функций получите уравнение регрессии. Наличие какого стажа можно ожидать для служащего в возрасте 50 лет?

7