Интерпретация диаграмм регрессии
В случае линейной регрессии инструмент анализа Регрессия строит две диаграммы регрессии: График остатков и График подбора. Первоначально диаграммы располагаются справа от итоговых результатов в ячейках M1:S12.
-
Выделите диаграмму Площадь График остатков и переместите ее в диапазон N16:S25. Чтобы обновить Лист2 после перемещения, закройте Excel с сохранением изменений, а затем вновь откройте файл Простая регрессия.xlsx.
График подбора аналогичен графику, построенному с добавлением линии тренда. Проведем форматирование диаграммы.
-
Выделите диаграмму Площадь График подбора, откройте вкладку Вставка и выберите тип диаграммы График с маркерами.
-
Щелкните правой кнопкой мыши на любом маркере ряда Предсказанное Цена и в контекстном меню выберите команду: Формат ряда данных… В диалоговом окне на вкладке Параметры маркера включите опцию Нет, на вкладке Цвет линии установите опцию Сплошная линия и выберите из палитры Цвет: красный, на вкладке Тип линии установите опцию Ширина: 1,5 пт. Щелкните на кнопке Закрыть.
-
Щелкните правой кнопкой мыши на любом маркере ряда Цена и в контекстном меню выберите команду: Формат ряда данных… В диалоговом окне на вкладке Параметры маркера включите опцию Встроенный и установите параметр Размер, равным 4. На вкладке Цвет линии установите опцию Нет линий. Щелкните на кнопке Закрыть.
-
Щелкните правой кнопкой мыши по Вертикальной оси (значений) и в контекстном меню выберите команду Формат оси… В диалоговом окне на вкладке Параметры оси параметр минимальное значение: установите в положение фиксированное и в текстовом поле введите значение 20. Параметр максимальное значение: установите в положение фиксированное и в текстовом поле введите значение 50. Параметр цена основных делений: установите в положение фиксированное и в текстовом поле введите значение 10. На вкладке Число в списке Числовые форматы: выберите формат Числовой и установите Число десятичных знаков: равным 0. Щелкните на кнопке Закрыть.
-
Выделите заголовок диаграммы и смените название на Объекты недвижимости.
-
Измените размеры диаграммы таким образом, чтобы она занимала диапазон N1:T14.
График остатков применяется для определения, является ли приемлемым приближение (в нашем случае использование МНК) для функции регрессии. Отформатируем диаграмму.
-
Выделите заголовок диаграммы и смените название на График остатков.
-
Измените размеры диаграммы таким образом, чтобы она занимала диапазон N16:S30.
Линейное приближение считается удовлетворительным, если График остатков имеет случайный разброс точек. В данном случае мы имеем «хорошее» приближение.
Использование статистических функций
|
Задание 3. |
Исследовать линейную зависимость между стоимостью и площадью жилого объекта с помощью статистических функций. |
-
Откройте файл Простая регрессия.xlsx.
-
Скопируйте данные с Листа1 (диапазон A1:B16) на Лист3 в такой же диапазон.
-
В ячейку F1 введите метку Значение, а в ячейку H1 введите метку Функция.
-
Выделите ячейку H2, вызовите Мастер функций и в списке статистических функций выберите функцию ОТРЕЗОК. В диалоговом окне Аргументы функции задайте соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H2 будет вычислен постоянный член уравнения регрессии b0= 18,78947.
-
Выделите ячейку H3, вызовите Мастер функций и в списке статистических функций выберите функцию НАКЛОН. В диалоговом окне Аргументы функции задайте соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H3 будет вычислен коэффициент регрессии b1= 0,02101.
-
Выделите ячейку H4, вызовите Мастер функций и в списке статистических функций выберите функцию СТОШYX. В диалоговом окне Аргументы функции задайте соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H4 будет вычислена стандартная ошибка оценки 3,2377744.
Как будет выглядеть уравнение регрессии? Сравните с результатами, полученными с помощью инструмента анализа Регрессия.
-
Скопируйте значения из столбца H в столбец F. Для этого выделите ячейки с вычисленными значениями (H2:H4), откройте вкладку Главная и выполните команду: Копировать. Затем выделите ячейку F2 и выполните команду: ВставитьСпециальная вставка... В диалоговом окне включите опцию значения и щелкните на кнопке ОК.
-
Чтобы в столбце H были отображены формулы, выделите диапазон H2:H4, откройте вкладку Формулы, щелкните на стрелке кнопки Зависимости формул и выберите команду Показать формулы. Увеличьте ширину столбца H, чтобы формулы были видны полностью.
Для предсказания цены используется функция ПРЕДСКАЗ. Допустим, мы хотим знать цену для объекта с жилой площадью в 1000 квадратных метров.
-
В ячейку D8 введите метку Площадь, в ячейку F8 введите метку Предсказанная цена, а в ячейку H8 введите метку Функция.
-
В ячейке D9 задайте значение жилой площади 1000.
-
Выделите ячейку H9 и вызовите Мастер функций. В списке статистических функций выберите функцию ПРЕДСКАЗ. В диалоговом окне Аргументы функции задайте значение X, выделив ячейку D9, а также соответствующие диапазоны переменных Y (Цена) и X (Площадь), не включая меток. Щелкните на кнопке ОК. В ячейке H9 будет выведена формула.
-
Выделите ячейку с формулой H9 и выполните команду Копировать, а затем выделите ячейку F9 и выполните команду ВставитьСпециальная вставка... В диалоговом окне включите опцию значения и щелкните на кнопке ОК. Ответьте на вопрос.
-
Какую стоимость будет иметь объект с жилой площадью в 1000 квадратных метров?
Контрольные вопросы
-
В чем разница между корреляционным анализом и регрессионным анализом?
-
Какой вид анализа (корреляционный или регрессионный) применяется в каждой из описанных ниже ситуаций?
а) Выяснение наличия какой-либо взаимосвязи между расходами на рекламу и объемом продаж.
б) Разработка системы прогнозирования эффективности портфеля ценных бумаг, основанной на изменениях одного из ведущих индексов фондовой биржи.
в) Анализ данных с целью определения силы взаимосвязи между моральным состоянием работников и их производительностью.
-
С какой целью используется МНК? Чем характеризуется этот метод?
-
Чем отличается линия наименьших квадратов от других линий на диаграмме рассеяния?
-
Как интерпретируются коэффициенты линейной регрессии b0, b1.
-
Что показывает коэффициент детерминации R2? Какое значение R2 лучше, более низкое или более высокое?
-
Каким образом осуществляется прогнозирование в построенной линейной модели регрессии?
Контрольные задания
Добавьте Лист4 и выполните задание с использованием базы данных служащих (файл База данных служащих.xlsx находится в папке Мои документы).
|
Вариант |
Задание |
|
1 |
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте линию тренда для линейной регрессии. Проанализируйте полученное уравнение и коэффициент детерминации. |
|
2 |
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, найдите стандартную ошибку оценки. О чем свидетельствуют это значение? |
|
3 |
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, найдите стандартную ошибку коэффициента регрессии. О чем свидетельствует это значение? |
|
4 |
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, постройте График остатков для линейной регрессии. Можно ли считать удовлетворительным полученное линейное приближение? |
|
5 |
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, с помощью статистических функций получите уравнение регрессии. Какую заработную плату можно ожидать для служащего со стажем работы 8 лет? |
|
6 |
Рассматривая годовую зарплату служащих как переменную Y, а стаж работы – как переменную X, с помощью статистических функций получите уравнение регрессии. На какую заработную плату может рассчитывать служащий с нулевым стажем работы? |
|
7 |
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, постройте линию тренда для линейной регрессии. Проанализируйте полученное уравнение и коэффициент детерминации. |
|
8 |
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, найдите стандартную ошибку оценки. О чем свидетельствуют это значение? |
|
9 |
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, найдите стандартную ошибку коэффициента регрессии. О чем свидетельствует это значение? |
|
10 |
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, постройте График остатков для линейной регрессии. Можно ли считать удовлетворительным полученное линейное приближение? |
|
11 |
Рассматривая годовую зарплату служащих как переменную Y, а возраст – как переменную X, с помощью статистических функций получите уравнение регрессии. Какую заработную плату можно ожидать для служащего в возрасте 42 лет? |
|
12 |
Рассматривая стаж работы как переменную Y, а возраст – как переменную X, постройте линию тренда для линейной регрессии. Проанализируйте полученное уравнение и коэффициент детерминации. |
|
13 |
Рассматривая стаж работы как переменную Y, а возраст – как переменную X, постройте График остатков для линейной регрессии. Можно ли считать удовлетворительным полученное линейное приближение? |
|
14 |
Рассматривая стаж работы как переменную Y, а возраст – как переменную X, с помощью статистических функций получите уравнение регрессии. Наличие какого стажа можно ожидать для служащего в возрасте 50 лет? |
