
- •Лабораторная работа №5 Двумерные данные
- •Исследование взаимосвязи переменных с помощью диаграмм рассеяния
- •Инструмент анализа: Корреляция
- •Попарные корреляции
- •Интерпретация результатов
- •Инструмент анализа: Ковариация
- •Контрольные вопросы
- •Контрольные задания
- •ДанныеФильтрАвтофильтр
- •ДанныеФильтрАвтофильтр.
Попарные корреляции
Инструмент анализа Корреляция особенно полезен при определении попарных корреляций трех и более переменных. Полученные результаты используются для анализа множественной регрессионной модели.
Задание 3. |
Исследовать попарные корреляции трех переменных: площадь, оценка, цена. |
В таблице 2 данные, которые приведены в таблице 1, дополнены еще одной переменной – оценкой.
Таблица 2. Объекты недвижимости
Объект |
Площадь |
Оценка |
Цена |
Объект |
Площадь |
Оценка |
Цена |
1 |
521 |
7,8 |
26,0 |
9 |
965 |
14,6 |
37,2 |
2 |
661 |
23,8 |
31,0 |
10 |
1011 |
26,0 |
38,4 |
3 |
694 |
28,0 |
37,4 |
11 |
1047 |
30,0 |
43,6 |
4 |
743 |
26,2 |
34,8 |
12 |
1060 |
29,2 |
44,8 |
5 |
787 |
22,4 |
39,2 |
13 |
1079 |
24,2 |
40,6 |
6 |
825 |
28,2 |
38,0 |
14 |
1164 |
29,4 |
41,8 |
7 |
883 |
25,8 |
39,6 |
15 |
1298 |
23,6 |
45,2 |
8 |
920 |
20,8 |
31,2 |
|
|
|
|
Откройте файл Двумерные данные.xls.
С Листа1 скопируйте данные вместе с метками (диапазон A1:B16) на Лист3 в тот же диапазон.
Выделите столбец B, щелкните на нем правой кнопкой мыши и в контекстном меню выберите команду Добавить ячейки. Данные переменной Цена переместятся в диапазон C1:C16.
В ячейке B1 задайте метку Оценка, а в диапазон B2:B16 введите оценки из таблицы 2.
В ячейку E1 введите Парные корреляции.
Выберите команду: СервисАнализ данныхКорреляция.
В диалоговом окне Корреляция в поле Входной интервал укажите диапазон данных A1:C16, включая метки. Проверьте, что данные сгруппированы по столбцам и установлен флажок Метки в первой строке.
В области Параметры вывода включите опцию Выходной интервал, щелкните в текстовом поле и выделите ячейку E2, определяющую левый верхний угол области вывода результатов. Щелкните на кнопке ОК.
Интерпретация результатов
Выходные данные представляют собой матрицу трех попарных корреляций. Наибольшая корреляция 0,814651 – между Площадью и Ценой. Корреляция между Оценкой и Ценой 0,67537 – меньше и означает меньшую линейную зависимость между этими двумя переменными. Наименьшая корреляция 0,424219 – между Площадью и Оценкой.
Если мы хотим в линейной регрессионной модели использовать для прогноза отпускной цены одну независимую переменную, то полученные парные корреляции показывают, что Площадь больше подходит, чем Оценка, т.к. коэффициент корреляции 0,814651 больше, чем 0,67537.
Если же мы хотим во множественной линейной регрессионной модели использовать для прогноза отпускной цены две независимые переменные, то подойдут Площадь и Оценка, и не будет проблем с их взаимной коррелированностью, т.к. коэффициент корреляции (0,424219) этих двух переменных мал.