Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ЛР5-2007Двумерные данные.doc
Скачиваний:
3
Добавлен:
18.07.2019
Размер:
377.86 Кб
Скачать

Попарные корреляции

Инструмент анализа Корреляция особенно полезен при определении попарных корреляций трех и более переменных. Полученные результаты используются для анализа множественной регрессионной модели.

Задание 3.

Исследовать попарные корреляции трех переменных: площадь, оценка, цена.

В таблице 2 данные, которые приведены в таблице 1, дополнены еще одной переменной – оценкой.

Таблица 2. Объекты недвижимости

Объект

Площадь

Оценка

Цена

Объект

Площадь

Оценка

Цена

1

521

7,8

26,0

9

965

14,6

37,2

2

661

23,8

31,0

10

1011

26,0

38,4

3

694

28,0

37,4

11

1047

30,0

43,6

4

743

26,2

34,8

12

1060

29,2

44,8

5

787

22,4

39,2

13

1079

24,2

40,6

6

825

28,2

38,0

14

1164

29,4

41,8

7

883

25,8

39,6

15

1298

23,6

45,2

8

920

20,8

31,2

  1. Откройте файл Двумерные данные.xls.

  2. С Листа1 скопируйте данные вместе с метками (диапазон A1:B16) на Лист3 в тот же диапазон.

  3. Выделите столбец B, откройте на ленте вкладку Главная, в группе Ячейки щелкните на стрелке кнопки Вставить и выберите команду Вставить столбцы на лист. Данные переменной Цена переместятся в диапазон C1:C16.

  4. В ячейке B1 задайте метку Оценка, а в диапазон B2:B16 введите оценки из таблицы 2.

  5. В ячейку E1 введите метку Парные корреляции.

  6. В диалоговом окне Анализ данных выберите инструмент Корреляция и щелкните на кнопке ОК.

  7. В диалоговом окне Корреляция в поле Входной интервал укажите диапазон данных A1:C16, включая метки. Проверьте, что данные сгруппированы по столбцам и установлен флажок Метки в первой строке.

  8. В области Параметры вывода включите опцию Выходной интервал, щелкните в текстовом поле и выделите ячейку E2, определяющую левый верхний угол области вывода результатов. Щелкните на кнопке ОК.

Интерпретация результатов

Выходные данные представляют собой матрицу трех попарных корреляций. Наибольшая корреляция (0,814651) – между переменными Площадь и Цена. Корреляция между переменными Оценка и Цена (0,67537) – меньше и означает меньшую линейную зависимость между этими двумя переменными. Наименьшая корреляция (0,424219) – между переменными Площадь и Оценка.

Если мы хотим в линейной регрессионной модели использовать для прогноза отпускной цены одну независимую переменную, то полученные парные корреляции показывают, что переменная Площадь больше подходит, чем переменная Оценка, так как коэффициент корреляции 0,814651 больше, чем 0,67537.

Если же мы хотим во множественной линейной регрессионной модели использовать для прогноза отпускной цены две независимые переменные, то подойдут обе переменные Площадь и Оценка, и не будет проблем с их взаимной коррелированностью, так как коэффициент корреляции (0,424219) этих двух переменных мал.