Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
LR5-Dvumernye_dannye (1).doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
363.01 Кб
Скачать

Попарные корреляции

Инструмент анализа Корреляция особенно полезен при определении попарных корреляций трех и более переменных. Полученные результаты используются для анализа множественной регрессионной модели.

Задание 3.

Исследовать попарные корреляции трех переменных: площадь, оценка, цена.

В таблице 2 данные, которые приведены в таблице 1, дополнены еще одной переменной – оценкой.

Таблица 2. Объекты недвижимости

Объект

Площадь

Оценка

Цена

Объект

Площадь

Оценка

Цена

1

521

7,8

26,0

9

965

14,6

37,2

2

661

23,8

31,0

10

1011

26,0

38,4

3

694

28,0

37,4

11

1047

30,0

43,6

4

743

26,2

34,8

12

1060

29,2

44,8

5

787

22,4

39,2

13

1079

24,2

40,6

6

825

28,2

38,0

14

1164

29,4

41,8

7

883

25,8

39,6

15

1298

23,6

45,2

8

920

20,8

31,2

  1. Откройте файл Двумерные данные.xls.

  2. С Листа1 скопируйте данные вместе с метками (диапазон A1:B16) на Лист3 в тот же диапазон.

  3. Выделите столбец B, щелкните на нем правой кнопкой мыши и в контекстном меню выберите команду Добавить ячейки. Данные переменной Цена переместятся в диапазон C1:C16.

  4. В ячейке B1 задайте метку Оценка, а в диапазон B2:B16 введите оценки из таблицы 2.

  5. В ячейку E1 введите Парные корреляции.

  6. Выберите команду: СервисАнализ данныхКорреляция.

  7. В диалоговом окне Корреляция в поле Входной интервал укажите диапазон данных A1:C16, включая метки. Проверьте, что данные сгруппированы по столбцам и установлен флажок Метки в первой строке.

  8. В области Параметры вывода включите опцию Выходной интервал, щелкните в текстовом поле и выделите ячейку E2, определяющую левый верхний угол области вывода результатов. Щелкните на кнопке ОК.

Интерпретация результатов

Выходные данные представляют собой матрицу трех попарных корреляций. Наибольшая корреляция 0,814651 – между Площадью и Ценой. Корреляция между Оценкой и Ценой 0,67537 – меньше и означает меньшую линейную зависимость между этими двумя переменными. Наименьшая корреляция 0,424219 – между Площадью и Оценкой.

Если мы хотим в линейной регрессионной модели использовать для прогноза отпускной цены одну независимую переменную, то полученные парные корреляции показывают, что Площадь больше подходит, чем Оценка, т.к. коэффициент корреляции 0,814651 больше, чем 0,67537.

Если же мы хотим во множественной линейной регрессионной модели использовать для прогноза отпускной цены две независимые переменные, то подойдут Площадь и Оценка, и не будет проблем с их взаимной коррелированностью, т.к. коэффициент корреляции (0,424219) этих двух переменных мал.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]