
Инструмент анализа: Ковариация
Ковариация (корреляционный момент), также как и корреляция, является характеристикой степени линейной зависимости двух переменных. Выражением для вычисления ковариации является числитель в формуле для коэффициента корреляции, а это означает, что ковариация и корреляция представляют, в действительности, одну и ту же информацию. Однако значения ковариации сложнее интерпретировать, так как ее единицы измерения являются произведением единиц измерения каждой переменной. Например, для цен и жилой площади ковариация выражена в единицах квадратных метров, умноженных на тысячи долларов. Поэтому при анализе обычно предпочитают использовать коэффициент корреляции, не имеющий размерности. Тем не менее, в некоторых ситуациях ковариация используется как самостоятельная характеристика. Так, например, в теории финансов ковариацию применяют для описания зависимости одних курсов акций по отношению к другим.
Задание 4. |
Определить ковариацию между размером жилой площади и ценой объекта. |
Откройте файл Двумерные данные.xlsx.
На Листе2 в ячейку D10 введите текст Инструмент анализа: Ковариация.
В диалоговом окне Анализ данных выберите инструмент Ковариация и щелкните на кнопке ОК.
В диалоговом окне Ковариация установите параметры как указано ниже на рисунке. Щелкните на кнопке ОК.
Результаты будут расположены в диапазоне D11:F13 (см. рисунок ниже).
Результатом является матрица попарных ковариаций. На диагонали расположены дисперсии для каждой переменной (квадрат стандартного отклонения). Значение ковариации между переменными Цена и Площадь (853,2427) указано в левой нижней части матрицы в ячейке E13. Правая верхняя часть матрицы пустая, так как ее значения совпадают с соответствующими значениями в левой нижней части.
Вычислите ковариацию, используя статистическую функцию. Для этого в ячейку D15 введите текст Функция КОВАР. Выделите ячейку D16, вызовите Мастер функций и выберите статистическую функцию КОВАР. В диалоговом окне Аргументы функции щелкните в поле Массив1, а затем выделите диапазон A2:A16, не включая метку. Теперь щелкните в поле Массив2 и выделите диапазон B2:B16, не включая метку. Щелкните на кнопке ОК.
Замечание. Статистическая функция КОВАР, также как и функция КОРРЕЛ, не статична, то есть при изменении данных в исходном диапазоне значение ковариации, рассчитанной с помощью функции КОВАР, тоже изменится.
Выделите ячейку B2 и введите в нее число 30. Нажмите [Enter].
Обратите внимание! Величина ковариации в ячейке D16 изменилась, а в матрице попарных ковариаций осталось прежнее значение.
Щелкните на кнопке Отменить на панели инструментов Стандартная, чтобы вернуться к исходному значению в ячейке B2.
Контрольные вопросы
В чем отличие анализа двумерных данных от анализа одномерных данных?
На какие вопросы можно ответить, проанализировав двумерные данные?
Что такое диаграмма рассеяния? С какой целью она используется для анализа?
Что такое коэффициент корреляции?
На что указывает знак (положительный или отрицательный) коэффициента корреляции?
Если большие значения X вызывают появление больших значений Y, то какой, по вашему мнению, должна быть корреляция – положительной, отрицательной или нулевой? Почему?
Для каждого из приведенных ниже равенств укажите типичный вариант интерпретации?
а) r = 1;
б) r = 0,85;
в) r = 0;
г) r = –0,15;
д) r = –1.
Поясните как, по вашему мнению, располагаются точки на диаграмме рассеяния в следующих ситуациях.
а) Взаимосвязь между X и Y отсутствует.
б) Линейная взаимосвязь с сильной положительной корреляцией.
в) Линейная взаимосвязь с сильной отрицательной корреляцией.
г) Линейная взаимосвязь со слабой положительной корреляцией.
д) Линейная взаимосвязь со слабой отрицательной корреляцией.
е) Линейная взаимосвязь с корреляцией +1?
ж) Линейная взаимосвязь с корреляцией –1?
Что представляет собой ковариация между X и Y?
Какую из характеристик легче интерпретировать – корреляцию или ковариацию? Почему?