Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТОДИЧКА Анализ с Excel(для студ)1.doc
Скачиваний:
19
Добавлен:
28.08.2019
Размер:
1.24 Mб
Скачать

§ 5. Корреляция Использование Мастера функций

Коэффициент корреляции используется для определения наличия взаимосвязи между двумя выборками.

Функция КОРРЕЛ рассчитывает коэффициент корреляции между интервалами ячеек массив1 и массив2.

Синтаксис функции (Рис. 5.1):

КОРРЕЛ(массив1;массив2)

Массив1 – это первый интервал ячеек со значениями.

Массив2 – это второй интервал ячеек со значениями.

Рис. 5.1

Демонстрационный пример 5А

Пусть необходимо установить зависимость между массой мезонефроса (г) у млекопитающих и возрастом в сутках.

Для определения коэффициента корреляции в Excel откройте чистый лист и в блок А1:А10 введите значения возраста в сутках: 8, 5, 9, 7, 6, 4, 3, 7, 5, 8; в блок В1:В10 введите значения массы мезонефроса: 78, 58, 23, 75, 89, 45, 12, 96, 83, 74. Курсор установите в ячейку D1.Для вычисления коэффициента корреляции вызовите Мастер функций, выберите функцию КОРРЕЛ, в числовое поле Массив1 (рис. 5.1) введите блок А1:А10 (или выделите непосредственно на листе), в числовое поле Массив2 введите блок В1:В10 (или выделите непосредственно на листе с помощью мыши) и нажмите клавишу Ок. В ячейку D1 будет помещен результат расчета коэффициента корреляции (в данном случае он будет равен 0,305695).

Использование пакета анализа

Корреляционный анализ

Важной задачей статистического анализа данных является также выявление взаимосвязей между выборками. Для оценки степени взаимосвязи служит коэффициент корреляции.

Для установления связи между заданными величинами необходимо:

а) выполнить команду Сервис>Анализ данных.

б) в появившемся списке Инструменты анализа выбрать строку Корреляция и нажать кнопку ОК.

в) в появившемся диалоговом окне указать входной диапазон, т. е. ввести ссылку на ячейки, содержащие анализируемые данные. Для этого следует навести указатель мыши на левую верхнюю ячейку данных, нажать левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к правой нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши. Входной диапазон должен содержать не менее двух столбцов или двух строк.

г) в разделе Группировка переключатель устанавливается в положение по столбцам или по строкам;

д) указать выходной диапазон, т. е. ввести ссылку на ячейки, в которые будут выведены результаты анализа. Для этого следует поставить флажок в левое поле Выходной диапазон (навести указатель мыши и щелкнуть левой кнопкой), далее навести указатель мыши в правое поле ввода Выходной диапазон и щелкнуть левой кнопкой мыши, затем указатель мыши наводится на левую верхнюю ячейку выходного диапазона и делается щелчок левой кнопкой мыши. Размер выходного диапазона будет определен автоматически, и на экран будет выведено сообщение в случае возможного наложения выходного диапазона на исходные данные.

е) нажимается кнопка ОК.

Результаты анализа. В выходной диапазон будет выведена корреляционная матрица, в которой на пересечении соответствующих строки и столбца находится коэффициент корреляции между соответствующими параметрами. Ячейки выходного диапазона, имеющие совпадающие координаты строк и столбцов, содержат значение 1, так как каждый столбец во входном диапазоне полностью коррелирует с самим собой.

Интерпретация результатов. Если коэффициент корреляции (r) по абсолютной величине (без учета знака) больше чем 0,95, то принято считать, что между параметрами существует практически линейная зависимость (прямая при положительном r и обратная при отрицательном г). Если коэффициент корреляции r лежит в диапазоне от 0,8 до 0,95, говорят о сильной степени линейной связи между параметрами. 0,6 < r < 0,8 - говорят о наличии линейной связи между параметрами. При r < 0,4 обычно считают, что линейную взаимосвязь между параметрами выявить не удалось.

Демонстрационный пример 5Б

Пусть исследовались возрастные изменения времени реакции у водителей грузовиков и использовался тест определения времени реакции в разных условиях видимости. Были получены результаты:

Время реакции

85,6

73,3

71,0

89,1

83,1

76,9

94,5

93,6

86,9

Возраст

27

27

27

41

41

41

55

55

55

Уровень видимости

10

60

120

10

60

120

10

60

120

Необходимо выявить, существует ли взаимосвязь между возрастом, уровнем видимости и временем реакции.

Решение. Для выполнения корреляционного анализа вводим в диапазон А1:I3 исходные данные:

А

В

С

D

Е

F

G

Н

I

1

85,6

73,3

71,0

89,1

83,1

76,9

94,5

93,6

86,9

2

27

27

27

41

41

41

55

55

55

3

10

60

120

10

60

120

10

60

120

Затем в меню Сервис выбираем пункт Анализ данных и далее указываем строку Корреляция. В появившемся диалоговом окне указываем входной диапазон A1:I3 или выделяем указанный диапазон мышью на листе Excel.

Указываем, что данные рассматриваются по строкам. Указываем выходной диапазон. Для этого ставим флажок в левое поле Выходной интервал и в правое поле ввода Выходной интервал вводим А5 (рис.5.2). Нажимаем кнопку ОК.

Рис. 5.2

Результаты анализа. В выходном диапазоне получаем корреляционную матрицу:

 

Строка 1

Строка 2

Строка 3

Строка 1

1

Строка 2

0,768733

1

Строка 3

-0,58348

0

1

Интерпретация результатов. Из таблицы видно, что корреляция между временем реакции (1 строка) и возрастом (2 строка) равна примерно 0,77, а между временем реакции (1 строка) и уровнем видимости (3 строка) – 0,59, между уровнем видимости (3 строка) и возрастом (2 строка) r = 0.

Таким образом, в результате анализа выявлены зависимости: сильная степень линейной связи между временем реакции и возрастом (r = 0,77) и средняя обратная линейная связь между временем реакции и уровнем видимости (r = – 0,59).