Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
lb6.doc
Скачиваний:
13
Добавлен:
13.02.2015
Размер:
1.73 Mб
Скачать

5

Лабораторная работа 6.

Использование электронных таблиц Excel и статистического пакета Stadia для проведения корреляционного анализа

Корреляционный анализ 1

Задание для самостоятельной работы 2

Множественная корреляция 3

Задание для самостоятельной работы 5

Корреляционный анализ

Одна из наиболее распространенных задач статистического исследования состоит в изучении связи между выборками. Обычно связь между выборками носит не функциональный, а вероятност­ный (или стохастический) характер. В этом случае нет строгой, однозначной зависимости между величинами. При изучении стохастических зависимостей разли­чают корреляцию и регрессию.

Корреляционный анализ состоит в определении степени связи между двумя слу­чайными величинами X и Y. В качестве меры такой связи используется коэффи­циент корреляции. Коэффициент корреляции оценивается по выборке объема п связанных пар наблюдений (xi, yi) из совместной генеральной совокупности X и Y. Существует несколько типов коэффициентов корреляции, применение которых зависит от измерения (способа шкалирования) величин X и Y.

Для оценки степени взаимосвязи величин X и Y, измеренных в количественных шкалах, используется коэффи­циент линейной корреляции (коэффициент Пирсона), предполагающий, что выборки X и Y распределены по нормальному закону.

Коэффициент корреляции параметр, который характеризует степень линей­ной взаимосвязи между двумя выборками, рассчитывается по формуле:

Коэффициент корреляции изменяется от -1 (строгая обратная линейная зависимость) до 1 (строгая прямая пропорцио­нальная зависимость). При значении 0 линейной зависимости между двумя вы­борками нет.

В MS Excel для вычисления парных коэффициентов линейной корреляции используется специальная функция КОРРЕЛ (массив1; массив2),

где массив1 – ссылка на диапазон ячеек первой выборки (X);

массив2 – ссылка на диапазон ячеек второй выборки (Y).

Пример 1. 10 школьникам были даны тесты на наглядно-образное и вербальное мышление. Измерялось среднее время решения заданий теста в секундах. Исследователя интересует вопрос: существует ли вза­имосвязь между временем решения этих задач? Переменная X — обозначает среднее время реше­ния наглядно-образных, а переменная Y— сред­нее время решения вербальных заданий тестов (см. лекцию 7).

Таблица 1

№ испытуемых

X

Y

1

19

17

2

32

7

3

33

17

4

44

28

5

28

27

6

35

31

7

39

20

8

39

17

9

44

35

10

44

43

Рис. 1. Результаты вычисления коэффициента корреляции

Решение: Для выявления степени взаимосвязи, прежде всего, необходимо ввести данные в таблицу MS Excel (см. табл. 1, рис. 1). Затем вычисляется значение коэффициента корреляции. Для этого курсор установите в ячейку C1. На панели инструментов нажмите кнопку Вставка функции (fx). В появившемся диалоговом окне Мастер функций выберите ка­тегорию Статистические и функцию КОРРЕЛ, после чего нажмите кнопку ОК. Указателем мыши введите диапазон дан­ных выборки Х в поле массив1 (А1:А10). В поле массив2 введите диапазон данных выборки У (В1:В10). Нажмите кнопку ОК. В ячейке С1 появится значение коэффициента кор­реляции — 0,54119. Далее необходимо по статистическим таблицам определить критические значения для полученного коэффи­циента корреляции (см. лекцию 7 Приложение 3). При нахождении критических значений для вычисленного коэффициента линейной корреляции Пирсона число степе­ней свободы рассчитывается как k = n – 2 = 8.

ккрит=0,63 > 0,54 , следовательно, гипотеза Н1 отвергается и при­нимается гипотеза H0, иными словами, связь между временем решения наглядно-образных и вербальных заданий теста не доказана.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]