Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Программное обеспечение КАДС.docx
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
204.65 Кб
Скачать

Корреляционный анализ

- изучение статистической взаимосвязи двух и более количественных признаков.

Изучается статистическая связь двух равноправных признаков.

Мы должны ответить на вопросы:

1) существует ли связь?

2) прямая или обратная?

3) линейная или нелинейная?

4) какова сила связи?

Диаграмма рассеяния и вычисление линейного коэффициента корреляции Пирсона.

Всегда рассматривается между парами переменных.

Проанализировать корреляционную связь между признаками: уровень образования; начальная з/п; текущая з/п.

Три пары переменных.

1. Построение диаграммы рассеяния:

Graphs ---> Scatter/dot ---> Simple Define

Y Axis

X Axis

Получение и анализ корреляционной таблицы

Analyze ---> Correlate ---> Bivariate

Зависимость переменной от изменения другой переменной:

Pearson – по умолчанию.

Для изучения корреляционной связи двух ранжированных рядов:

Spearmen

Kendalls

Correlation

Уровень образования

Текущая з/п

Начальная з/п

Уровень образования

Pearson Correlation

Sig (2-tailed)

N

1

.

474

,661**

,000

474

,633**

,000

474

Текущая з/п

Pearson Correlation

Sig (2-tailed)

N

,661**

,000

474

1

.

474

,880**

,000

474

Начальная з/п

Pearson Correlation

Sig (2-tailed)

N

,633**

,000

474

,880**

,000

474

1

.

474

*/** - ситуация, подтверждающая альтернативную гипотезу о статистической связи.

** - корреляция значима на уровне 0,01.

* - корреляция значима на уровне 0,05.

Если нет */**, то коэффициент статистически незначим.

Все изучаемые переменные располагаются по строкам и по столбцам. Таблица симметрична относительно главной диагонали. По ней фиксируется связь переменной с самой собой, поэтому не анализируется. Анализируются клетки либо над, либо под диагональю.

Во внутренней клетке таблицы выводятся значения:

1) коэффициент Пирсона;

2) значение Сигнификации – гипотеза о статистической значимости (= корреляционной связи);

3) число наблюдений.

Уровень образования и текущая з/п:

1) связь сильная, прямая;

2) значим.

Регрессионный анализ

- изучение причинно-следственных связей. Если присутствует корреляция.

1. Построение уравнения парной линейной регрессии.

Analyze ---> Regression ---> Linear

Dependent – зависимая переменная.

Independent(s) – независимая переменная.

Построить уравнение парной линейной регрессии для переменных возраст и здоровье зубов (0 – здоровые, 4 – наибольшая степень развития заболевания).

Model Summary

Model

R

R Square (Коэф. детерминации)

Adjusted R Square

Std. Error of the Estimate

1

,452a

,204

,203

,83158

a – константа – возраст.

Коэффициент детерминации – оценка качества регрессионной модели. Умноженный на 100%, говорит о том, насколько % изменчивость зависимого признака обоснованно действием независимой переменной. Если значение фиксируется в районе 0,3 (30%) и выше, то модель качественная.

Coefficients

Model

Unstandartdized Coefficients

Standartdized Coefficients

t

Sig.

B

Std. Error

Beta

(Constant)

Возраст

1,295

,033

,071

,002

,452

18.220

17.006

,000

,000

B – сами коэффициенты.

Замечание: проверка статистическая значимость имеет смысл только для коэффициента регрессии.

Std. Error – для доверительных интервалов.

Beta – значение стандартизованного коэффициента регрессии.

t – критерий.

Constant

Возраст – коэффициент уравнения регрессии.

y = 1,295 + 0,033x

коэф. уравнения регрессии: при увеличении возраста на 1 год здоровье зубов

ухудшается на 0,033 балла.