- •Методические указания
- •Содержание
- •Контрольная работа № 1. Изучение методов корреляционного анализа 4
- •Контрольная работа № 2. Изучение методов регрессионного анализа 10
- •Теоретические основы 10
- •Пример 1 14
- •Контрольная работа № 1 Изучение методов корреляционного анализа
- •1.1 Теоретические основы
- •1.1.1. Коэффициенты корреляции
- •1.1.2. Значимость коэффициентов корреляции
- •1.2. Порядок выполнения работы
- •1.5. Пример
- •Контрольная работа №2. Изучение методов регрессионного анализа(ра)
- •2.1. Теоретические основы
- •2.1.1. Оценка коэффициентов регрессии
- •2.1.2. Оценка адекватности уравнения регрессии
- •2.1.3. Явление мультиколлинеарности
- •2.2. Порядок выполнения работы
- •2.3. Содержание отчета
- •2.4. Контрольные вопросы
- •2.5. Примеры
- •2.5.1. Пример 1
- •2.5.2. Пример 2
- •Приложение 1 Критические значения критерия Стьюдента
- •Приложение 2 Функция стандартного нормального распределения
- •Приложение 3 Критические значения критерия Фишера
- •Приложение 4 (Работа с матрицами)
- •Литература
1.1.1. Коэффициенты корреляции
Основной задачей корреляционного анализа является оценка корреляционной матрицы по случайной выборке. На основе этих оценок вычисляются частные и множественные коэффициенты корреляции и детерминации.
Парный
коэффициент корреляции
характеризует тесноту линейной
зависимости между двумя переменными
на фоне действия всех остальных
показателей. Для универсальности
выражений включим переменную
в состав фактора
,
тогда информационной базой для анализа
будет являться матрица размерности
где
i-я
строка характеризует i-е
наблюдение по всем m-м
показателям
С учетом введенных обозначений парные коэффициенты корреляции определяются выражением:
, (2)
где
- значение i-го
наблюдения j-го
фактора;
- выборочный парный коэффициент
корреляции, характеризующий тесноту
линейной связи между показателями
и
. Он изменяется в пределах от –1 до +1,
причем чем ближе коэффициент корреляции
к значениям
, тем сильнее зависимость между
переменными. Если
,
связь положительная, если
, то – отрицательная. Средние значения
факторов и их среднеквадратичные
отклонения определяются выражениями:
;
. (3)
Из парных коэффициентов корреляции может быть составлена корреляционная матрица:
. (4)
Матрица
R
является симметричной
и положительно определенной.
Частный
коэффициент корреляции
характеризует тесноту линейной
зависимости между двумя переменными
при исключении влияния всех остальных
переменных, входящих в модель. Например,
точечная оценка частного коэффициента
корреляции (m-2)
- го порядка между факторами
и
определяется выражением:
, (5)
где
- алгебраическое дополнение элемента
корреляционной матрицы R.
При этом
,
где
- минор, являющийся определителем
матрицы, полученной из R
путем вычеркивания j-ой
строки и k-го
столбца.
Множественный коэффициент корреляции показывает тесноту связи между одной (результативной) переменой и остальными, входящими в модель; изменяется в пределах от 0 до 1, имеет порядок (m-1) и, например, для результативного признака определяется по формуле:
, (6)
где
- определитель матрицы R.
1.1.2. Значимость коэффициентов корреляции
(
то есть гипотеза
)
проверяется по t
- критерию Стьюдента. Наблюдаемое
значение критерия находится по формуле:
, (7)
где
r
- соответствующая оценка частного или
парного коэффициента корреляции;
- порядок частного коэффициента
корреляции, т.е. число фиксируемых
факторов. Для парных коэффициентов
корреляции
.
Проверяемый
коэффициент считается значимым (т.е.
нулевая гипотеза
:
отвергается) если
по модулю будет больше, чем
,
определяемое по таблицам t-распределения
для заданного
и
(приложение
1).
Доверительный
интервал
для значимого парного или частного
коэффициентов корреляции с заданной
надежностью r
определяют с помощью z
- преобразования Фишера. Предварительно
устанавливают интервальную оценку для
z:
, (8)
где
для заданной вероятности
вычисляют по функции стандартного
нормального распределения (приложение
2) из условия:
.
Значение
определяют по таблице z
- преобразования по найденному значению
r.
Функция
нечетная, т.е.
(9)
После
вычисления
в
соответствии с (8) выполняют обратный
переход по таблице z
- преобразования, определяя
и
.
Тогда интервальная оценка будет иметь
вид
, (10)
Таким
образом, с вероятностью
гарантируется, что коэффициент корреляции
будет находиться в интервале (
,
)
Значимость
множественного коэффициента
корреляции (его квадрат называется
коэффициентом детерминации) проверяется
по F
- критерию. Проверка значимости сводится
к проверке гипотезы, что множественный
коэффициент корреляции равен нулю, т.е.
,
а наблюдаемое значение статистики
находится по формуле:
(11)
Множественный
коэффициент корреляции считается
значимым, т.е. имеет место линейная
статистическая зависимость, между
фактором
и остальными факторами
,
если:
,
где
определяется по таблице F
– распределения для заданных
и
(приложение 3).
