 
        
        Мат.стат. и теория вероятностей / Лекции / Л5-матстат
.pdf 
1
ЛЕКЦИЯ 5 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
1. Общие понятия
Корреляционный анализ предполагает изучение зависимости между случайными величинами с одновременной количественной оценкой степени неслучайности их совместного изменения.
Изменение случайной величины Y , соответствующее изменению случайной величины X , разбивается на две составляющие – стохастическую, связанную с неслучайной зависимостью Y от X , и случайную (или статистическую), связанную со случайным изменением величин Y и X .
Стохастическая составляющая связи между Y и X характеризуется коэффициентом корреляции
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| 
 | M | 
 | 
 | X M X | 
 | Y M Y | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | . | 
 | (1) | |||
| 
 | 
 | 
 | x y | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| Коэффициент корреляции показывает, насколько связь между | |||||||||||
| случайными величинами близка к линейной. | 
 | 
 | 
 | 
 | 
 | ||||||
| Коэффициент | 
 | корреляции | 
 | нормирован | в | диапазоне | |||||
| значений 1 1. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
При 1 - имеет место строгая отрицательная корреляционная
зависимость.
При 1 строгая положительная линейная зависимость.
Уравнение линейной регрессии –тренд линейной корреляции имеет
| вид | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | y my | 
 | y | x mx . | (2) | |||
| 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | x | 
 | |||
| 2. Оценка коэффициента корреляции неранговыми методами | 
 | ||||||||
| Пусть дана совокупность нормально распределенных величин X и Y | |||||||||
| по парам | xi , yi - (распределение двумерное нормальное) объема n . | 
 | |||||||
| Выборочной оценкой коэффициента корреляции является величина | |||||||||
| 
 | 
 | 
 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | xi x yi y | 
 | |||||
| 
 | * | 
 | i 1 | 
 | 
 | 
 | 
 | . | (3) | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | n | 
 | n | 
 | |||
| 
 | 
 | 
 | xi | x 2 yi y 2 | 
 | ||||
| 
 | 
 | 
 | i 1 | 
 | i 1 | 
 | |||
Лекция 5 МС Стаценко И.В.
 
2
Вычисление оценки коэффициента корреляции удобно проводить по другой формуле
| 
 | 
 | 
 | 
 | 1 n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1 n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||
| * | 
 | 
 | xi x yi y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | xi x yi y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||||||||||||||||||||||||||||||||
| n i 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n i 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 1 | 
 | 
 | n | 
 | 
 | 
 | 2 | n | 
 | 
 | 
 | 
 | 2 | 
 | 
 | 
 | 1 | 
 | n | 
 | 
 | 
 | 
 | 2 | 1 n | 
 | 
 | 
 | 
 | 
 | 
 | 2 | 
 | 
 | 
 | 
 | |||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | xi | x | 
 | yi y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | xi | x | 
 | 
 | 
 | 
 | 
 | yi | y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||||||||||||
| 
 | 
 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | i 1 | 
 | 
 | 
 | 
 | i 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n i 1 | 
 | 
 | 
 | 
 | 
 | 
 | n i 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1 n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | xi yi | xi y yi x x y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | n | 
 | 
 | 
 | 
 | xy x y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||||||||||||||||||||||
| 
 | 
 | * | i 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | . | 
 | (4) | ||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | x 2 | 
 | 1 yi | 
 | 
 | 
 | 
 | 
 | 
 | 
 | x2 x 2 y2 y 2 | 
 | |||||||||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1 xi | 
 | y 2 | 
 | 
 | 
 | 
 | ||||||||||||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n | 
 | 
 | 
 | 
 | 
 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n i 1 | 
 | 
 | 
 | n i 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| 
 | 
 | Далее с учетом замены генеральных параметров в уравнении | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| регрессии (2) их статистическими точечными оценками | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | D * | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | D * | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | D | * | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| y y * | 
 | 
 | 
 | y | 
 | x x | 
 | * | 
 | 
 | 
 | y | x y | * | 
 | 
 | 
 | 
 | y | 
 | x | Ax B , | 
 | ||||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||||||||||||||||||||||||
| 
 | D * | 
 | D * | 
 | 
 | D | * | 
 | |||||||||||||||||||||||||||||||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | x | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | x | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | x | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
и полученного выражения для вычисления оценки коэффициента корреляции линию регрессии по статистическим данным можно строить, используя формулу
| 
 | 
 | 
 | 
 | 
 | y Ax B ; | (5) | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| где | A | xy | x y | ; | B y Ax . | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| 
 | 
 | 
 | |||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | x2 x 2 | 
 | 
 | |||||
| При n 5 распределение случайной величины | 
 | ||||||||||||
| 
 | 
 | 1 | 
 | 
 | 
 | 1 * | arcth * | 
 | |||||
| 
 | Z | 
 | ln | 
 | 
 | 
 | 
 | (6) | |||||
| 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 2 | 
 | 
 | 
 | 1 * | 
 | 
 | |||||
удовлетворительно аппроксимируется нормальным распределением с параметрами
Лекция 5 МС Стаценко И.В.
 
3
| M Z arcth , | 
 | D Z | 1 | 
 | 
 | ||||||||
| 
 | 
 | 
 | . | (7) | |||||||||
| n 3 | |||||||||||||
| При n 10 распределение случайной величины | 
 | ||||||||||||
| 
 | 
 | * | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| T | 
 | 
 | n 2 | 
 | 
 | 
 | 
 | (8) | |||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | ||||||||||
| 
 | 
 | 
 | |||||||||||
| 
 | 1 | *2 | 
 | 
 | 1 2 | 
 | 
 | 
 | 
 | 
 | |||
| удовлетворительно аппроксимируется | 
 | распределением | Стьюдента с | ||||||||||
k n 2 степенями свободы.
Гипотеза о значимости коэффициента корреляции – степени его
| отклонения от нуля, формулируется следующим образом: | 
 | ||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| H0 : | 
 | 0 против альтернативы H1 : | 
 | 0 . | (9) | ||||||||||||||||
| Корреляция между случайными величинами считается значимой, если | 
 | ||||||||||||||||||||
| 
 | 
 | 
 | * | 
 | 
 | H | 0 | отклоняется. | 
 | ||||||||||||
| 
 | 
 | 
 | 
 | 
 | |||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| С использованием статистик (7) и (8) получим | 
 | ||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 2 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | 
 | 
 | 
 | exp | 
 | 
 | 
 | 
 | 
 | u1 /2 | 
 | 1 | 
 | ||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||
| 
 | 
 | 
 | 
 | n | 3 | 
 | |||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | , | 
 | 
 | (10) | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
| 
 | N | 
 | 
 | 
 | 
 | 2 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | exp | 
 | 
 | 
 | 
 | 
 | u1 /2 | 
 | 1 | 
 | ||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||
| 
 | 
 | 
 | 
 | 
 | n | 3 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
| где | u1 /2 -квантиль нормального распределения. | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | t1 /2 n 2 | , | (11) | ||
| 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | T | 
 | 
 | n 2 | t21 /2 n 2 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| где | t1 /2 n 2 -квантиль распределения Стьюдента с n 2 степенями | ||||||||
| свободы. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| Пример 1. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| Дана совокупность | нормально | распределенных пар X ,Y | случайных | ||||||
величин
Лекция 5 МС Стаценко И.В.
 
4
| 
 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 
| x i | 5 | 4 | 7 | 7 | 3 | 11 | 14 | 15 | 15 | 4 | 
| y i | 7 | 6 | 4 | 11 | 2 | 21 | 31 | 23 | 40 | 15 | 
Проверить гипотезу о значимости корреляционной связи между X и
| Y на уровне значимости 0,05 . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| Решение: | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | x 8,5 , | 
 | y 16 ; | 
 | 
 | 
 | 
 | 
 | xy 184; | ||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | x2 93,1; | y2 | 398, 2 ; | 
 | 
 | |||||||||||||||||||
| 
 | 
 | D * 20,85; | D | * | 142, 2 ; | 
 | 
 | ||||||||||||||||||||
| 
 | 
 | 
 | 
 | x | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | y | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | * | 
 | 184 8,5 16 | 
 | 
 | 
 | 0,88 ; | 
 | 
 | |||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 20,85 142, 2 | 
 | 
 | ||||||||||||||||
| По статистике (7) получим | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 2 1,96 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | exp | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 7 | 
 | 
 | 
 | 
 | ||||||||||||||||||
| 
 | 0,05 N | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 0,6296 . | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 2 1,96 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | exp | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 7 | 
 | 
 | 
 | 
 | ||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| По статистике (8) получим | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | t0,95 8 | 
 | 
 | 
 | 1/2 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 2,312 | 
 | 
 | |||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 0,05T | 
 | 8 t2 | 0,95 8 | 
 | 
 | 
 | 8 2,312 | 
 | 0,632. | ||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| Так как 0,05 | * 0,88 | гипотеза | 
 | о значимости коэффициента | |||||||||||||||||||||||
| корреляции принимается. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
В соответствии с (5) линия тренда для примера 1 имеет вид:
Лекция 5 МС Стаценко И.В.
 
5
40
30
Y 20 f ( t)
10
| 0 | 5 | 10 | 15 | 20 | 
10
X t
Пример 2.
В таблице представлен средний вес транзистора, производимого новым станком во время обкатки (приработки) станка в течение первых 12 месяцев эксплуатации. Определить является ли статистически значимым изменение веса транзистора в период обкатки станка. Использовать уровень значимости 0,05. (Полагать, что распределение данных величин
X ,Y близкое к нормальному)
| 
 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 
| x i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 
| y i | 12 | 12,03 | 12,06 | 12,07 | 12,1 | 12,08 | 12,07 | 12,05 | 12,03 | 12,02 | 12,02 | 12,01 | 
Решение:
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| x 6,5, | y 12,045 ; | 
 | xy 78, 27 ; | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | x2 | 54,17 ; | 
 | y2 145,08 ; | |||||
| D * 11,92 ; | D * | 0,0009; | |||||||
| 
 | x | 
 | 
 | y | 
 | 
 | 
 | ||
78, 27 54,17 145,08 * 0, 25;

 11,92 0,0009
11,92 0,0009
Лекция 5 МС Стаценко И.В.
 
6
| 
 | 
 | 
 | 
 | 
 | 
 | exp | 2 1,96 | 1 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 9 | 
 | 
 | ||||||||||||||
| 
 | 
 | 0,05 N | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 0,57 . | |||||||||
| 
 | 
 | exp | 2 | 1,96 | 1 | |||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 9 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | t | 0,95 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1/2 | 
 | ||||||
| 
 | 
 | 0,05T | 
 | 
 | 
 | 
 | 
 | 
 | 10 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 0,58. | |||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | 0,95 | 
 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 8 t2 | 
 | 
 | 
 | 
 | 
 | ||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 10 | 
 | 
 | 
 | ||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 0, 25 0,57 0,05N | 
 | 
 | 
 | 
 | |||||||||||||||||
| Так как | * | 
 | 
 | 
 | изменение веса транзистора в | |||||||||||||||||
период обкатки станка является статистически не значимым.
3. Оценка коэффициента корреляции ранговыми методами
| 
 | 3.1. Коэффициент корреляции Кендалла | 
 | 
 | 
 | 
 | ||||||||||
| Пусть | дана | совокупность случайных величин X | и | Y | по | парам | |||||||||
| xi , yi - (распределение любое) объема n . | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| Расположим ряд значений | xi | 
 | в порядке возрастания, | тогда ряд | xi | ||||||||||
| можно заменить последовательностью | рангов | данных | величин | - | Rxi | - | |||||||||
| 1,2,3,..., n . Соответствующие по паре | значений xi , yi | ранги случайных | |||||||||||||
| величин Y обозначим - Ryi . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| Назовем пару рангов Ryk , Ryl | инверсией, если в последовательности | ||||||||||||||
| рангов Ryi , 1, 2,3,..., n наблюдаем | Ryk Ryl . | Обозначим число таких пар | |||||||||||||
| величиной Q . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| Коэффициент корреляции Кендалла (при отсутствии совпадений | |||||||||||||||
| рангов) вычисляется по формуле | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
| 
 | 
 | 1 | 
 | 
 | 4Q | 
 | 
 | , | 1 1. | 
 | 
 | 
 | (12) | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | n | 
 | n 1 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| При | n 10 | гипотеза о | значимости | коэффициента | корреляции | ||||||||||
| принимается на уровне значимости | 
 | , если величина | 
 | 
 | 
 | 
 | 
 | ||||||||
Лекция 5 МС Стаценко И.В.
 
7
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | u | 2 2n 5 | , | (13) | ||||
| 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 1 | 9n | 
 | 
 | 
 | |||
| 
 | 
 | n 1 | 
 | 
 | 
 | ||||
будет меньше величины ;
где u1 - квантиль нормального распределения,
То есть, если - коэффициент корреляции считают статистически значимым.
| Пример 3. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | Дана совокупность случайных величин X и Y , реализации которых | |||||||||||||||
| представлены парами значений | xi , yi . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | 1 | 
 | 2 | 3 | 
 | 4 | 
 | 5 | 6 | 
 | 7 | 
 | 8 | 9 | 10 | 
 | 
| x i | 5 | 
 | 4 | 7 | 
 | 8 | 
 | 3 | 11 | 
 | 14 | 
 | 15 | 16 | 6 | 
 | 
| y i | 7 | 
 | 6 | 4 | 
 | 11 | 
 | 2 | 21 | 
 | 31 | 
 | 23 | 40 | 15 | 
 | 
| 
 | Найти | коэффициент | 
 | корреляций | данных | величин, | используя | |||||||||
ранговый метод Кендалла, и проверить статистическую значимость коэффициента на уровне значимости 0,05 .
| Решение: | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 1. | Расположим значения случайной величины | X в порядке возрастания | ||||||||||||
| вместе с соответствующими им в паре значениями случайной величины Y . | ||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
| 
 | 
 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 
 | 8 | 9 | 
 | 10 | 
 | 
| x i | 
 | 3 | 4 | 5 | 6 | 7 | 8 | 11 | 
 | 14 | 15 | 
 | 16 | 
 | 
| y i | 
 | 2 | 6 | 7 | 15 | 4 | 11 | 21 | 
 | 31 | 23 | 
 | 40 | 
 | 
| 2. | Запишем ранги для значений случайной величины | X , | а под ними | |||||||||||
соответствующие ранги значений случайной величины Y .
Лекция 5 МС Стаценко И.В.
 
8
| 
 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 
| x i | 3 | 4 | 4 | 5 | 7 | 7 | 11 | 14 | 15 | 15 | 
| y i | 2 | 6 | 7 | 15 | 4 | 11 | 21 | 31 | 23 | 40 | 
| R x i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 
| R y i | 1 | 3 | 4 | 6 | 2 | 5 | 7 | 9 | 8 | 10 | 
3.Расчет числа инверсий рангов для случайной величины Y :
| Q1 0, | так как | 1 3, | 1 6 , …., | 1 10 ; | ||
| Q2 1, | так как | 3 2 ; | 
 | 
 | ||
| Q3 1, | так как | 4 2; | 
 | 
 | ||
| Q4 2, | так как | 6 2 , | 6 5; | 
 | ||
| Q5 0 | ; | 
 | 
 | 
 | 
 | |
| Q6 | 0 | ; | 
 | 
 | 
 | 
 | 
| Q7 | 0 ; | 
 | 
 | 
 | 
 | |
| Q8 | 1; | так как | 6 8 . | 
 | 
 | |
| Q9 | 0 | ; | 
 | 
 | 
 | 
 | 
Q10 0 .
Число инверсий рангов Q 5.
4. Расчет коэффициента корреляции Кендалла
| 1 | 
 | 
 | 4Q | 1 | 4 5 | 
 | 7 | 0,78. | 
| 
 | 
 | 
 | 
 | 
 | ||||
| 
 | n | 10 9 9 | ||||||
| 
 | 
 | n 1 | ||||||
5. Расчет граничного значения критической области
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| 
 | 
 | u | 2 2n 5 | 
 | 1,64 | 2 2 10 5 | 
 | 0, 41. | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 1 | 9n | 
 | 
 | 
 | 
 | 
 | |||||
| 
 | 
 | 
 | n 1 | 
 | 
 | 
 | 9 10 10 1 | 
 | 
 | |||||
| Далее, | учитывая, | что | 
 | , | полагаем | коэффициент корреляции | ||||||||
статистически значимым.
Недостаток метода: усложнение расчетной схемы при наличии совпадающих рангов в последовательностях рангов.
Лекция 5 МС Стаценко И.В.
 
9
| 3.2. Коэффициент корреляции Спирмена | 
 | |
| Пусть дана совокупность | случайных величин X и Y по | парам | 
| xi , yi - (распределение любое) объема n . | 
 | |
| Находим разность рангов | di Rxi Ryi , соответствующую | паре | 
| xi , yi . | 
 | 
 | 
Коэффициент корреляции Спирмена определяется формулой
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 6 di2 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 1 | 
 | 
 | i 1 | 
 | 
 | , | 
 | 
 | 1 1. | 
 | 
 | (14) | |||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n | 
 | n2 1 | 
 | 
 | 
 | 
 | |||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | 
 | При n 10 | 
 | корреляция | 
 | считается | статистически | значимой, если | ||||||||||||||||||||
| величина | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | u | 1 /2 | 
 | 
 | , | 
 | 
 | 
 | 
 | 
 | (15) | ||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| будет меньше, чем | 
 | 
 | 
 | ; | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| где | u1 /2 - квантиль нормального распределения. | 
 | 
 | 
 | 
 | |||||||||||||||||||||||
| Пример 4. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||
| 
 | 
 | Дана совокупность случайных величин X и Y , реализации которых | ||||||||||||||||||||||||||
| представлены парами значений xi , yi | . | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||
| 
 | 
 | 1 | 
 | 2 | 
 | 3 | 
 | 4 | 
 | 5 | 
 | 
 | 
 | 6 | 
 | 7 | 
 | 8 | 9 | 10 | 
 | |||||||
| x i | 
 | 5 | 
 | 4 | 
 | 7 | 
 | 7 | 
 | 3 | 
 | 
 | 
 | 11 | 
 | 14 | 
 | 15 | 15 | 4 | 
 | |||||||
| y i | 
 | 7 | 
 | 6 | 
 | 4 | 
 | 11 | 
 | 2 | 
 | 
 | 
 | 21 | 
 | 31 | 
 | 23 | 40 | 15 | 
 | |||||||
| 
 | 
 | Найти | коэффициент | 
 | корреляции | данных | величин, | используя | ||||||||||||||||||||
ранговый метод Спирмена и проверить статистическую значимость коэффициента на уровне значимости 0,05 .
Решение:
1. Запишем ранги случайных величин X и Y по парам и разности рангов
Лекция 5 МС Стаценко И.В.
 
10
| 
 | 
 | 1 | 2 | 3 | 
 | 4 | 
 | 
 | 
 | 
 | 5 | 
 | 
 | 6 | 
 | 7 | 8 | 
 | 9 | 
 | 10 | 
 | ||||
| x i | 
 | 5 | 4 | 7 | 
 | 7 | 
 | 
 | 
 | 
 | 3 | 
 | 
 | 11 | 
 | 14 | 15 | 
 | 15 | 
 | 4 | 
 | ||||
| y i | 
 | 7 | 6 | 4 | 
 | 11 | 
 | 
 | 
 | 
 | 2 | 
 | 
 | 21 | 
 | 31 | 23 | 
 | 40 | 
 | 15 | 
 | ||||
| R x i | 
 | 4 | 2,5 | 5,5 | 
 | 5,5 | 
 | 
 | 
 | 
 | 1 | 
 | 
 | 7 | 
 | 8 | 9,5 | 
 | 9,5 | 
 | 2,5 | 
 | ||||
| R y i | 
 | 4 | 3 | 2 | 
 | 5 | 
 | 
 | 
 | 
 | 1 | 
 | 
 | 7 | 
 | 9 | 8 | 
 | 10 | 
 | 6 | 
 | ||||
| d i | 
 | 0 | -0,5 | 3,5 | 
 | 0,5 | 
 | 
 | 
 | 
 | 0 | 
 | 
 | 0 | 
 | -1 | 1,5 | 
 | -0,5 | 
 | -3,5 | 
 | ||||
| 2. Расчет коэффициента корреляции Спирмена | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 6 di2 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 1 | 
 | 
 | i 1 | 
 | 
 | 
 | 0,83 . | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | n | 
 | n2 | 1 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||
| 3. Расчет граничного значения критической области | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | u | 1 /2 | 
 | 
 | 
 | 1,96 | 0,65 . | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | n 1 | 
 | 
 | 3 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||
| 
 | Далее, | учитывая, что , | полагаем коэффициент | корреляции | ||||||||||||||||||||||
| 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | |
| статистически значимым. | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | 
 | ||||
| Пример 5. (решение примера 2 вторым способом) | 
 | 
 | 
 | 
 | 
 | 
 | ||||||||||||||||||||
| 
 | В | таблице представлен средний вес | транзистора, | производимого | ||||||||||||||||||||||
новым станком во время обкатки (приработки) станка в течение первых 12 месяцев эксплуатации. Определить является ли статистически значимым
изменение веса транзистора в период обкатки станка. Использовать уровень значимости 0,05.
| 
 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 
| x i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 
| y i | 12 | 12,03 | 12,06 | 12,07 | 12,1 | 12,08 | 12,07 | 12,05 | 12,03 | 12,02 | 12,02 | 12,01 | 
Решение:
1.Представим ранжировку последовательностей X и Y по парам и разности рангов
Лекция 5 МС Стаценко И.В.
