- •Математическая статистика учебно-методическое пособие
- •Содержание
- •Введение
- •Программа курса « математическая статистика»
- •2. Эмпирическая функция распределения
- •3. Полигон и гистограмма
- •4. Точечные оценки параметров распределения
- •Выборочная совокупность задана таблицей распределения
- •Решение. Найдем выборочную среднюю
- •5. Интервальные оценки параметров распределения
- •Решение. Задача сводится к отысканию доверительного интервала
- •6. Решение типовых задач по математической статистике
- •7. Элементы теории корреляции
- •Задачи для контрольной работы
- •1 Группа
- •2 Группа
- •3 Группа
- •4 Группа
- •5 Группа
- •6 Группа
- •Контрольные вопросы
- •Рекомендуемая литература
7. Элементы теории корреляции
Определение 1. Зависимость двух случайных величин называют корреляционной, если изменение одной случайной величины приводит к
изменению среднего значения другой случайной величины.
Основные задачи теории корреляции:
определить есть ли связь между случайными величинами, если есть, то найти уравнение зависимости (уравнение регрессии);
определить силу (тесноту) связи между случайными величинами.
Для определения самого факта связи между случайными величинами и тесноты связи служит коэффициент корреляции. Уравнение регрессии позволяет предсказать, какие изменения в среднем будет претерпевать признак при изменении другого признака.
Если уравнения регрессии являются линейными, то есть графиками будут прямые линии, то корреляционная зависимость называется линейной.
Пусть
извлечена выборка объема
и исследуются два количественных
признака
и
.
Результаты измерений занесены в таблицу.
Значения |
|
|
… |
|
Значения
|
|
|
… |
|
Выборочный
коэффициент корреляции
находится по формуле:
.
Свойства выборочного коэффициента корреляции:
1. Значения коэффициента корреляции изменяются на отрезке [–1;1]:
.
2.
Чем модуль
больше и ближе к 1, тем теснее связь между
изучаемыми признаками.
3.
Если
,
то между признаками функциональная
связь.
4.
Если
,
то между изучаемыми признаками нет
линейной корреляционной зависимости.
5.
Если
,
то между признаками прямая (положительная)
связь и если
,
то между признаками обратная (отрицательная)
связь.
Выборочное уравнение прямой регрессии на имеет вид:
,
где
,
– выборочные средние. За приближенные
значения
и
принимают
соответственно
и
:
,
.
Выборочное уравнение прямой регрессии на имеет вид:
.
Пример.
Психологи
провели тестирование среди пациентов
психоневрологического диспансера.
Возраст пациентов колебался от 14 до 34
лет. Затем была проведена случайная
выборка объёмом n=10.
Была поставлена задача: определить есть
ли зависимость возраста испытуемого
от значения показателя развития
заболевания
.
Результаты этого измерения представлены
в таблице 6:
Таблица 6.
|
25 |
35 |
45 |
55 |
65 |
75 |
85 |
95 |
105 |
115 |
|
14 |
18 |
19 |
20 |
23 |
23 |
24 |
26 |
29 |
34 |
Требуется вычислить выборочный коэффициент корреляции и найти выборочное уравнение прямой регрессии на .
Решение. Вычислим выборочный коэффициент корреляции по формуле:
.
Для
вычисления величин, входящих в формулу,
составим вспомогательную таблицу 7, в
которой результаты измерений записаны
столбцами. Внизу каждого из столбцов
вычислены суммы для нахождения средних
и
.
Далее расположены столбцы, в которых
вычисляются разности
и
,
их квадраты и произведения. Значения
этих столбцов суммируются (последняя
строка), чтобы получились величины,
необходимые для подстановки в формулу.
Отметим, что суммы в столбцах, в которых
вычислены разности
и
будут всегда равны нулю.
Таблица 7.
|
|
|
|
|
|
|
25 35 45 55 65 75 85 95 105 115 |
14 18 19 20 23 23 24 26 29 34 |
– 45 – 35 – 25 – 15 – 5 5 15 25 35 45 |
2025 1225 625 225 25 25 225 625 1225 2025 |
– 9 – 5 – 4 – 3 0 0 1 3 6 11 |
81 25 16 9 0 0 1 9 36 121 |
405 175 100 45 0 0 15 75 210 495 |
700 |
230 |
0 |
8250 |
0 |
298 |
1520 |
Находим выборочные средние и (смотри данные в таблице, 1–2 столбцы):
=
700/10 = 70,
= 230/10 = 23.
Выполнив все вычисления в таблице (3 – 7 столбцы), получаем:
,
,
.
Подставляя эти значения в соответствующую формулу, вычислим коэффициент корреляции:
Таким
образом,
выбранных пациентов имеет место очень
сильная (т.к. значение
близко к 1) и
положительная
(т.к.
)
корреляция между
возрастом испытуемого
и значением показателя развития
заболевания
.
Найдем теперь выборочное уравнение прямой регрессии на .
,
где
,
.
Тогда
Подставляя
в выборочное уравнение прямой регрессии
на
:
,
,
,
,
получим
или
.
Окончательно,
–
искомое уравнение прямой регрессии на .
