
- •«Спеціальні розділи математики»
- •«Теорія ймовірностей і математична статистика»
- •Специальные разделы метематики
- •1.4.2 Правила комбинаторики
- •2 Основные теоремы теории вероятностей
- •2.1 Теорема умножения вероятностей
- •2.4 Следствия теорем сложения и умножения
- •2.4.1 Теорема о вероятности появления хотя бы одного события
- •2.4.2 Формула полной вероятности
- •3 Случайные величины
- •3.1 Общие сведения
- •3.2 Функция распределения случайной величины.
- •3.4.1 Формы закона распределения дискретной случайной величины
- •3.4.2 Числовые характеристики дсв
- •3.4.3 Основные (типовые) распределения дсв.
- •3.5 Непрерывные св
- •3.5.1. Формы представления закона распределения нсв
- •3.5.2 Числовые характеристики нсв
- •3.5.3 Основные (типовые) законы распределения нсв
- •4. Система двух св (двумерная св)
- •4.1. Общие сведения
- •4.2. Закон распределения системы двух св
- •4.2.1 Табличное представление закона распределения двумерной св
- •4.2.2 Интегральная функция распределения двумерной св
- •Числовые характеристики системы двух св
- •Зависимые и независимые св
- •Часть II Математическая статистика
- •5. Элементы математической статистики
- •5.1 Теория выборок
- •5.1.1 Способы формирования выборки
- •5.1.2 Статистическое распределение выбоки
- •5.1.3 Числовые характеристики выборки
- •5.2 Теория оценок
- •5.2.1. Точечные оценки.
- •5.2.2 Интервальные оценки
- •5.3 Теория проверки статистических гипотез
- •5.3.1 Виды статистических гипотез
- •5.3.2 Статистический критерий
- •5.3.3 Проверка статистической гипотезы о параметрах распределения
- •5.3.4 Проверка статистической гипотезы о законе распределения
- •6 Элементы корреляционного анализа
- •6.1 Корреляционное поле
- •6.2 Выборочный коэффициент корреляции
- •6.3 Выборочное корреляционное отношение (вко)
- •7. Элементы регрессионного анализа
- •7.1 Выборочные уравнения регрессии
- •7.2 Выборочное уравнение прямой линии регрессии
- •7.3 Выборочное уравнение нелинейной регрессии
- •8. Элементы дисперсионного анализа
- •8.1 Общие сведения
- •8.2 Общая, факторная и остаточная суммы квадратов отклонений.
- •8.3 Общая, факторная и остаточная дисперсии.
- •8.4 Применение метода дисперсионного анализа
6 Элементы корреляционного анализа
Корреляционным анализом называется совокупность методов для определения формы корреляционной зависимости, оценки корреляционной зависимости, оценки корреляционных характеристик и проверки гипотез о них по выборочным данным.
Для
двух СВ X
и Y
корреляционная зависимость устанавливается
по выборке объёма n
связанных пар наблюдений
,
из совместной ГСX
и
Y.
6.1 Корреляционное поле
Предположение
о форме корреляционной зависимости
можно сделать с помощью корреляционного
поля. Корреляционное поле (диаграмма
рассеяния) – представление в виде точки
с координатами
в декартовой системе координат каждой
пары значений
,
исследуемой выборочной совокупности.
Корреляционные зависимости принято разделять на
- линейные (рис. 5.1);
- нелинейные (рис. 5.2).
Рис. 5.1 Линейная статистическая связь
Рис. 5.2 Нелинейная статистическая связь
6.2 Выборочный коэффициент корреляции
Точечная оценка тестоны линейной корреляционной взаимосвязи двух СВ X и Y, т. е. коэффициента корреляции, осуществляется с помощью выборочного коэффициента корреляции rв по формуле
(6.1)
или
,
n<30,
,
n<30.
Пример. Установить силу корреляционной связи, если известны результаты наблюдений
x |
1,00 |
1,50 |
3,00 |
4,50 |
5,00 |
y |
1,25 |
1,40 |
1,50 |
1,75 |
2,25 |
Установим силу корреляционной связи. Для этого сначала произведём дополнительные вычисления:
;
.
Вычислим средние квадратические отклонения:
;
.
Тогда
;
;
;
.
Полученные результаты подставляем в формулу (6.2) для вычисления выборочного коэффициента корреляции:
.
Выборочный коэффициент корреляции близок к единице, следовательно, корреляционная связь сильная.
При
большом значение объёма выборки n
одно и то же значение xi
может встретиться
раз, yi
–
раз,
одна и та же пара чисел
–
раз. Поэтому данные выборки группируют
и записывают в виде т. н. корреляционной
таблицы (табл. 6.1).
Таблица 6.1
Y |
|
ny | ||||
x1 |
… |
xi |
... |
xk | ||
y1 |
|
… |
|
… |
|
|
… |
… |
… |
… |
… |
… |
… |
yj |
|
… |
|
… |
|
|
… |
… |
… |
… |
… |
… |
… |
ym |
|
… |
|
… |
|
|
nx |
|
… |
|
… |
|
n |
Тогда
.
(6.3)
Если
,
и
,
являются равноотстоящими с соответствующими
значениямиh1
и h2,
то при расчете rв
целесобразно перейти к условным
вариантам.
,
;
(6.4)
,
,
где с1 – начало нового отсчёта величины X;
с2 – начало нового отсчёта величины Y;
h1 – расстояние между соседними вариантами величины X;
h2 – расстояние между соседними вариантами величины Y.
Тогда формула (6.3) примет вид
.
(6.5)
Абсолютное
значение rв
не превышает значение 1 ().
Пример. Установить силу корреляционной святи, если результаті наблюдений
Y |
X |
ny | ||||
20 |
25 |
30 |
35 |
40 | ||
16 |
4 |
6 |
- |
- |
- |
10 |
26 |
- |
8 |
10 |
- |
- |
18 |
36 |
- |
- |
32 |
3 |
9 |
44 |
46 |
- |
- |
4 |
12 |
6 |
22 |
56 |
- |
- |
- |
1 |
5 |
6 |
nx |
4 |
14 |
46 |
16 |
20 |
n=100 |
Составляем корреляционную таблицу в условных вариантах. За ложные нули выбираем С1=30 и С2=36.
U |
V |
nu | ||||
-2 |
-1 |
0 |
1 |
2 | ||
-2 |
4 |
6 |
- |
- |
- |
10 |
-1 |
- |
8 |
10 |
- |
- |
18 |
0 |
- |
- |
32 |
3 |
9 |
44 |
1 |
- |
- |
4 |
12 |
6 |
22 |
2 |
- |
- |
- |
1 |
5 |
6 |
nv |
4 |
14 |
46 |
16 |
20 |
n=100 |
Находим
,
:
;
.
Найдём
вспомогательные величины
,
:
Вычисляем
,
.
.
.
По формуле (6.5) находим выборочный коэффициент корреляции:
.
Значение
rв
далее может быть использовано для
определения интервальной оценки
коэффициента корреляции r.
Например, интервальная оценка r
нормально распределённой ГС при
имеет вид
.
(6.6)
Известно,
что если величины X
и
Y
некоррелированы, то r=0
(Тема 4). Допустим, что
.
Т. к.rв
является оценкой, r
то нельзя достоверно заключить, что r
генеральной совокупности также отличен
от 0.
Поэтому
возникает необходимость проверки
статистической гипотезы
при конкурирующей гипотезе
.
В качестве критерия для проверки основной гипотезы, если ГС (X, Y) распределена нормально, прнимают СВ
,
(6.7)
которая при справедливости H0 имеет распределение Стьюдента с числом степеней свободы, равным n-2.
Критическое значение критерия определяем по таблице критических точек распределения Стьюдента по заданному уровню значимости и числу степеней свободы. Наблюдаемое значение критерия определяем по формуле (6.7).
Если
– нет оснований отвернутьH0,
что означает: rв
незначим, СВ X
и Y
не коррелированы.
Если
–H0
отвергают: rв
значим, СВ X
и Y
коррелированы.