- •«Спеціальні розділи математики»
- •«Теорія ймовірностей і математична статистика»
- •Специальные разделы метематики
- •1.4.2 Правила комбинаторики
- •2 Основные теоремы теории вероятностей
- •2.1 Теорема умножения вероятностей
- •2.4 Следствия теорем сложения и умножения
- •2.4.1 Теорема о вероятности появления хотя бы одного события
- •2.4.2 Формула полной вероятности
- •3 Случайные величины
- •3.1 Общие сведения
- •3.2 Функция распределения случайной величины.
- •3.4.1 Формы закона распределения дискретной случайной величины
- •3.4.2 Числовые характеристики дсв
- •3.4.3 Основные (типовые) распределения дсв.
- •3.5 Непрерывные св
- •3.5.1. Формы представления закона распределения нсв
- •3.5.2 Числовые характеристики нсв
- •3.5.3 Основные (типовые) законы распределения нсв
- •4. Система двух св (двумерная св)
- •4.1. Общие сведения
- •4.2. Закон распределения системы двух св
- •4.2.1 Табличное представление закона распределения двумерной св
- •4.2.2 Интегральная функция распределения двумерной св
- •Числовые характеристики системы двух св
- •Зависимые и независимые св
- •Часть II Математическая статистика
- •5. Элементы математической статистики
- •5.1 Теория выборок
- •5.1.1 Способы формирования выборки
- •5.1.2 Статистическое распределение выбоки
- •5.1.3 Числовые характеристики выборки
- •5.2 Теория оценок
- •5.2.1. Точечные оценки.
- •5.2.2 Интервальные оценки
- •5.3 Теория проверки статистических гипотез
- •5.3.1 Виды статистических гипотез
- •5.3.2 Статистический критерий
- •5.3.3 Проверка статистической гипотезы о параметрах распределения
- •5.3.4 Проверка статистической гипотезы о законе распределения
- •6 Элементы корреляционного анализа
- •6.1 Корреляционное поле
- •6.2 Выборочный коэффициент корреляции
- •6.3 Выборочное корреляционное отношение (вко)
- •7. Элементы регрессионного анализа
- •7.1 Выборочные уравнения регрессии
- •7.2 Выборочное уравнение прямой линии регрессии
- •7.3 Выборочное уравнение нелинейной регрессии
- •8. Элементы дисперсионного анализа
- •8.1 Общие сведения
- •8.2 Общая, факторная и остаточная суммы квадратов отклонений.
- •8.3 Общая, факторная и остаточная дисперсии.
- •8.4 Применение метода дисперсионного анализа
6 Элементы корреляционного анализа
Корреляционным анализом называется совокупность методов для определения формы корреляционной зависимости, оценки корреляционной зависимости, оценки корреляционных характеристик и проверки гипотез о них по выборочным данным.
Для двух СВ X и Y корреляционная зависимость устанавливается по выборке объёма n связанных пар наблюдений ,из совместной ГСX и Y.
6.1 Корреляционное поле
Предположение о форме корреляционной зависимости можно сделать с помощью корреляционного поля. Корреляционное поле (диаграмма рассеяния) – представление в виде точки с координатами в декартовой системе координат каждой пары значений,исследуемой выборочной совокупности.
Корреляционные зависимости принято разделять на
- линейные (рис. 5.1);
- нелинейные (рис. 5.2).
Рис. 5.1 Линейная статистическая связь
Рис. 5.2 Нелинейная статистическая связь
6.2 Выборочный коэффициент корреляции
Точечная оценка тестоны линейной корреляционной взаимосвязи двух СВ X и Y, т. е. коэффициента корреляции, осуществляется с помощью выборочного коэффициента корреляции rв по формуле
(6.1)
или
, n<30,
, n<30.
Пример. Установить силу корреляционной связи, если известны результаты наблюдений
x |
1,00 |
1,50 |
3,00 |
4,50 |
5,00 |
y |
1,25 |
1,40 |
1,50 |
1,75 |
2,25 |
Установим силу корреляционной связи. Для этого сначала произведём дополнительные вычисления:
;
.
Вычислим средние квадратические отклонения:
;.
Тогда
;
;
;
.
Полученные результаты подставляем в формулу (6.2) для вычисления выборочного коэффициента корреляции:
.
Выборочный коэффициент корреляции близок к единице, следовательно, корреляционная связь сильная.
При большом значение объёма выборки n одно и то же значение xi может встретиться раз, yi – раз, одна и та же пара чисел –раз. Поэтому данные выборки группируют и записывают в виде т. н. корреляционной таблицы (табл. 6.1).
Таблица 6.1
Y |
|
ny | ||||
x1 |
… |
xi |
... |
xk | ||
y1 |
… |
… | ||||
… |
… |
… |
… |
… |
… |
… |
yj |
… |
… | ||||
… |
… |
… |
… |
… |
… |
… |
ym |
… |
… | ||||
nx |
… |
… |
n |
Тогда
. (6.3)
Если ,и,являются равноотстоящими с соответствующими значениямиh1 и h2, то при расчете rв целесобразно перейти к условным вариантам.
, ; (6.4)
, ,
где с1 – начало нового отсчёта величины X;
с2 – начало нового отсчёта величины Y;
h1 – расстояние между соседними вариантами величины X;
h2 – расстояние между соседними вариантами величины Y.
Тогда формула (6.3) примет вид
. (6.5)
Абсолютное значение rв не превышает значение 1 ().
Пример. Установить силу корреляционной святи, если результаті наблюдений
Y |
X |
ny | ||||
20 |
25 |
30 |
35 |
40 | ||
16 |
4 |
6 |
- |
- |
- |
10 |
26 |
- |
8 |
10 |
- |
- |
18 |
36 |
- |
- |
32 |
3 |
9 |
44 |
46 |
- |
- |
4 |
12 |
6 |
22 |
56 |
- |
- |
- |
1 |
5 |
6 |
nx |
4 |
14 |
46 |
16 |
20 |
n=100 |
Составляем корреляционную таблицу в условных вариантах. За ложные нули выбираем С1=30 и С2=36.
U |
V |
nu | ||||
-2 |
-1 |
0 |
1 |
2 | ||
-2 |
4 |
6 |
- |
- |
- |
10 |
-1 |
- |
8 |
10 |
- |
- |
18 |
0 |
- |
- |
32 |
3 |
9 |
44 |
1 |
- |
- |
4 |
12 |
6 |
22 |
2 |
- |
- |
- |
1 |
5 |
6 |
nv |
4 |
14 |
46 |
16 |
20 |
n=100 |
Находим , :
;
.
Найдём вспомогательные величины , :
Вычисляем ,.
.
.
По формуле (6.5) находим выборочный коэффициент корреляции:
.
Значение rв далее может быть использовано для определения интервальной оценки коэффициента корреляции r. Например, интервальная оценка r нормально распределённой ГС при имеет вид
. (6.6)
Известно, что если величины X и Y некоррелированы, то r=0 (Тема 4). Допустим, что . Т. к.rв является оценкой, r то нельзя достоверно заключить, что r генеральной совокупности также отличен от 0.
Поэтому возникает необходимость проверки статистической гипотезы при конкурирующей гипотезе.
В качестве критерия для проверки основной гипотезы, если ГС (X, Y) распределена нормально, прнимают СВ
, (6.7)
которая при справедливости H0 имеет распределение Стьюдента с числом степеней свободы, равным n-2.
Критическое значение критерия определяем по таблице критических точек распределения Стьюдента по заданному уровню значимости и числу степеней свободы. Наблюдаемое значение критерия определяем по формуле (6.7).
Если – нет оснований отвернутьH0, что означает: rв незначим, СВ X и Y не коррелированы.
Если –H0 отвергают: rв значим, СВ X и Y коррелированы.