- •Томашевский а.В., Рысиков в.П. Учебное пособие компьютерные технологии статистической обработки данных
- •Введение
- •1.Краткая характеристика основных пакетов статистической обработки
- •1.1. Общие представления
- •1.2. Ввод данных в пакете statistica
- •1.3.Контрольные вопросы и задания
- •1.3.1.Вопросы
- •1.3.2. Задания
- •2. Начальная статистическая обработка данных
- •2.1. Понятие о генеральной совокупности и выборке
- •2.2. Случайные величины и их характеристики
- •2.3. Распределения случайных величин
- •2.4. Компьютерные технологии начальной статистической обработки
- •2.5. Контрольные вопросы и задания
- •2.5.1.Вопросы
- •2.5.2. Задание
- •3. Проверка статистических гипотез
- •3.1. Основные положения
- •3.2. Проверка гипотезы о законе распределения
- •3.3. Проверка гипотез о равенстве дисперсий и математических ожиданий
- •3.4. Компьютерные технологии проверки статистических гипотез
- •3.5. Контрольные вопросы и задания
- •3.5.1.Вопросы
- •3.5.2. Задания
- •4. Корреляционный анализ
- •4.1. Основные положения
- •4.2. Корреляционное поле
- •4.3. Выборочный коэффициент корреляции.
- •4.4. Корреляционное отношение
- •4.5. Частные коэффициенты корреляции.
- •4.6. Ранговая корреляция.
- •4.7. Компьютерные технологии корреляционного анализа
- •4.8. Контрольные вопросы и задания
- •4.8.1.Вопросы
- •4.8.2. Задания
- •5. Регрессионный анализ
- •5.1. Основные положения
- •5.2. Компьютерные технологии регрессионного анализа
- •5.3. Контрольные вопросы и задания
- •5.3.1.Вопросы
- •5.3.2. Задания
- •6. Дисперсионный анализ
- •6.1. Основные положения
- •6.2. Однофакторный дисперсионный анализ
- •6.3 Двухфакторный дисперсионный анализ
- •6.5. Контрольные вопросы и задания
- •6.5.1.Вопросы
- •5.3.2. Задания
- •7. Планирование эксперимента
- •7.1. Основные положения
- •7.2. Полный факторный эксперимент
- •7.3 Центральное композиционное планирование
- •7.5. Контрольные вопросы и задания
- •7.5.1.Вопросы
- •7.5.2. Задания
- •Приложение статистические таблицы Функция стандартного нормального распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения 2
- •Рекомендована література
4.3. Выборочный коэффициент корреляции.
Входные и выходные переменные можно рассматривать как компоненты двухмерной случайной величины. Пусть исследуется парная корреляционная зависимость между случайными компонентами X и Y двумерной двухмерной случайной величины и предположим, что в результате эксперимента получена выборка из двумерной нормальной генеральной совокупности. Степень тесноты статистической связи между двумя исследуемыми компонентами может быть измерена с помощью выборочного коэффициента корреляции [8, 9]:
(4.1.1),
где
–
оценка второго смешанного центрального
момента случайной величины (X,Y), называемый
ковариация величин X,Y.
Необходимо отметить, что коэффициент корреляции имеет четкий смысл как характеристика степени тесноты связи только в случае совместного нормального распределения исследуемых случайных величин X и Y.
Свойства коэффициента корреляции. В общем случае коэффициент корреляции может принимать значения |r| ≤ 1. В частности, если |r| = 1 между исследуемыми признаками существует функциональная линейная зависимость. При r = -1 имеет место отрицательная линейная зависимость, при r = 1 – положительная. Если r = 0, то параметры X и Y некоррелированы. Однако это вовсе не означает, что X и Y независимы, если априори допускается отклонение этой зависимости от линейной. Следовательно, некоррелированность не означает независимости исследуемой пары признаков. В то же время независимость всегда означает и некоррелированность X и Y. При r = 0 необходимо дополнительное статистическое исследование степени отклонения распределения рассматриваемых величин от нормального. Коэффициент корреляции обладает свойством симметрии, т.е. rxy = ryx.
Для случая
многомерной случайной величины
где р – размерность статистический
анализ всех парных связей может быть
представлен корреляционной матрицей.
|
x(1) |
x(2) |
. . . |
x(p) |
x(1) |
1 |
|
. . . |
|
x(2) |
|
1 |
. . . |
|
. . . |
. . . |
. . . |
1 |
. . . |
x(p) |
|
|
. . . |
1 |
Коэффициент корреляции как показатель степени тесноты парной статистической связи имеет четкий смысл при линейной связи и совместной нормальной распределенности исследуемых пар параметров многомерного параметра. Парный коэффициент корреляции не учитывает опосредованного или совместного влияния других факторов.
Надежность оценки
степени тесноты корреляционной связи
ослабевает
с уменьшением объема выборки n, поэтому
важно уметь
определять минимальное значение
rxy,
отклонение которого от нуля можно
считать значимым. Это задача проверки
статистической гипотезы о значимости
линейной связи [1,8]. Рассмотрим процедуру
формирования и проверки такой гипотезы.
1-й шаг. Формирование гипотезы об отсутствии статистической связи
H0: rxy = 0,
H1: rxy ≠0.
2-й шаг. Задание уровня значимости α .
3-й шаг. В качестве критической статистики для проверки нулевой гипотезы выберем величину
Распределение статистики Yкр имеет t-распределение Стьюдента с (n - 2) числом степеней свободы.
4-й шаг. Определение расчетного значения критерия Tрасч=Yкр и критической точки tкр(α,n-2) по таблице распределения Стьюдента (приложение таблица ).
5-й шаг. Если выполняется условие |Tрасч|< tкр, то гипотеза Н0 верна с ошибкой первого рода α, в противном случае, Н0 отвергается.
