- •Томашевский а.В., Рысиков в.П. Учебное пособие компьютерные технологии статистической обработки данных
- •Введение
- •1.Краткая характеристика основных пакетов статистической обработки
- •1.1. Общие представления
- •1.2. Ввод данных в пакете statistica
- •1.3.Контрольные вопросы и задания
- •1.3.1.Вопросы
- •1.3.2. Задания
- •2. Начальная статистическая обработка данных
- •2.1. Понятие о генеральной совокупности и выборке
- •2.2. Случайные величины и их характеристики
- •2.3. Распределения случайных величин
- •2.4. Компьютерные технологии начальной статистической обработки
- •2.5. Контрольные вопросы и задания
- •2.5.1.Вопросы
- •2.5.2. Задание
- •3. Проверка статистических гипотез
- •3.1. Основные положения
- •3.2. Проверка гипотезы о законе распределения
- •3.3. Проверка гипотез о равенстве дисперсий и математических ожиданий
- •3.4. Компьютерные технологии проверки статистических гипотез
- •3.5. Контрольные вопросы и задания
- •3.5.1.Вопросы
- •3.5.2. Задания
- •4. Корреляционный анализ
- •4.1. Основные положения
- •4.2. Корреляционное поле
- •4.3. Выборочный коэффициент корреляции.
- •4.4. Корреляционное отношение
- •4.5. Частные коэффициенты корреляции.
- •4.6. Ранговая корреляция.
- •4.7. Компьютерные технологии корреляционного анализа
- •4.8. Контрольные вопросы и задания
- •4.8.1.Вопросы
- •4.8.2. Задания
- •5. Регрессионный анализ
- •5.1. Основные положения
- •5.2. Компьютерные технологии регрессионного анализа
- •5.3. Контрольные вопросы и задания
- •5.3.1.Вопросы
- •5.3.2. Задания
- •6. Дисперсионный анализ
- •6.1. Основные положения
- •6.2. Однофакторный дисперсионный анализ
- •6.3 Двухфакторный дисперсионный анализ
- •6.5. Контрольные вопросы и задания
- •6.5.1.Вопросы
- •5.3.2. Задания
- •7. Планирование эксперимента
- •7.1. Основные положения
- •7.2. Полный факторный эксперимент
- •7.3 Центральное композиционное планирование
- •7.5. Контрольные вопросы и задания
- •7.5.1.Вопросы
- •7.5.2. Задания
- •Приложение статистические таблицы Функция стандартного нормального распределения
- •Критические точки распределения Стьюдента
- •Критические точки распределения 2
- •Рекомендована література
4.4. Корреляционное отношение
Как отмечалось при отклонении парной статистической зависимости от линейной коэффициент корреляции теряет свой смысл как характеристика степени тесноты связи. В этом случае следует воспользоваться таким показателем (измерителем) связи как корреляционное отношение. Корреляционное отношение применимо в тех случаях, когда:
между парой исследуемых переменных (параметров) отмечается нелинейная зависимость;
характер выборочных данных (количество, плотность расположения на диаграмме рассеяния) допускает, во-первых, их группирование по оси входной переменной, во-вторых, возможность подсчета “частных” математических ожиданий внутри каждого интервала группирования.
Приведем последовательность методики вычисления корреляционного отношения. Пусть имеет место выборка из двумерной генеральной совокупности и между Х и Y существует нелинейная зависимость (см. рисунок 4.1.3) и компоненты Х и Y имеют совместно нормальное распределение.
Рис.4.1.3. Нелинейная зависимость между компонентами Х и Y двумерного параметра.
1. Разобьем диаграмму рассеяния по переменной Х на L непересекающихся интервалов группирования, которые могут иметь разную длину.
2. Найдем “частные” математические ожидания отклика Y в каждой из L выделенных групп
(4.1.2),
где
,
и nj
– количество элементов выборки в j-ом
интервале группирования.
3. Найдем
математическое ожидание по группированному
отклику, используя “частные”
(4.1.3).
4. Получим групповую дисперсию выходной переменной Y
(4.1.4),
и дисперсию, полученную по негруппированному отклику
(4.1.5),
5. Корреляционное отношение зависимой переменной Y по независимой переменной Х может быть получено из отношения
(4.1.6).
Свойства
корреляционного отношения. Корреляционное
отношение не обладает свойством
симметрии, т.е. ρxy
≠ ρyx. Кроме
того ρxy неотрицательно,
поскольку предполагается, что оно
является результатом извлечения корня
квадратного из (ρxy)2
Корреляционное отношение 0 ≤ ρxy
≤ 1. Из ρxy =
1 следует, что между Y и X существует
однозначная функциональная зависимость.
Обратное утверждение в общем случае не
верно. Отсутствие корреляционной связи
между Y и X означает, что условные средние
сохраняют
от группы к группе постоянное значение,
равное общему среднему
,
поэтому ρxy = 0.
Необходимо также отметить, что между
ρxy и ρyx
нет какой-либо определенной зависимости.
Некоррелированность Y от X не означает
некоррелированности Х от Y.
4.5. Частные коэффициенты корреляции.
Иногда в практических ситуациях не удается интерпретировать на содержательном уровне выявленную парную связь между исследуемыми компонентами признака. Причину этого часто следует искать в опосредованном влиянии на исследуемые показатели некоторого третьего фактора [1, 8, 9]. Роль опосредованно влияющих факторов могут играть множество неучтенных показателей. Следовательно, необходимо введение показателей статистической связи, которые были бы очищены от такого влияния. В качестве показателя степени тесноты связи между переменными Х и Y при фиксированных значениях других переменных используются частные (“очищенные”) коэффициенты корреляции.
Пусть имеется многомерный нормальный вектор X = {x(1), x(2), ..., x(p)},
где x(i) – компоненты вектора, p – его размерность. Необходимо определить частный коэффициент корреляции rij между x(i) и x(j) компонентами вектора при фиксированном множестве переменных x(i,j), дополняющих пару x(i) и x(j) . При данных условиях
(4.1.6),
где Rij. – алгебраическое дополнение для элемента rij в определителе корреляционной матрицы R анализируемых признаков x(i), т.е. в определителе
(4.1.7).
Выражение (4.1.6) при условии р = 3 будет иметь вид
(4.1.8).
