Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СМ-Сокр.doc
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
1.16 Mб
Скачать

5.3 Вопросы для самоконтроля

  1. В каких случаях используются непараметрические методы факторного анализа?

  2. Какая статистика используется в ранговом однофакторном анализе для проверки однородности некоторых выборок?

  3. Как производится ранжирование данных в ранговом однофакторном анализе?

  4. Какая статистика используется в ранговом двухфакторном анализе?

  5. Как производится ранжирование данных в ранговом двухфакторном анализе?

Тема 6. Корреляционный анализ

В результате изучения данной темы студент должен иметь представление:

  • о задачах корреляционного анализа;

знать:

  • сущность коэффициента корреляции и корреляционного отношения, частных коэффициентов корреляции, ранговых коэффициентов корреляции;

и уметь использовать:

  • методы расчета корреляционных зависимостей.

6.1 Методические рекомендации по изучению данной темы

Сначала ознакомьтесь с основными теоретическими сведениями приведенными выше. Затем тщательно изучите материал, изложенный в главе 7 учебного пособия. Если после изучения учебного пособия вам остались непонятны некоторые вопросы, обратитесь к рекомендуемой литературе. Затем ответьте на вопросы для самоконтроля. Проведите корреляционный анализ для данных представленных в задании 10 контрольной роботы.

6.2 Основные теоретические сведения

Задачи корреляционного анализа

Прежде чем приступить к установлению вида функциональной зависимости между переменными величинами, исследователь должен убедиться в том, что между ними действительно существует взаимосвязь. Эта задача решается путем проведения корреляционного анализа, включающего:

  1. выбор показателя статистической связи между анализируемыми переменными;

  2. оценку значения этого показателя по имеющимся экспериментальным данным;

  3. проверку статистической гипотезы о том, что значение показателя значимо отличается от нуля.

Выбор показателя парной связи

Коэффициент корреляции rxy характеризует вероятностную линейную зависимость между двумя величинами Х и Y:

Формально этот коэффициент можно вычислить для любой системы случайных величин (Х, Y), однако только в случае системы с нормальным распределением он имеет четкий смысл характеристики тесноты связи. Во всех остальных случаях коэффициент корреляции можно использовать лишь в качестве одной из возможных характеристик степени тесноты связи.

При наличии между Х и Y нелинейной зависимости коэффициент корреляции недооценивает степень тесноты связи и даже может быть равен нулю. В таких случаях в качестве показателя тесноты связи можно использовать корреляционное отношение, квадрат которого определяется следующим образом:

где – составляющая общей дисперсии , обусловленная функциональной зависимостью между Х и Y; σ2 – дисперсия, обусловленная влиянием на Y других факторов (в предложении, что она не зависит от значений, принимаемых Х).

Аналогично определяется квадрат корреляционного отношения ρxy2 переменной Х и Y, при этом между ρyx2 и ρxy2 нет какой-либо простой зависимости.

Положительный корень из ρyx2 носит название корреляционного отношения. В общем случае ρyx2 и r2 связаны неравенством

.

Итак, в качестве показателя статистической связи между двумя случайными переменными Х и Y следует выбрать корреляционное отношение, если закон распределения системы (X,Y) вызывает сомнение. Если же можно с большой степенью уверенности считать закон распределения системы (X,Y) нормальным, то следует использовать коэффициент корреляции.

Оценка показателей тесноты связи

Пусть в результате эксперимента получены n выборочных значений случайной величины (X,Y): (xi,yi), i = 1, ..., n. Общую картину взаимной изменчивости можно получить, изобразив все точки на координатной плоскости. Это изображение называют корреляционным полем, по его виду иногда можно сделать предположение о наличии и характере связи между Х и Y. Оценка корреляции имеет вид:

,

где

; .

Если при xi есть повторяющиеся с частотой ni значения Y, т.е. данные имеют вид (xi,yij), j = 1, ..., n; i=1, ..., n, , то

,

где

; .

Оценку квадрату корреляционного отношения можно дать только в случае, когда при xi есть повторяющиеся значения Y. Эта оценка имеет следующий вид:

.

Проверка значимости показателей тесноты связи

Задачи проверки некоррелированности (а значит, и независимости) нормальных случайных величин Х и Y сводится к проверке гипотезы H0: = 0. Статистикой критерия проверки гипотезы служит случайная величина

,

которая при справедливости гипотезы H0 распределена по закону Стьюдента с n-2 степенями свободы. При альтернативной гипотезе H1: 0 нулевая гипотеза отвергается с уровнем значимости α, если значение статистики Т больше /2-процентной точки распределения Стьюдента с n-2 степенями свободы).

В предположении, что при Х = х случайная величина Y имеет нормальный закон распределения для любого х, проверка гипотезы H0: ρyx= 0 (отсутствие связи Y с Х) осуществляется с использованием статистики

,

имеющей распределение Фишера с m-1 и n-m степенями свободы. Если вычисленное значение статистики F окажется больше fm-1;n-m, то нулевую гипотезу следует отвергнуть с уровнем значимости α, т.е. признать существование связи между X и Y.

Частные коэффициенты корреляции

При рассмотрении трех и более случайных величин коэффициенты корреляции любой пары этих случайных величин могут не дать преставления о степени связи между всеми случайными величинами. Это объясняется тем, что на закон распределения исследуемой пары могут оказывать влияние и другие рассматриваемые величины. Это обстоятельство делает необходимым введение статистического показателя связи между парой случайных величин при условии, что значения других случайных величин зафиксированы.

Обозначим выходную случайную величину Y через X0, а остальные случайные величины через X1, X2,..., Xp. Предположим, что случайный вектор (X1, X2,..., Xp) имеет нормальный закон распределения с корреляционной матрицей

где rij – коэффициенты корреляции между случайными величинами Xi, Xj, i, j= 0,1, ..., p.

Мерой линейной вероятностной зависимости между двумя случайными величинами Xi и Xj из некоторой совокупности случайных величин X0, X1, X2,..., Xp, когда исключено влияние остальных, служит частный коэффициент корреляции

,

где – алгебраическое дополнение к элементу корреляционной матрицы; J(i, j) = 0, 1, ..., p за исключением индексов i и j.

Значения точечных оценок частных коэффициентов корреляции получают подстановкой вместо коэффициентов корреляции их выборочных значений .

Выборочный частный коэффициент корреляции распределен так же, как и выборочный парный коэффициент корреляции, поэтому для проверки его значимости используется та же статистика T, но с заменой n на n-k, где k – порядок частного коэффициента корреляции (число “мешающих” переменных).