- •Статистические методы обработки данных в экологии Методические рекомендации по изучению дисциплины
- •Оглавление
- •Рекомендуемая литература Основная литература
- •Дополнительная литература
- •Предисловие
- •Методические рекомендации по изучению дисциплины
- •Тема 1. Сущность и цели обработки данных
- •1.1 Методические рекомендации по изучению данной темы
- •1.2 Основные теоретические сведения
- •1.3 Вопросы для самоконтроля
- •Тема 2. Первичная статистическая обработка данных
- •2.1 Методические рекомендации по изучению данной темы
- •2.2 Основные теоретические сведения
- •2.3 Вопросы для самоконтроля
- •Тема 3. Проверка статистических гипотез относительно двух выборочных совокупностей
- •3.1 Методические рекомендации по изучению данной темы
- •3.2 Основные теоретические сведения
- •3.3 Вопросы для самоконтроля
- •Тема 4. Дисперсионный анализ
- •4.1 Методические рекомендации по изучению данной темы
- •4.2 Основные теоретические сведения
- •4.3 Вопросы для самоконтроля
- •Тема 5. Непараметрические методы факторного анализа
- •5.1 Методические рекомендации по изучению данной темы
- •5.2 Основные теоретические сведения
- •5.3 Вопросы для самоконтроля
- •Тема 6. Корреляционный анализ
- •6.1 Методические рекомендации по изучению данной темы
- •6.2 Основные теоретические сведения
- •6.3 Вопросы для самоконтроля
- •Тема 7. Регрессионный анализ
- •7.1 Методические рекомендации по изучению данной темы
- •7.2 Основные теоретические сведения
- •7.3 Вопросы для самоконтроля
- •Задания для контрольной работы и требования по ее оформлению Требования к оформлению контрольных работ
- •Задания для контрольной работы
5.3 Вопросы для самоконтроля
В каких случаях используются непараметрические методы факторного анализа?
Какая статистика используется в ранговом однофакторном анализе для проверки однородности некоторых выборок?
Как производится ранжирование данных в ранговом однофакторном анализе?
Какая статистика используется в ранговом двухфакторном анализе?
Как производится ранжирование данных в ранговом двухфакторном анализе?
Тема 6. Корреляционный анализ
В результате изучения данной темы студент должен иметь представление:
о задачах корреляционного анализа;
знать:
сущность коэффициента корреляции и корреляционного отношения, частных коэффициентов корреляции, ранговых коэффициентов корреляции;
и уметь использовать:
методы расчета корреляционных зависимостей.
6.1 Методические рекомендации по изучению данной темы
Сначала ознакомьтесь с основными теоретическими сведениями приведенными выше. Затем тщательно изучите материал, изложенный в главе 7 учебного пособия. Если после изучения учебного пособия вам остались непонятны некоторые вопросы, обратитесь к рекомендуемой литературе. Затем ответьте на вопросы для самоконтроля. Проведите корреляционный анализ для данных представленных в задании 10 контрольной роботы.
6.2 Основные теоретические сведения
Задачи корреляционного анализа
Прежде чем приступить к установлению вида функциональной зависимости между переменными величинами, исследователь должен убедиться в том, что между ними действительно существует взаимосвязь. Эта задача решается путем проведения корреляционного анализа, включающего:
выбор показателя статистической связи между анализируемыми переменными;
оценку значения этого показателя по имеющимся экспериментальным данным;
проверку статистической гипотезы о том, что значение показателя значимо отличается от нуля.
Выбор показателя парной связи
Коэффициент корреляции rxy характеризует вероятностную линейную зависимость между двумя величинами Х и Y:
Формально этот коэффициент можно вычислить для любой системы случайных величин (Х, Y), однако только в случае системы с нормальным распределением он имеет четкий смысл характеристики тесноты связи. Во всех остальных случаях коэффициент корреляции можно использовать лишь в качестве одной из возможных характеристик степени тесноты связи.
При наличии между Х и Y нелинейной зависимости коэффициент корреляции недооценивает степень тесноты связи и даже может быть равен нулю. В таких случаях в качестве показателя тесноты связи можно использовать корреляционное отношение, квадрат которого определяется следующим образом:
где
– составляющая общей дисперсии
,
обусловленная функциональной зависимостью
между Х
и Y;
σ2
– дисперсия, обусловленная влиянием
на Y
других факторов (в предложении, что она
не зависит от значений, принимаемых Х).
Аналогично определяется квадрат корреляционного отношения ρxy2 переменной Х и Y, при этом между ρyx2 и ρxy2 нет какой-либо простой зависимости.
Положительный корень из ρyx2 носит название корреляционного отношения. В общем случае ρyx2 и r2 связаны неравенством
.
Итак, в качестве показателя статистической связи между двумя случайными переменными Х и Y следует выбрать корреляционное отношение, если закон распределения системы (X,Y) вызывает сомнение. Если же можно с большой степенью уверенности считать закон распределения системы (X,Y) нормальным, то следует использовать коэффициент корреляции.
Оценка показателей тесноты связи
Пусть в результате эксперимента получены n выборочных значений случайной величины (X,Y): (xi,yi), i = 1, ..., n. Общую картину взаимной изменчивости можно получить, изобразив все точки на координатной плоскости. Это изображение называют корреляционным полем, по его виду иногда можно сделать предположение о наличии и характере связи между Х и Y. Оценка корреляции имеет вид:
,
где
;
.
Если при xi
есть повторяющиеся с частотой ni
значения Y,
т.е. данные имеют вид (xi,yij),
j = 1,
...,
n;
i=1,
..., n,
,
то
,
где
;
.
Оценку квадрату корреляционного отношения можно дать только в случае, когда при xi есть повторяющиеся значения Y. Эта оценка имеет следующий вид:
.
Проверка значимости показателей тесноты связи
Задачи проверки некоррелированности (а значит, и независимости) нормальных случайных величин Х и Y сводится к проверке гипотезы H0: r = 0. Статистикой критерия проверки гипотезы служит случайная величина
,
которая при
справедливости гипотезы H0
распределена по закону Стьюдента с n-2
степенями свободы. При альтернативной
гипотезе H1:r ≠ 0
нулевая гипотеза отвергается с уровнем
значимости α, если значение статистики
Т
больше
(α/2-процентной
точки распределения Стьюдента с n-2
степенями свободы).
В предположении, что при Х = х случайная величина Y имеет нормальный закон распределения для любого х, проверка гипотезы H0: ρyx= 0 (отсутствие связи Y с Х) осуществляется с использованием статистики
,
имеющей распределение Фишера с m-1 и n-m степенями свободы. Если вычисленное значение статистики F окажется больше fm-1;n-m;α, то нулевую гипотезу следует отвергнуть с уровнем значимости α, т.е. признать существование связи между X и Y.
Частные коэффициенты корреляции
При рассмотрении трех и более случайных величин коэффициенты корреляции любой пары этих случайных величин могут не дать преставления о степени связи между всеми случайными величинами. Это объясняется тем, что на закон распределения исследуемой пары могут оказывать влияние и другие рассматриваемые величины. Это обстоятельство делает необходимым введение статистического показателя связи между парой случайных величин при условии, что значения других случайных величин зафиксированы.
Обозначим выходную случайную величину Y через X0, а остальные случайные величины через X1, X2,..., Xp. Предположим, что случайный вектор (X1, X2,..., Xp) имеет нормальный закон распределения с корреляционной матрицей
где rij – коэффициенты корреляции между случайными величинами Xi, Xj, i, j= 0,1, ..., p.
Мерой линейной вероятностной зависимости между двумя случайными величинами Xi и Xj из некоторой совокупности случайных величин X0, X1, X2,..., Xp, когда исключено влияние остальных, служит частный коэффициент корреляции
,
где
–
алгебраическое дополнение к элементу
корреляционной матрицы; J(i,
j)
= 0,
1,
..., p
за исключением индексов i
и j.
Значения точечных
оценок частных коэффициентов корреляции
получают подстановкой вместо коэффициентов
корреляции
их выборочных значений
.
Выборочный частный коэффициент корреляции распределен так же, как и выборочный парный коэффициент корреляции, поэтому для проверки его значимости используется та же статистика T, но с заменой n на n-k, где k – порядок частного коэффициента корреляции (число “мешающих” переменных).
