- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Оценка степени тесноты связи при нелинейной зависимости
При отклонении исследуемой зависимости от линейной, коэффициент корреляции r теряет свой смысл как характеристика тесноты связи. В этих случаях необходимо попытаться построить по имеющимся выборочным данным оценку корреляционного отношения.
П редположим, что характер выборки (количество элементов, плотность расположения на плоскости) допускает группировку по переменной X, т. е. данные могут быть представлены в виде
Тогда оценкой среднего значения Y внутри каждого интервала будет
а оценкой общего среднего
З а значение точечной оценки величины D[ϕ(X)], обусловливающей вклад в общую дисперсию D[Y] случайной величины Y от функциональной зависимости, принимают
Точечной оценкой общей (полной) дисперсии D[Y], характеризующей разброс результатов наблюдений yij относительно общего среднего будет
Тогда получим следующее выражение для точечной оценки квадрата корреляционного отношения ρ2yx зависимой переменной Y по независимой переменной X:
Аналогично можно ввести точечную оценку ρ2xy
В предположении, что при условии X = x случайная величина Y имеет нормальный закон распределения с постоянной дисперсией для любого x, для проверки гипотезы H0: ρ2yx = 0 (отсутствие связи Y с X) используется статистика
которая при справедливости гипотезы имеет распределения Фишера с m−1 и n−m степенями свободы. Поэтому, если вычисленное значение статистики F окажется больше fm−1;n−m;α (α - процентной точки), то нулевую гипотезу следует отвергнуть с уровнем значимости α, т. е. признать, что связь существует.
Для истинного значения квадрата корреляционного отношения ρ2yx можно построить приближенный доверительный интервал с доверительной вероятностью β=1-α:
г де l1 и l2 – числа степеней свободы:
Анализ частных связей. Анализ множественных связей
Анализ частных связей
При анализе корреляционных связей могут возникнуть трудности в интерпретации полученных результатов. Полученная сильная корреляционная связь входит в противоречие со здравым смыслом. Подобная ситуация возникает при опосредованном влиянии на оба изучаемых показателя третьего неизвестного фактора и даже целого множества неучтенных факторов.
Поэтому необходимо введение таких измерителей статистической связи, которые были бы очищены от влияния других переменных, т. е. давали бы оценку степени тесноты связи при условии, что остальные переменные зафиксированы на некотором постоянном уровне. В этом случае говорят об анализе частных связей и используют частные коэффициенты корреляции.
Р ассмотрим статистические связи между совокупностью р+1 случайных величин X0, X1, ..., Xp где переменные X1, ..., Xp являются входными, а переменная X0 = Y –выходной. Предположим, что случайный вектор (X0, X1, ..., Xp) имеет нормальный закон распределения. Тогда корреляционная матрица будет иметь вид:
где rij – коэффициенты корреляции между случайными величинами xi и xj; i, j = 0, 1...., p.
Ч астный коэффициент корреляции – мера линейной вероятностной зависимости между двумя случайными величинами из некоторой совокупности случайных величин X0, X1, ..., Xp, когда исключено влияние остальных, т. е. (для пары Xi и Xj)
где Aij – алгебраическое дополнение к элементу rij корреляционной матрицы, а J(i, j) = 0, 1...., p за исключением индексов i и j.
Например, для трех случайных величин X0, X1, X2 получим корреляционную матрицу вида
и частный коэффициент корреляции между входной переменной X0 и выходной X1 при фиксированном значении переменной X2
и частный коэффициент корреляции между входной переменной X0 и выходной X2 при фиксированном значении переменной X1
Значения точечных оценок частных коэффициентов корреляции получают подстановкой в выражения их выборочных значений.
Выборочный частный коэффициент корреляции распределен так же, как и выборочный обычный (парный) коэффициент корреляции, поэтому для проверки гипотез и построения доверительного интервала используются те же самые соотношения, которые были получены ранее с единственной заменой n на n−k, где k – порядок частного коэффициента корреляции (число “мешающих” переменных).