- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Оценка показателей тесноты связи по выборочным данным
П усть в результате эксперимента получены n выборочных значений случайной величины (X,Y), которые будем обозначать в виде
При изучении корреляционной зависимости двух случайных величин по выборке общую картину их взаимной изменчивости можно получить, изобразив на координатной плоскости все точки. Это изображение называют корреляционным полем.
Уже по виду корреляционного поля можно иногда сделать вывод о наличии и характере связи между случайными величинами X и Y
В случае, когда среди xi есть повторяющиеся с частотой ni значения Y, выборочные значения представляют в виде
Е сли выборочные значения сгруппированы по каждой из переменных, т. е. значения X разделены на m групп, а значения Y – на k групп, то выборочные значения представляют в виде
или в виде корреляционной таблицы, в каждой клетке которой указывают число nij попавших в нее выборочных значений:
Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
Оценка показателей тесноты связи по выборочным данным
П усть в результате эксперимента получены n выборочных значений случайной величины (X,Y), которые будем обозначать в виде
При изучении корреляционной зависимости двух случайных величин по выборке общую картину их взаимной изменчивости можно получить, изобразив на координатной плоскости все точки. Это изображение называют корреляционным полем.
Уже по виду корреляционного поля можно иногда сделать вывод о наличии и характере связи между случайными величинами X и Y
В случае, когда среди xi есть повторяющиеся с частотой ni значения Y, выборочные значения представляют в виде
Е сли выборочные значения сгруппированы по каждой из переменных, т. е. значения X разделены на m групп, а значения Y – на k групп, то выборочные значения представляют в виде
или в виде корреляционной таблицы, в каждой клетке которой указывают число nij попавших в нее выборочных значений:
Анализ коэффициента корреляции
Максимально правдоподобная оценка коэффициента корреляции, получаемая на основе n пар нормально распределенных случайных величин (xi, yi), i = 1,…n, имеет вид
г де
Если экспериментальные данные сгруппированы по одной или обеим переменным, то расчетная формула изменяется соответствующим образом. Например, если данные сгруппированы по значениям X, т. е. среди xi есть повторяющиеся значения Y, то
Где
При достаточно большом объеме выборки (n ≥ 50) и небольших значениях коэффициента корреляции (r2 << 1) оценка коэффициента корреляции близка к нормальному распределению с математическим ожиданием равным истинному значению r. Тогда для доверительной вероятности β = 1−α получим следующее выражение для доверительного интервала:
где z1−α/2 – квантиль порядка 1−α/2 стандартного нормального распределения.
Д ля выборок небольших объемов (n< 50) и значениях |r| близких к единице распределение оценки коэффициента корреляции существенно отличается от нормального. В этом случае Фишер предложил использовать следующее преобразование над оценкой коэффициента корреляции, приводящей к новой случайной величине v:
Случайная величина v уже при небольших n (n ≥ 20) приблизительно распределена по нормальному закону с параметрами:
Т огда статистика
распределена по нормальному закону с нулевым математическим ожиданием и единичной дисперсией, а доверительный интервал для M[v] будет иметь вид
П рименив обратное преобразование Фишера
можно получить доверительный интервал для коэффициента корреляции.
З адача проверки некоррелированности (а значит и независимости) совместно нормальных случайных величин сводится к проверке гипотезы H0: r = 0. Статистикой критерия проверки такой гипотезы является случайная величина
которая при справедливости нулевой гипотезы распределена по закону Стьюдента с n−2 степенями свободы. При альтернативной гипотезе H1: r ≠ 0 нулевая гипотеза отвергается с уровнем значимости α, если