- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Дисперсионный анализ. Цель и задачи дисперсионного анализа.
Наиболее часто приходится решать задачи, связанные со сравнением более двух средних. В их основе лежит дисперсионный анализ, разработанный Фишером.
Общая задача дисперсионного анализа включает несколько факторов, каждый из которых имеет не менее двух уровней.
В основе каждой задачи лежит план эксперимента, т. е. правило соотнесения каждого наблюдения исследуемой величины с определенной комбинацией рассматриваемых факторов, и модель дисперсионного анализа, т. е. математическое соотношение, представляющее наблюдение в виде суммы математического ожидания и ошибки: наблюдаемое значение = Sпараметры, описывающие определяемые эффекты +
Sслучайные величины, описывающие неопределенные эффекты.
Дисперсионный анализ основан на следующих допущениях относительно случайных величин, описывающих неопределенные (остаточные) эффекты:
Математическое ожидание каждой остаточной случайной величины равно нулю
Остаточные случайные величины независимы
Все остаточные случайные величины имеют одинаковую дисперсию
Каждая остаточная случайная величина распределена по нормальному закону
Однофакторный дисперсионный анализ
Рассмотрим простейший случай дисперсионного анализа, когда изучается влияние на исследуемую величину какого-либо одного фактора A. Будем считать, что фактор A изучается на k уровнях A1, A2, ..., Ak. Пусть для простоты рассмотрения на каждом уровне производится одинаковое число n наблюдений исследуемой величины.
Результаты наблюденных значений можно представить в виде таблицы:
Задачей дисперсионного анализа является выяснение вопроса о существенности влияния фактора A на величину X, т. е. вопроса о том, значимо ли отличаются между собой выборочные средние для каждой группы данных.
Для этого необходимо проверить нулевую гипотезу H0: μ1 = μ2 = ... = μk против альтернативной гипотезы
H1 : не все μj равны.
Чем больше разброс средних и чем меньше разброс значений внутри групп, тем меньше вероятность
того, что наши группы ─ это случайные выборки из одной совокупности.
Сформулируем это суждение количественно.
Совокупность данных по столбцам таблицы (уровням фактора или группам) при справедливости нулевой гипотезы можно рассматривать как одну выборку объема n х k из генеральной совокупности с математическим ожиданием μ и дисперсией σ2
Оценка генерального среднего:
Н есмещенная оценка дисперсии генеральной совокупности:
Кроме того, дисперсию совокупности можно оценить во-первых на основании групповых дисперсий. Такая оценка не будет зависеть от различий групповых средних. Во-вторых, разброс выборочных средних тоже позволяет оценить дисперсию совокупности. Понятно, что такая оценка дисперсии зависит от различий выборочных средних.
При справедливости нулевой гипотезы любая из выборочных дисперсий дает одинаково хорошую оценку. Поэтому в качестве оценки дисперсии генеральной совокупности возьмем среднее выборочных дисперсий. Эта оценка называется внутри групповой дисперсией:
О ценим теперь дисперсию совокупности по выборочным средним. Поскольку мы предположили, что все выборки извлечены из одной совокупности, то стандартное отклонение выборочных средних будет служить оценкой ошибки среднего:
Отсюда находим межгрупповую оценку дисперсии:
При справедливости нулевой гипотезы оценки s2, sA2 , s02 являются несмещенными оценками генеральной дисперсии σ2. Посмотрим, как ведут себя оценки s2, sA2, s02 при нарушении нулевой гипотезы. Найдем математические ожидания каждой дисперсии для такого случая.
О тклонение от нулевой гипотезы означает, что математическое ожидание в j-й группе может быть представлено в виде:
μ – генеральное среднее (математическое ожидание); αj – дифференциальный эффект для уровня j
Тогда модель дисперсионного анализа будет иметь вид:
О тсюда следует, что:
П ри справедливости допущений:
для всех i и j
с лучайные величины εij взаимно независимы
для всех i и j
М атематическое ожидание межгрупповой дисперсии sA:
а математическое ожидание внутригрупповой дисперсии s0:
Таким образом, при несправедливости нулевой гипотезы оценка sA2 является смещенной, при этом смещение определяется суммой квадратов дифференциальных эффектов групп (уровней фактора). Это означает, что при нарушении нулевой гипотезы оценка sA2 будет иметь тенденцию к возрастанию и тем большую, чем больше отклонение от этой гипотезы.
В результате задача проверки гипотезы H0 сводится к проверке гипотезы о равенстве дисперсий sA2 и s02. При справедливости допущения о нормальном распределении случайных величин εij отношение:
в случае справедливости нулевой гипотезы подчиняется F-распределению с l1 = k-1 и l2 = k(n-1) числом степеней свободы.
Влияние фактора A на исследуемый признак считается значимым с уровнем значимости α, если
т. е. когда расчетное значение статистики F превышает значение α-процентной точки распределения Фишера.
Если это условие не выполняется, то влияние фактора A на исследуемую величину считается незначимым, т.е. математические ожидания μ1, ...,μk имеют общее генеральное среднее (математическое ожидание) μ,. С другой стороны, если гипотеза H0 отвергается, то делается вывод о том, что некоторые или все μj не совпадают.
Обобщим дисперсионный анализ на случай неравной численности групп.
Полная сумма квадратов отклонений значений xij от оценки генерального среднего будет определяться выражением:
П оскольку сумма квадратов между группами СКA имеет k − 1 степеней свободы, а сумма квадратов внутри групп СК0 имеет ∑nj − k степеней свободы, то оценки межгрупповой (факториальной) и внутригрупповой (остаточной) дисперсий имеют соответственно вид:
Результаты дисперсионного анализа в общем случае обычно представляют в виде следующей таблицы