- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
Выражение для статистики Стьюдента можно видоизменить так, чтобы распределение t было всегда симметрично относительно нуля:
Т о есть
Из распределения Стьюдента можно найти такое значение величины tα/2 при котором 100α процентов всех возможных значений t будут расположены левее –tα/2 или правее + tα/2, а остальные 100(1 – α) процентов значений t попадут в интервал от –tα/2 до +tα/2:
преобразуем, полученное неравенство к виду
Таким образом, разность истинных средних отличается от разности выборочных средних менее чем на произведение tα и стандартной ошибки разности выборочных средних. Это неравенство задает доверительный интервал для разности средних µ1 – µ2.
Проверка статистических гипотез с помощью доверительных интервалов
Доверительные интервалы можно использовать для оценки статистической значимости различий.
Если 100(1 – α)-процентный доверительный интервал разности средних не содержит нуля, то различия статистически значимы; напротив, если этот интервал содержит ноль, то различия статистически не значимы.
Оценка эффектов уровней фактора
Следующим шагом дисперсионного анализа является выяснение того, в какой мере параметры μj отличаются друг от друга, т. е. какие именно из средних μj не равны.
Для проверки нескольких гипотез о равенстве математических ожиданий используют методы множественного сравнения. Одним из таких методов является метод множественных сравнений Шеффе, который позволяет проверять гипотезы для любых комбинаций средних (математических ожиданий).
Н аиболее часто приходится проводить сравнение так называемых контрастов в средних. Контрастом называется линейная комбинация средних вида
коэффициенты которой удовлетворяют условию:
Примерами контрастов являются
При использовании методов множественного сравнения для проверки гипотез можно столкнуться с противоречием когда две величины, порознь равные третьей, окажутся не равны между собой. Чтобы избежать этого, сравнения необходимо проводить в определенном порядке. А именно, следует сравнить группу с наибольшим средним с группой, имеющей наименьшее среднее, затем с группой с наименьшим средним среди остальных групп и т. д. Когда при сравнении обнаружится, что μj и μt различаются незначимо или не останется группы с меньшим выборочным средним, следует заменить группу с наибольшим средним на группу со вторым по величине средним и начать процедуру сначала.
Двухфакторный дисперсионный анализ с пересечением уровней
Пусть на исследуемую величину могут оказывать влияние два фактора A и B, каждый из которых имеет конечное число уровней. При этом ставится вопрос, как влияют и влияют ли вообще эти факторы на исследуемую величину. Здесь уже необходимо уделить внимание способу взаимосвязи факторов. Для большинства практических задач достаточно ограничиться двумя способами: пересечением и группировкой.
Два фактора A и B называются пересекающимися, если в плане эксперимента предусмотрены все возможные сочетания факторов.
Фактор B группируется фактором A, если каждый уровень фактора B сочетается не более, чем с одним уровнем фактора A.
Пусть xijt обозначает значение наблюдения полученное при t-м повторении эксперимента в ячейке ij, i = 1,..., k; j = 1, ...n; t = 1, ...m. Модель дисперсионного анализа представим в виде:
здесь μ – генеральное среднее, αi – дифференциальный эффект фактора A, βj – дифференциальный эффект фактора B. Величина (αβ)ij – называется взаимодействием i-го уровня фактора A и j-го уровня фактора B.
Проверяемыми гипотезами являются:
Как и в однофакторном дисперсионном анализе проверка этих гипотез основывается на сравнении двух независимых оценок дисперсии σ2. При этом одна из оценок действует в независимости от того, верна ли гипотеза H0, а вторая – только в случае справедливости этой гипотезы.
Р ассматривая совокупность данных как одну выборку из генеральной совокупности, получим оценку генерального среднего в виде:
и несмещенную оценку дисперсии генеральной совокупности:
Входящую в оценку дисперсии генеральной совокупности сумму квадратов можно представить в виде суммы четырех отдельных сумм квадратов СКA, СКB, СКAB, СК0:
Х арактеризует разброс наблюдаемых значений между столбцами (уровнями фактора A) таблицы данных:
X арактеризует разброс наблюдаемых значений между строками (уровнями фактора B) таблицы:
Xарактеризует эффект взаимодействия факторов:
Oстаточная сумма квадратов
Г ипотеза H0 : α1 = α2 = ... = αk = 0 проверяется с помощью отношения
Гипотеза H0 : β1 = β2 = ... = βn = 0 проверяется с помощью отношения
Г ипотеза об отсутствии взаимодействия между факторами (гипотеза об аддитивности) проверяется с помощью отношения:
Результаты дисперсионного анализа представляют следующей таблицей
Двухфакторный дисперсионный анализ с группировкой уровней
Пусть на исследуемую величину могут оказывать влияние два фактора A и B, каждый из которых имеет конечное число уровней. При этом ставится вопрос, как влияют и влияют ли вообще эти факторы на исследуемую величину. Здесь уже необходимо уделить внимание способу взаимосвязи факторов. Для большинства практических задач достаточно ограничиться двумя способами: пересечением и группировкой.
Два фактора A и B называются пересекающимися, если в плане эксперимента предусмотрены все возможные сочетания факторов.
Фактор B группируется фактором A, если каждый уровень фактора B сочетается не более, чем с одним уровнем фактора A.
Ф актор B с n уровнями был назван сгруппированным фактором A с k уровнями, если каждый уровень фактора B сочетается не более, чем с одним уровнем фактора A. Двухфакторный анализ с группировкой с описывается моделью:
Здесь µ – генеральное среднее, αi – дифференциальный эффект, определяемый i-м уровнем фактора A, величины bj(i) независимы и распределены по нормальному закону с нулевым средним и дисперсией σ2b(a), εijt – остаточные случайные величины
Результаты дисперсионного анализа оформляются в виде следующей таблицы
Статистики для проверки гипотез имеют вид:
для гипотезы H0: все αi = 0;
для гипотезы H0: σb(a) = 0;