- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
Часто требуется сравнить линии регрессии, рассчитанные по двум выборкам. Это можно сделать тремя способами:
Сравнить коэффициенты наклона b
Сравнить коэффициенты сдвига a
Сравнить линии в целом
Е сли нужно проверить, значимо ли различие в наклоне двух прямых регрессии, критерий Стьюдента t вычисляется по формуле:
где b1–b2 — разность коэффициентов наклона, a sb1–b2 — ее стандартная ошибка.
Затем вычисленное значение t сравнивают, с критическим значением, имеющим n1+n2–4 степени свободы.
Если обе регрессии оценены по одинаковому числу наблюдений, то стандартная ошибка разности
Если же объемы выборок различны, следует воспользоваться объединенной оценкой остаточной дисперсии
Тогда стандартная ошибка разности
А налогично сравниваются и коэффициенты сдвига a1 и а2. В этом случае
где a1–a2 — разность коэффициентов сдвига, a sa1–a2 — стандартная ошибка разности коэффициентов сдвига
Затем вычисленное значение t сравнивают, с критическим значением, имеющим n1+n2–4 степени свободы.
Сравнить две линии регрессии — значит оценить вероятность нулевой гипотезы о совпадении линий.
Коэффициенты регрессии вычисляются так, чтобы разброс точек вокруг линии регрессии был минимален. Разброс этот характеризуется остаточной дисперсией s02: чем меньше остаточная дисперсия, тем лучше прямая регрессии соответствует имеющимся точкам. Следовательно объединив обе выборки в одну и построим для нее линию регрессии получим: в случае если линии регрессии для двух выборок близки, остаточная дисперсия при этом существенно не изменится. И наоборот, если они различаются, то совпадение точек и линии ухудшится и остаточная дисперсия возрастет.
Таким образом порядок сравнения двух линии регрессии:
Построить прямую регрессии для каждой из выборок.
По остаточным дисперсиям и каждой из регрессий вычислить объединенную оценку остаточной дисперсии
Объединить обе выборки. Построить прямую регрессии для получившейся выборки и вычислить остаточную дисперсию
Вычислить «выигрыш» от использования двух раздельных регрессий. Мерой выигрыша служит величина:
П о и вычислить критерий F:
Сравнить вычисленное значение с критическим значением F для числа степеней свободы 2 и n1+n2–4. Если полученное значение больше критического, то гипотеза о совпадении линий регрессии должна быть отклонена.
Сравнение двух линий регрессии в целом
Линия регрессии, проходящая через начало координат или другую фиксированную точку
П редположим, что еще в начале исследования известно, что прямая регрессии должна пройти через начало координат, т. е. модель регрессии имеет вид
В этом случае на основе n имеющихся наблюдений получается следующая оценка единственного параметра b (обозначим ее через B):
Н есмещенной оценкой для σ2 будет
Выражения для (1 − α) доверительного интервала для значения параметра b имеет вид:
Вычисления по проверки значимости регрессии с помощью дисперсионного анализа проводят следующим образом
Е сли ошибки εi распределены по нормальному закону, то при справедливости гипотезы Н0: b = 0 статистика
распределена по закону Фишера с числом степеней свободы 1 и n−2.
Нулевая гипотеза будет отклонена на уровне значимости α, если вычисленное значение статистики F будет больше α-процентной точки f1;n−2;α распределения Фишера.
И ногда априори известно, что прямая регрессии должна пройти через заданную точку на плоскости (x0, y0 ). Наиболее простой способ построения прямой в этом случае заключается в том, чтобы из каждого значения x вычесть x0, а из каждого y вычесть y0 и проделать выше описанную процедуру для линии регрессии проходящей через начало координат.
Подогнанная прямая имеет следующий вид: