- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
Применение многих методов статистической обработки данных предполагает, что результаты наблюдений являются выборкой из генеральной совокупности с вполне определенным законом распределения, например нормальным.
Чтобы оценить, насколько выбранный теоретически закон распределения согласуется с результатами наблюдений, используют так называемые критерии согласия.
В критерии Колмогорова в качестве статистики, определяющей меру расхождения между теоретическим и эмпирическим распределениями принимается наибольшее значение абсолютной величины разности между эмпирической Fn(x) и теоретической F0(x) функциями распределения
Р аспределение случайной величины Dn не зависит от F0(x) и для ее вычисления может использоваться формула:
К ритерий согласия ω2 (омега-квадрат):
Данный критерий основан на статистике:
Для вычисления ω2 по выборке можно использовать формулу
Проверка статистических гипотез. Основные понятия
Статистическая гипотеза – это утверждение относительно значений одного или нескольких параметров распределения или о самом виде распределения
Гипотеза, которая проверяется, называется нулевой гипотезой и обозначается H0. Как правило за нулевую гипотезу принимают: исследуемые факторы не оказывают никакого влияния на рассматриваемый параметр; между сравниваемыми группами нет различий
Альтернативной гипотезой H1 называется гипотеза, конкурирующая с нулевой, то есть противоречащая ей. Альтернативная гипотеза определяется формулировкой задачи
Для того чтобы иметь основания принять или отвергнуть рассматриваемую гипотезу необходимо выработать некоторый критерий, который называют критерием согласия проверяемой гипотезы с результатами эксперимента.
Выбор критерия согласия ─ это задание критического значения отклонения Daкр, выбранного так, чтобы вероятность (α) превышения этого значения была малой.
Величину α, называют уровнем статистической значимости.
Проверка гипотезы о равенстве дисперсий двух нормальных выборок
Проверяемая гипотеза имеет вид H0: (σ1)2 = (σ2)2 = σ2
Альтернативная гипотеза H1: (σ1)2 ≠ (σ2)2
Т ребуется проверить гипотезу при уровне значимости α
Проверка гипотезы осуществляется с использованием статистики:
которая при справедливости нулевой гипотезы имеет распределение Фишера со степенями свободы
l1 = n1 − 1 и l2 = n2 – 1.
Если наблюдаемое значение статистики F лежит между критическими значениями fl1, l2,1-α/2 и fl1, l2,α/2, то нулевая гипотеза не отвергается.
Проверка гипотезы о равенстве двух средних независимых нормальных выборок
Предположим, что для сравнения двух методов обработки эксперимент был спланирован следующим образом. Отобранные для исследования однородные объекты были разделены на две группы. После применения к объектам каждой группы соответствующей обработки были зарегистрированы числовые значения некоторой характеристики объектов. Возникшие при этом две группы чисел образуют две независимые выборки.
Рассмотрим задачу сравнения математических ожиданий двух независимых нормальных совокупностей по имеющимся выборкам из них объемами n1 и n2.
Пусть по результатам обработки выборок получены значения оценок математических ожиданий выборочных средних) x ̄1 и x ̄2. Необходимо проверить, можно ли объяснить это различие только случайностью, связанной с конечным объемом выборки, или же оно связано с тем, что генеральные совокупности имеют различные математические ожидания. Таким образом, проверяемая гипотеза имеет
вид H0 : m1=m2=m. Выбор критерия проверки зависит от того, значимо или незначимо отличаются между собой дисперсии генеральных совокупностей. Это можно сделать с помощью рассмотренного выше
F-критерия.
Если различие между выборочными дисперсиями и оказалось незначимым, т. е. генеральные дисперсии , то путем использования результатов обеих выборок можно получить более точную оценку генеральной дисперсии .
Такую оценку называют объединенной оценкой дисперсии, и она строится следующим образом:
Если гипотеза H0 : m1= m2 справедлива, то случайная величина x ̄1 − x ̄2 подчиняется нормальному закону с нулевым математическим ожиданием и дисперсией
)
оценкой которой будет выборочная дисперсия
Статистикой критерия для проверки гипотезы H0 служит случайная величина
которая имеет распределение Стьюдента с числом степеней свободы l=n1+n2−2.
Если альтернативная гипотеза имеет вид H1 : m1 ≠ m2, то нулевая гипотеза отвергается на уровне значимости α при условии, что вычисленное значение статистики T
где – процентная точка распределения Стьюдента.
Разность между математическими ожиданиями считается незначимой, если
При альтернативной гипотезе H1 : m1> m2 гипотеза H0 отвергается, если
а при гипотезе H1 : m1<m2, если
Если различие между выборочными дисперсиями s12 и s22 оказалось значимым, т. е. выборки были извлечены из генеральных совокупностей с различными дисперсиями, то для сравнения двух выборочных средних используют статистику:
Р аспределение данной случайной величины близко к распределению Стьюдента с числом степеней свободы: