- •Вопросы к экзамену и зачету по курсу
- •“Статистические методы обработки данных в экологии”
- •Сущность и цели обработки данных
- •Основные понятия математической статистики и теории вероятности
- •Качество данных. Этапы обработки данных. Вычислительные аспекты обработки данных
- •Разновидности исследований. Шкалы измерений
- •Описательная статистика: Закон распределения случайной величины
- •Описательная статистика: Числовые характеристики случайной величины
- •Построение гистограммы распределения
- •Проверка соответствия выбранной модели закона распределения исходным данным. Критерий согласия Колмогорова. Критерий согласия ω2 (омега-квадрат)
- •Проверка статистических гипотез. Основные понятия
- •Проверка гипотезы о равенстве двух средних зависимых нормальных выборок
- •Ранги и ранжирование
- •Непараметрический критерий Вилкоксона для проверки однородности двух независимых выборок.
- •Дисперсионный анализ. Цель и задачи дисперсионного анализа.
- •Sслучайные величины, описывающие неопределенные эффекты.
- •Однофакторный дисперсионный анализ
- •Доверительный интервал для среднего
- •Доверительный интервал для разности средних. Оценка эффекта
- •Оценка эффекта
- •Доверительный интервал для разности средних. Проверка статистических гипотез с помощью доверительных интервалов
- •Проверка статистических гипотез с помощью доверительных интервалов
- •Оценка эффектов уровней фактора
- •Примерами контрастов являются
- •Двухфакторный дисперсионный анализ с пересечением уровней
- •Проверка однородности дисперсий
- •Непараметрические методы факторного анализа. Ранговый однофакторный анализ.
- •Критерий Краскела-Уолллиса.
- •Непараметрические методы факторного анализа. Ранговый двухфакторный анализ без повторений
- •Критерий Фридмана
- •Корреляционный анализ. Постановка задач статистического исследования зависимостей
- •Измерители парной статистической связи. Корреляционное отношение
- •Коэффициент корреляции как измеритель степени тесноты связи
- •Оценка показателей тесноты связи по выборочным данным
- •Оценка показателя тесноты связи по выборочным данным. Анализ коэффициента корреляции
- •Оценка показателей тесноты связи по выборочным данным
- •Анализ коэффициента корреляции
- •Оценка степени тесноты связи при нелинейной зависимости
- •Анализ частных связей. Анализ множественных связей
- •Анализ частных связей
- •Анализ множественных связей
- •Ранговые коэффициенты корреляции
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент ранговой корреляции Кендалла
- •Зависимость между признаками, измеренными в номинальной или порядковой шкалах
- •Регрессионный анализ. Основные понятия регрессионного анализа
- •Метод наименьших квадратов
- •Простая линейная регрессия
- •Решение этих двух уравнений дает:
- •Проверка значимости линии регрессии
- •Проверка адекватности модели регрессии. Метод остатков
- •Доверительные интервалы для параметров простой линейной регрессии
- •Доверительные интервалы для линии регрессии. Доверительный интервал для значений зависимой переменной
- •Доверительный интервал для значений зависимой переменной
- •Проверка гипотез относительно параметров линейной регрессии
- •Сравнение двух линий регрессии путем сравнения параметров регрессионной модели
- •Обратная простая регрессия
- •Множественная линейная регрессия
- •Нелинейная регрессия
- •Оценка результата измерения: Виды измерений
- •Оценка результата измерения: Погрешности измерений
- •Обработка результатов наблюдений, распределенных по закону Пуассона
Доверительный интервал для среднего
Величина
п одчиняется распределению Стьюдента.
Математически запись этого выражения имеет вид
Из распределения Стьюдента можно найти такое значение величины tα/2 при котором 100α процентов всех возможных значений t будут расположены левее –tα/2 или правее + tα/2, а остальные 100(1 – α) процентов значений t попадут в интервал от –tα/2 до +tα/2:
преобразуем, полученное неравенство к виду
Таким образом, истинное среднее отличается от выборочного среднего менее чем на произведение tα/2 и стандартной ошибки выборочного среднего sx. Это неравенство задает доверительный интервал для среднего.
Приводя k-процентный доверительный интервал среднего, мы утверждаем, что вероятность того, что истинное среднее находится в этом интервале, равна k. Иными словами, если получить все возможные выборки из некоторой совокупности и для каждой рассчитать k-процентный доверительный интервал, то доля интервалов, содержащих среднее по совокупности (истинное среднее), составит k.
Доверительный интервал для разности средних. Оценка эффекта
Выражение для статистики Стьюдента можно видоизменить так, чтобы распределение t было всегда симметрично относительно нуля:
Т о есть
Из распределения Стьюдента можно найти такое значение величины tα/2 при котором 100α процентов всех возможных значений t будут расположены левее –tα/2 или правее + tα/2, а остальные 100(1 – α) процентов значений t попадут в интервал от –tα/2 до +tα/2:
п реобразуем, полученное неравенство к виду
Таким образом, разность истинных средних отличается от разности выборочных средних менее чем на произведение tα и стандартной ошибки разности выборочных средних. Это неравенство задает доверительный интервал для разности средних µ1 – µ2.
Оценка эффекта
Доверительный интервал для разности средних можно использовать для оценки величины эффекта.
Например. Средний диурез при приеме плацебо составил µ1 = 1200 мл, а при приеме препарата - µ2 = 1400 мл. Таким образом, препарат увеличивает суточный диурез на µ1 – µ2 = 1400 – 1200 = 200 мл.
Предположим в нашем распоряжении выборки из совокупностей распределенных в соответствии с нормальным законом и необходимо оценить величину эффекта.
Для полученных данных значение статистики Стьюдента t = 2,447. Это больше критического значения t для 18 степеней свободы (2,101) и 5% уровня значимости, поэтому можно заключить, что различия статистически значимы, то есть препарат обладает диуретическим действием.
В контрольной группе средний диурез составил 1180 мл, а в группе, получавшей диуретик, - 1400 мл.
Среднее увеличение диуреза в данном опыте:
Однако как и всякая выборочная оценка, подверженная влиянию случайных факторов, эта величина отличается от истинного увеличения суточного диуреза, равного 200 мл. Поэтому правильнее будет рассчитать доверительный интервал, который покажет диапазон чисел, куда истинное значение величины эффекта попадает с заданной вероятностью.
В ычислим стандартную ошибку разности средних. Стандартные отклонения у принимавших диуретик и плацебо составили соответственно 245 и 144 мл. В обеих группах было по 10 человек. Тогда объединенная оценка дисперсии
А стандартная ошибка разности средних
Для определения 95% доверительного интервала (α=100-95) найдем значение t0,05/2. Объем каждой из выборок n1 = n2 =10. Поэтому число степеней свободы l = 18. Соответствующее значение t0,05/2 равно 2,101. Отсюда доверительный интервал для среднего изменения диуреза:
т о есть
п олучаем