- •Вероятность
- •Формула полной вероятности.
- •Случайная величина. Закон распределения. Биномиальный закон распределения.
- •Числовые характеристики дискретной случайной величины (мат. Ожидание, дисперсия, ср. Квадратичное отклонение).
- •Плотность распределения вероятностей - f(X)
- •Числовые характеристики (м.О., дисперсия, среднее квадратичное отклонение) для непрерывной случайной величины.
- •Нормальное распределение. Задание 2
- •Формула Муавра-Лапласа.
- •Двумерная случайная величина.
- •Корреляция между случайными величинами. Корреляционный момент. Коэффициент корреляции.
- •Статистика
- •Выборка. Вариационный ряд. Таблица частот. Интервальная таблица частот.
- •Точечные оценки мат. Ожидания и дисперсии. Состоятельность и несмещенность оценки (следовательно, исправленная дисперсия). Оценка вероятности события.
- •Распределение Стьюдента и Хи-квадрат распределение.
- •Статистические гипотезы. Проверка статистических гипотез. Односторонние и двусторонние критерии. Построение критериев (использование квантилей, уровней значимости).
- •Дисперсионный анализ. Постановка вопроса. Метод решения (параметрический и непараметрический случаи). – Задание 4.
- •Корреляционный анализ. Точечная оценка коэффициента корреляции. Проверка гипотезы о корреляционной зависимости. – Задание 6.
- •Регрессионный анализ. Построение линии регрессии (вывод уравнения прямой регрессии из полученных опытных данных). – Задание 7.
- •Дисперсионный анализ нескольких выборок. Задание 5.
- •Задание 8. Постановка вопроса.
- •Задание 9. Постановка вопроса
Дисперсионный анализ. Постановка вопроса. Метод решения (параметрический и непараметрический случаи). – Задание 4.
Дисперсией числового ряда называют среднее арифметическое квадратов отклонений от среднего арифметического.
В статистических методах анализа данных, которые называются дисперсионным анализом, сравниваются две группы наблюдений: Контрольная (х) и Рабочая (у, получена после обработки). С помощью сравнения мы хотим выяснить, есть ли эффект обработки, который приводит к положительному (отрицательному) сдвигу х<<у (х>>у) , называемому альтернативной гипотезой Н1. Гипотеза об отсутствии эффекта обработки х≡у называется основной гипотезой Н0. Под обработкой испытуемых можно понимать, например, воздействие на них с помощью различных способов обучения, лечения, рекламы и тд.
Параметрический дисперсионный анализ для 2х независимых выборок. Критерий Стьюдента.
Матем модель: Рассм нормальн выборку x= (x1, x2, …, xn) объема n с теоретическим распределением N (a, σ) и независимую от x нормальную выборку y= (y1, y2, …, ym) объема m с теоретическим распределением N (b, σ):
Где - совокупность из n + m ненаблюдаемых независимых стандартных нормальных случайных величин. Неизвестные среднеквадратичные отклонения обеих выборок предполагаются одинаковыми и равными σ , а теоретические распределения выборок могут отличаться, т.е. не быть однородными, лишь за счет различия неизвестных математических ожиданий a и b. Параметр Θ = b-a называется теоретическим сдвигом выборки у относительно выборки х.
Постановка задачи:
1) Проверить гипотезу однородности Н0
( a=b
или Θ=0 – нет эффекта от обработки) против
альтернативы положительного
(отрицательного) сдвига Н1
( гипотеза о
наличии эффекта, a<b
Θ>0 (a>b
Θ<0)
2)Если принято решение в пользу
Н1 ,
то строится доверительный интервал для
сдвига Θ = b-a,
т.е. для коэффициента доверия 1-a
требуется указать числа
,
для которых
Точечные характеристики параметров Θ и σ:
При описании схемы решения задач 1) и 2) используются след величины (статистики), вычисляемые на основе n наблюдений выборки х и m наблюдений у.
Θ – точечная оценка теоретического сдвига Θ = b-a и называется выборочным сдвигом. σ – точечная оценка теоретического среднеквадратичного отклонения σ.
Степень свободы: N = n + m – 2
Решение задачи
1): Пусть
конкурентом гипотезы однородности Н0
: Θ = 0 выступает альтернатива Н1
: Θ > 0 ( H1
: Θ < 0)
положительного ( отрицательного ) сдвига.
Введем статистику (функцию
наблюдений).
Статистика Стьюдента:
Применим
Критерий Стьюдента:
tα+, tα- - верхняя и нижняя односторонние квантили распределения Стьюдента.
Свойство: Если верна гипотеза гипотезы однородности Н0 , то для решающего правила критерия Стьюдента вероятность напрасного отклонения Н0 (принятия Н1) не превышает α. Другими словами, мы будем говорить, что альтернатива Н1 принимается (гипотеза Н0 отвергается) на уровне значимости ≤ α
Решение задачи
2): Доверительный
интервал -
, где
(границы
дов интервала)
єα
– у нас на семинаре мы писали ρα
Далее мы строили таблицу и писали вывод:
Непараметрический дисперсионный анализ для 2х независимых выборок. Критерий Манна-Уитни.
Матем модель: x=( x1, x2, …, xn) – наблюдения «до» y=(y1, y2, …, yn) – наблюдения «после» Uxy , Uyx – Статистики Манна-Уитни
Распределение Манна-Уитни: Количество пар, для которых xi < yi Uxy (xi < yi) , Uxy = ΣiΣj ϕ(xi ; yi) Uyx (xi < yi) , Uyx = ΣiΣj ϕ(yi ; xi) ϕij = 1, x<y |=0, x>y | =1/2, x=y Можно сказать, что распределение вероятностей случайной величины Uxy совпадает с распределением вероятностей Uyx и их общее распределение вероятностей (распределение Манна-Уитни) зависит лишь от объемов выборок n и m. n=m Uα+ + Uα- = nm , где Uα- - нижний односторонний квантиль распред Манна-Уитни, Uα+ - верхний односторонний квантиль.
Приближенное решение задачи: 1) Критерий М-У: Uxy ≥ Uα+ -> Н1 Uxy < Uα+ -> Н0 Uyx > Uα- -> Н0 Uyx ≤ Uα- -> Н1
Далее идет инфа с сайта Дьячкова, на семинаре нам не дорассказали видимо.
2)Пусть
при коэфф доверия 1-α нижний двусторонний
квантиль Uα-
≥ 1 или верхний двусторонний квантиль
Uα+
≤ nm
– 1. Тогда можно показать, что для любой
функции распределения вероятностей
справедливо неравенство:
При
коэффициенте доверия 1-α построение
границ доверительного интервала для
сдвига в непараметрической модели
дисперсионного анализа будет:
