- •1. Анализ пропущенных значений. Методы заполнения пропусков.
- •2. Непараметрические критерии различий двух выборок.
- •3. Графические и аналитические методы анализа.
- •4.Нормальный закон распределения и его значение для прикладной статистики.
- •5. Статистические гипотезы в задачах регрессии.
- •6.Непараметрические критерии однородности двух выборок.
- •9. Непараметрические критерии изменений.
- •8.Проверка гипотез о коэфицентах регрессии и коэфицентах корреляции.
- •7.Множественный дисперсионный анализ
- •10. Стандартизация исходных данных
- •11. Основные понятия и алгоритмы кластерного анализа
- •12. Проверка гипотез о коэффициентах регрессии и коэффициентах корреляции
- •Дисперсионный анализ при оценке качества регрессии.
- •Основные возможности пакета Excel для анализа статистических данных.
- •Однофакторный дисперсионный анализ.
- •16.История развития программного обеспечения по математической статистике.
- •18.Основные возможности пакета Statistica for Windows.
- •17.Корреляционный анализ. Диаграмма рассеяния.
- •19. Корреляционный анализ. Парный коэффициент корреляции.
- •20.Основные задачи математической статистики
- •1. Задача определения закона распределения случайной величины (или системы случайных величин) по статистическим данным
- •2. Задача проверки правдоподобия гипотез
- •3. Задача нахождения неизвестных параметров распределения
- •21. Критерий согласия распределения.
- •22. Основные понятия и алгоритмы кластерного анализа
- •23. Основные проверки статистических гипотез
- •24) Критерий Стьюдента (t-критерий) (проверка гипотез о равенстве средних).
- •25. Построение и трактовка главных факторов.
- •26. Многомерное шкалирование.
- •27. Метод кластеризации данных.
- •28. Параметрические и непараметрические методы.
9. Непараметрические критерии изменений.
Н – критерий Крускала-Уоллиса- предназначен для оценки одновременно между тремя, четырьмя и так далее выборками по уровню какого-либо признака. Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
L – критерий тенденций Пейджа- применяется для сопоставления показателей, измеренных в трех и более условиях на одной и той же выборке испытуемых. Критерий позволяет выявить тенденции в измерении величин признака при переходе от условия к условию. Его можно рассматривать как продолжение теста Фридмена, поскольку он не только констатирует различия, но и указывает на направление изменений.
Критерий S –тенденций Джонкира. Выявляет тенденции изменений исследуемых данных, Количество выборок – от 3 до 6, Число элементов в выборках должно быть равным.
Т-Критерий Уилкоксона- предназначен для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет установить не только направленность изменений, но и их выраженность, то есть, способен определить, является ли сдвиг показателей в одном направлении более интенсивным, чем в другом.
Критерий Фридмена- применяется для сопоставления показателей, измеренных в c условиях (c≥3) на одной и той же выборке из n испытуемых. Критерий Фридмана позволяет установить, что величины показателей от условия к условию изменяются, но при этом не указывает на направление изменений и в этом смысле похож на критерий знаков.
8.Проверка гипотез о коэфицентах регрессии и коэфицентах корреляции.
Как проверить гипотезу о нулевом значении теоретического коэффициента регрессии?
Для проверки нулевой гипотезы H0 о равенстве нулю некоторого коэффициента регрессионного уравнения (H0:β2=0, H0: β2≠0) необходимо сравнить фактическое значение статистики, найденное по формуле с критическим значением t-статистики Стьюдента для выбранного уровня значимости, то есть со значением двусторонней (1-α) квантили t-статистики Стьюдента с n-k степенями свободы. Величина α характеризует допустимый уровень вероятности ошибиться, отвергнув нулевую гипотезу, когда она верна.
Если фактическое значение t-статистики Стьюдента больше критического значения статистики, то нулевая гипотеза отвергается для данного уровня значимости α, иначе нулевая гипотеза не может быть отвергнута для данного уровня значимости α. В случае отвержения нулевой гипотезы для уровня значимости говорят, что коэффициент β регрессионного уравнения значим на уровне значимости α (или, говорят, что оценка коэффициента β значимо отличается от нуля), и соответствующий ему регрессор объясняет вариацию зависимой переменной. В противном случае говорят, что коэффициент незначим на уровне значимости α.
Второй способ проверки гипотезы – сравнить p-значение (фактическую вероятность принятия нулевой гипотезы данного коэффициента регрессии) с выбранным уровнем значимости. Если выполняется условие p< α , то нулевая гипотеза отвергается на уровне значимости α, иначе нулевая гипотеза не может быть отвергнута для данного уровня значимости α .
Как проверить гипотезу о нестандартном (ненулевом) значении теоретического коэффициента регрессии?
Для этого предполагаем, что Н0: β2=0. H0: β2≠0. Критической статистикой для этой гипотезы выступает t-статистика. T стат. = T критическое = t критич (n-2, ɑ)
Если |t стат|>|t критич|, то гипотеза H0 отвергается, если меньше, то подтверждается
Проверка значимости коэффициента корреляции
Выборочный коэффициент корреляции находится по формуле:
Найдем
значение выборочного коэффициента
корреляции
Если
,
то следует проверить гипотезу
.
В
случае нормального распределения
гипотеза
означает независимость случайных
величин
.
Гипотеза
проверяется с помощью статистики
и
имеет “t” – распределение с “n-2”
степеней свободы. Из таблиц находим
критическое значение, где
– уровень значимости.
Если
расчетное значение
больше критического
,
то в единичном испытании осуществилось
неравенство, вероятность которого
равна
, поэтому гипотеза
отклоняется, то есть значение выборочного
коэффициента корреляции признается
значимым.
_________
Связь между коэффициентами регрессии и корреляции
Между коэффициентом корреляции и параметром парной линейной регрессии существует зависимость, которая применительно к выборочным оценкам может быть представлена следующим образом:
где: и Sy, Sx – средние квадратические ошибки.
Приведенное выражение позволяет оценить параметр регрессии без решения системы нормальных уравнений при условии, что коэффициент корреляции уже определен. На основе формулы легко показать, что выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессии. Действительно, Сравнив формулы с основной формулой коэффициента корреляции, видим, что их числители равны
Это свидетельствует об определенной связи между этими характеристиками. Выборочный коэффициент корреляции выражается тогда равенством r2 = by/x * bx/y , откуда
