- •. Основные понятия и определения математической статистики
- •Основными этапами статистического анализа данных являются:
- •Данные и их разновидности
- •Измерительные шкалы
- •Основные характеристики и примеры измерительных шкал
- •Генеральная совокупность и выборка
- •Статистическое распределение выборки
- •Описательный (дескриптивный) анализ
- •Структурирование, ввод и проверка данных.
- •Меры центральной тенденции
- •Выбор меры центральной тенденции в зависимости от типа измерительной шкалы
- •Меры изменчивости
- •Меры связи между признаками
- •Корреляция метрических переменных
- •Корреляция ранговых переменных
- •Статистические гипотезы
- •Статистические критерии
- •Процедура проверки статистических гипотез
- •Основные законы распределения
- •Нормальное распределение.
- •-Распределение
- •Распределение Стьюдента
- •Распределение Фишера,
- •Проверка гипотез о законе распределения
- •Критерий Колмогорова
. Методы проверки статистических гипотез. Анализ взаимосвязи в таблицах сопряженности
Статистические гипотезы
Любое исследование направлено на определение некоторой характеристики изучаемой генеральной совокупности или выявление связи между признаками (факторами). Такая связь часто исследуется в причинно-следственном аспекте, когда некоторые факторы рассматриваются как причины (независимые переменные), а другие - как следствия или результаты (зависимые переменные). Связь может характеризоваться не только величиной (степенью связи) и направлением (что показывает, например, коэффициент корреляции), но также и статистической достоверности. Последняя характеристика связи показывает, можно ли распространить результаты, полученные на данной выборке, на всю генеральную совокупность, из которой взята эта выборка.
Любое заключение, полученное из статистического наблюдения / исследования / анализа, - индуктивно и строится на конечном числе наблюдений, поэтому оно не полно и может быть недостоверно. Необходимо обоснование заключения, Т.е. тестирование результатов, на которых строится гипотеза, на статистическую достоверность. Достоверность непосредственно связана с репрезентативностью выборки, Т.е. с тем, насколько уверенно данные, полученные по выборке, позволяют судить о соответствующих параметрах генеральной совокупности. Целью исследования почти никогда не является изучение данной конкретной выборки; выборка представляет интерес лишь постольку, поскольку она дает информацию обо всей генеральной совокупности. Статистическая достоверность связи определяется тем, насколько вероятно, что обнаруженная в выборке связь подтвердится (будет вновь обнаружена) на другой выборке той же генеральной совокупности.
Основной задачей статистической проверки гипотез является репрезентативное выборочное описание свойств генеральных совокупностей. Для описания значительных по объему совокупностей свойств, состояний, процессов требуется накопление огромного выборочного материала или проведение исследований в национальном масштабе. Поэтому задача репрезентативного описания сводится к задаче проверки однородности выборочных описаний, полученных в разных исследованиях, и к объединению однородных данных.
Для проверки однородности, необходимы:
а) однообразность статистических описаний одних и тех же явлений разными авторами;
б) указание на величину объектов выборок, из которых вычислялись статистические оценки параметров и функций.
Начало любого исследования – это постановка проблемы. Самые простые, наивные вопросы являются прототипами проблемы.
В отличие от житейской, научная проблема формулируется в терминах определенной научной отрасли.
Постановка проблемы влечет за собой формулировку гипотезы. Гипотеза – это научное предположение, вытекающее из теории, которое еще не подтверждено и не опровергнуто. Научная гипотеза должна удовлетворять:
• принципам фальсифицируемости – быть опровергаемой в эксперименте; принцип фальсифицируемости абсолютен, так как опровержение теории всегда окончательно,
• принципам верифицируемости – быть подтверждаемой в эксперименте, этот принцип относителен, так как всегда есть вероятность опровержения гипотезы в следующем исследовании.
Различают научные и статистические гипотезы.
Научные гипотезы формулируются как предполагаемое решение проблемы.
Статистическая гипотеза – утверждение в отношении неизвестного параметра, сформулированное на языке математической статистики.
Любая научная гипотеза требует перевода на язык статистики. После проведения конкретного эксперимента проверяются многочисленные статистические гипотезы, поскольку в каждом исследовании регистрируется не один, а множество поведенческих параметров. Каждый параметр характеризуется несколькими статистическими мерами: центральной тенденции, изменчивости, распределения. Можно вычислить меры связи параметров и оценить значимость этих связей.
Научные гипотезы. Экспериментальная гипотеза служит для организации эксперимента, а статистическая – для организации процедуры сравнения регистрируемых параметров.
Статистическая гипотеза необходима на этапе математической интерпретации данных эмпирических исследований. Большое количество статистических гипотез необходимо для подтверждения или опровержения основной – экспериментальной гипотезы. Экспериментальная гипотеза – первична, статистическая – вторична.
Процесс выдвижения и опровержения гипотез можно считать основным и наиболее творческим этапом деятельности исследователя. Установлено, что количество и качество гипотез определяется общей креативностью (общей творческой способностью) исследователя – «генератора идей».
Гипотеза может отвергаться, но никогда не может быть окончательно принятой. Любая гипотеза открыта для последующей проверки.
Формулирование гипотез систематизирует предположения исследователя и представляет их в четком и лаконичном виде.
Статистические гипотезы. В обычном языке слово «гипотеза» означает предположение.
В том же смысле оно употребляется в научном языке, используясь в основном для предположений, вызывающих сомнение. В математической статистике термин «гипотеза» означает предположение, которое не только вызывает сомнения, но и которое мы собираемся в данный момент проверить.
При построении статистической модели приходиться делать много различных допущений и предположений, и далеко не все из них мы собираемся или можем проверить.
Статистическая проверка гипотезы состоит в выяснении того, насколько совместима эта гипотеза с имеющимся результатом случайного выбора.
Определение. Статистическая гипотеза – это предположение о распределении вероятностей, которое мы хотим проверить по имеющимся данным.
Гипотезы различают простые и сложные:
• простая гипотеза полностью задает распределение вероятностей;
• сложная гипотеза указывает не одно распределение, а некоторое множество распределений. Обычно это множество распределений, обладающих определенным свойством.
Статистические гипотезы подразделяются на нулевые и альтернативные.
Гипотезу, выдвинутую для проверки ее согласия с выборочными данными, называют нулевой гипотезой и обозначают H0. Вместе с гипотезой H0 выдвигается альтернативная или конкурирующая гипотеза, которая обозначается H1. Например:
1) |
H0: =0 |
2) |
H0: M= 0 |
3) |
H0: M= 0 |
|
H1: M 0 |
|
H1: M> 0 |
|
H1: M= 2 |
Бывают задачи, когда мы хотим доказать незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам.
Чаще всего требуется доказать значимость различий, ибо они более информативны для нас в поиске нового.
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
