Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
матем 1-31.docx
Скачиваний:
17
Добавлен:
23.04.2019
Размер:
708.41 Кб
Скачать

Мощность статистических критериев (power of tests)

Проверка гипотезы предполагает сопоставление двух конкурирующих гипотез. Нулевая гипотеза указывает на невозможность редких, необычных событий. Альтернативная гипотеза, напротив, утверждает, что такие события возможны. Напр., нулевая гипотеза могла бы гласить, что две группы имеют одинаковое среднее или что корреляция между двумя переменными равна нулю. Альтернативная гипотеза может быть направленной или ненаправленной. Направленная гипотеза указывает направление эффекта: в группе 1 среднее выше, чем в группе 2, или корреляция между двумя переменными больше нуля. Ненаправленная гипотеза указывает только на существование эффекта, не определяя его направления: две группы имеют разные средние или корреляция между двумя переменными отлична от нуля. Статистики начинают с предположения, что нулевая гипотеза верна, и отвергают ее только в том случае, если наблюдаемые результаты весьма маловероятны при этом предположении. Основываясь на некоторых допущениях в отношении проводимого исслед., напр., предполагая случайный характер выборки и нормально распределенную зависимую переменную, исследовать может вычислить вероятность отвергнуть нулевую гипотезу в тех случаях, когда она верна (α) и когда верна альтернативная гипотеза (мощность критерия). Поскольку исследователь хочет прийти к правильному выводу, надежные исследования планируются таким образом, чтобы обеспечить низкий уровень а и большую мощность. При низком уровне а крайне мало шансов отвергнуть правильную нулевую гипотезу, а при большой мощности критерия больше шансов принять правильную альтернативную гипотезу.

Обычно исследователи выбирают уровень α = 0,05. В этом случае они отвергают нулевую гипотезу только если выборочные результаты попадают в 5%-ную краевую область распределения возможных исходов, построенного при условии справедливости нулевой гипотезы. Когда нулевая гипотеза отвергается, исследователь делает вывод о значимости полученных результатов и указывает вероятность их значимости, т. е. уровень а, связанный с данным исходом. Напр., он может сделать вывод, что полученная корреляция значима на уровне р < 0,05, подразумевая, что нулевая гипотеза об отсутствии корреляции могла быть отвергнута с вероятностью ошибки (α) меньше 0,05. Расположенный ближе к краям распределения результат имеет еще меньшую вероятность значимости: р < 0,01 или р < 0,001.

Так как традиционный подход предусматривает выбор низкого уровня а, исследователи должны проявлять осторожность, чтобы поддерживать разумно высокую мощность используемых критериев. Оценки мощности критериев можно получить еще до сбора данных, и исслед. с недостаточной мощностью можно перепланировать, чтобы ее увеличить. Есть четыре основных стратегии повышения мощности: выбор более высокого уровня а, формулирование направленных гипотез, увеличение объема выборки и усиление эффекта.

С повышением уровня а возрастает мощность. Чем выше а, тем больше вероятность отвергнуть нулевую гипотезу и, следовательно, прийти к заключению о том, что верна правильная альтернативная гипотеза. Однако вместе с повышением уровня а возрастает риск отвергнуть верную нулевую гипотезу — ошибка, к-рой следует избегать. Уровни а выше 0,05 традиционно считаются неприемлемыми, но они все же могут использоваться в ситуациях, когда мощность критерия крайне важна, а ошибочное отклонение нулевой гипотезы обходится не слишком дорого.

Второй способ повысить мощность — формулирование направленных гипотез. Это дает исследователю возможность сосредоточиться на α-риске только тех исходов, которые согласуются с направленной гипотезой. Напр., критерий для оценки коэффициента корреляции при использовании ненаправленной гипотезы и α = 0,05 мог отвергнуть нулевую гипотезу для полученных корреляций, лежащих ниже -0,60 или выше +0,60. Следовательно, ожидается, что исходы (т. е. наблюдаемые корреляции), попадающие в интервал от -0,60 до +0,60, наступают в 95% случаев проведения такого исслед., тогда как исходы, лежащие за пределами этого интервала, наступают только в 5% случаев, — при условии истинности нулевой гипотезы. Однако если исследователь уточнит гипотезу, преобразуя ее в направленную и предполагая положительную корреляцию, используемый критерий мог бы теперь отвергнуть нулевую гипотезу для всех корреляций, лежащих выше +0,55, так как в этом случае 5% ожидаемых корреляций при данной нулевой гипотезе превышают эту величину. Если наблюдаемая корреляция оказалась равной 0,58, исследователь не мог бы отвергнуть нулевую гипотезу в пользу ненаправленной альтернативной гипотезы, но смог бы сделать это в пользу направленной гипотезы. Концентрируя α-риск на одном конце множества возможных исходов, исследователь получает более мощный критерий. К сожалению, если направленная гипотеза задает ложное направление эффекта, исследователь не получит значимых результатов и впадет в заблуждение. Так, получив корреляцию -0,63, исследователь из предыдущего примера мог бы отвергнуть нулевую гипотезу в случае применения ненаправленного критерия, но не смог бы этого сделать при направленной проверке, нацеленной исключительно на оценку положительной связи. Поэтому исследователи формулируют направленные гипотезы только тогда, когда противоположный результат невозможно помыслить, опираясь на предшествующие исслед., теорию или логику. Напр., если все проведенные до этого исслед. обнаружили положительную связь между двумя переменными, исследователь будет чувствовать себя уверенно, проводя направленную проверку гипотезы.

Третий способ повысить мощность — увеличить объем выборки. Статистики, основанные на выборках большего объема, более устойчивы и, следовательно, обеспечивают более точную оценку характеристик генеральной совокупности. Эта прибавка в точности повышает вероятность того, что будет подтверждена правильная альтернативная гипотеза. Фактически, проводимые на очень больших выборках исслед. могут обладать излишней мощностью в плане проверки гипотез, потому что такие исслед. позволяют отвергнуть нулевую гипотезу при получении незначительных, хотя и статистически значимых результатов. Например, полученная на большой выборке корреляция 0,20 может значимо отличаться от нуля, но такая связь, по-видимому, слишком слаба, чтобы представлять практ. интерес.

Величина эффекта — это сила изучаемой связи. Исслед., для к-рого выбраны переменные с большей величиной эффекта, обладает большей мощностью. Напр., для доказательства того, что разные виды птиц несут яйца разного размера, следовало бы сравнить страусов и колибри, а не кур и уток, поскольку в первом случае величина эффекта будет гораздо больше, чем во втором. Исслед., в к-рых изучаются переменные с большой величиной эффекта, дают больше шансов отвергнуть нулевую гипотезу, чем исслед., рассчитанные на обнаружение более тонких эффектов. Исследователи могут отобрать переменные с сильными связями и выбрать способы измерения или контроля переменных, максимизирующие величину эффекта, с тем чтобы повысить мощность критериев проверки гипотез.

Исследователи стремятся работать с низкими уровнями а и мощными статистическими критериями, чтобы повысить шансы получения верных выводов. Они обычно поддерживают а на уровне не выше 0,05 и используют разные стратегии увеличения мощности. Хорошо спланированное исслед. может отличаться относительно небольшой величиной а, направленной гипотезой, большим объемом выборки или значительной величиной эффекта. Исследователь учитывает все эти варианты выбора при планировании исслед., к-рое, по всей вероятности, пополнит достоверной информ. базу психол. знаний.

№16 статистический критерий проверки нулевой гипотезы, основной проверки гипотез

Статистический критерий проверки нулевой гипотезы

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эту величину обозначают через U или Z, если она распределена нормально, F или v2 – по закону Фишера-Снедекора, T – по закону Стьюдента, c² – по закону «хи квадрат» и т. д. Все эти случайные величины обозначим через К.

Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы.

Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия.

Наблюдаемым значением Кнабл назначают значение критерия, вычисленное по выборкам.

Критическая область

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

Поскольку критерий К – одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

Критическими точками (границами) Ккр называют точки, отделяющие критическую область от области принятия гипотезы.

Различают одностороннюю (правостороннюю или левостороннюю) или двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством К > Ккр, где Ккр – положительное число.

Левосторонней называют критическую область, определяемую неравенством К < Ккр, где Ккр – отрицательное число.

Односторонней называют правостороннюю или левостороннюю критическую область.

Двусторонней называют критическую область, определяемую неравенствами К< К1, К > К2, где К2 > К1.

В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что Ккр > 0): К < -Ккр, К > Ккр или равносильным неравенством   > Ккр.

№ 17 виды критических областей, поиск критических точек

Виды критической области

Выделяют три вида критических областей:

  • Двусторонняя критическая область определяется двумя интервалами  , где   находят из условий  .

  • Левосторонняя критическая область определяется интервалом  , где xα находят из условия P(ϕ < xα) = α.

  • Правосторонняя критическая область определяется интервалом  , где x1 − α находят из условия P(ϕ < x1 − α) = 1 − α

  • Критической точкой дифференцируемой функции  , где   — область в  , называется точка, в которой все её частные производные обращаются в нуль. Это условие эквивалентно обращению в нуль дифференциала функции в данной точке, а также равносильно горизонтальности касательной гиперплоскости к графику функции. Это условие является необходимым (но не достаточным) для того, чтобы внутренняя точка области могла быть точкой локального минимума или максимума функции.

  • Значение функции в критической точке называется критическим значением. Согласно лемме Сарда, множество критических значений любой  -гладкой функции   имеет нулевую меру Лебега (хотя критических точек при этом может быть сколько угодно, например, для функции f = const любая точка является критической).

  • Понятие критической точки допускает обобщение на случай дифференцируемых отображений  , и на случай дифференцируемых отображений произвольных многообразий  . В этом случае определение критической точки состоит в том, что ранг матрицы Якоби отображения f в ней меньший максимального (равного числу min{n,m}).

  • Критические точки функций и отображений играют важную роль в таких областях математики, как дифференциальные уравнениявариационное исчислениетеория устойчивости, а также в механике и физике. Исследование критических точек гладких отображений составляет один из главных вопросов теории катастроф.

  • Понятие критической точки обобщается также на случай функционалов, определенных на бесконечномерных функциональных пространствах. Поиск критических точек таких функционалов является важной частью вариационного исчисления. Критические точки функционалов (которые, в свою очередь, являются функциями) называются экстремалями.

  • Критической точкой (или особой точкой, или стационарной точкой) непрерывно дифференцируемой функции (отображения)   называется такая точка  , в которой дифференциал   является вырожденным линейным преобразованием соответствующих касательных пространств в точках x0 и f(x0), то есть размерность образа f *меньше min{n,m}. В координатной записи это означает что ранг матрицы Якоби функции f, составленной из всех частных производных      меньше своего максимально возможного значения min{n,m}.

  • Пространства   и   в этом определении могут быть заменены на многообразия Nn и Mm таких же размерностей.

№18 статистические гипотезы о виде распределения, алгоритм выдвижения таких гипотез

Статистические гипотезы

На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез).Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Выдвигается основная (нулевая) гипотеза   и проверяется, не противоречит ли она имеющимся эмпирическим данным. Конкурирующей (альтернативной) называют гипотезу  , которая противоречит нулевой.

В результате статистической проверки гипотезы могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза; вероятность совершить такую ошибку обозначают   и называют ее уровнем значимостиОшибка второго рода состоит в том, что будет принята неправильная гипотеза, вероятность которой обозначают  , а мощностью критерия является вероятность  .

Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез. Под критической областью понимают совокупность значений критерия, при которых нулевую гипотезу   отвергают. Критическую область при заданном уровне значимости следует строить так, чтобы мощность критерия была максимальной.

Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения, которую представим на рис. 103.

Ри

№19 критерии согласия

Критерии согласия - это критерии проверки гипотез о соответствии эмпирического распределения теоретическому распределению вероятностей. Такие критерии подразделяются на два класса:

  1. Общие критерии согласия применимы к самой общей формулировке гипотезы, а именно к гипотезе о согласии наблюдаемых результатов с любым априорно предполагаемым распределением вероятностей.

  2. Специальные критерии согласия предполагают специальные нулевые гипотезы, формулирующие согласие с определенной формой распределения вероятностей.

Общие критерии согласия

Нулевая гипотеза  , где   - эмпирическая функция распределения вероятностей;   - гипотетическая функция распределения вероятностей.

Группы общих критериев согласия:

  • критерии, основанные на изучении разницы между теоретической плотностью распределения и эмпирической гистограммой;

  • критерии, основанные на расстоянии между теоретической и эмпирической функциями распределения вероятностей;

Критерии, основанные на сравнении теоретической плотности распределения и эмпирической гистограммы

  • Критерий согласия хи-квадрат [1]

  • Критерий числа пустых интервалов [1]

  • Квартильный критерий Барнетта-Эйсена [1]

Критерии, основанные на сравнении теоретической и эмпирической функций распределения вероятностей

Расстояние между эмпирической и теоретической функциями распределения вероятностей является весьма эффективной статистикой для проверки гипотез о виде закона распределения вероятностей случайной величины.

Критерии согласия, использующие различные варианты анализа расстояния между теоретической и эмпирической функциями распределения:

  • Критерий Джини

  • Критерий Крамера-фон Мизеса

  • Критерий Колмогорова-Смирнова [1] [1]

  • Критерий Реньи (R-критерий) [1]

  • Критерий Смирнова-Крамера-фон Мизеса (Критерий омега-квадрат) [1] [1]

  • Критерий Андерсона-Дарлинга [1]

  • Критерий Купера [1]

  • Критерий Ватсона [1]

  • Критерий Фроцини [1]

Другие критерии:

  • Критерии согласия Дарбина [1] [1]

Специальные критерии согласия

Нормальное распределение

Нормальный закон распределения вероятностей получил наибольшее распространение в практических задачах обработки экспериментальных данных. Большинство прикладных методов математической статистики исходит из предположения нормальности распределения вероятностей изучаемых случайных величин. Широкое распространения этого распределения вызвало необходимость разработки специальных критериев согласия эмпирических распределений с нормальным. Существуют как модификации общих критериев согласия, так и критерии, созданные специально для проверки нормальности.

Экспоненциальное распределение

Экспоненциальный закон распределения вероятностей является базовым законом, используемым в теории надежности. Его аналитическая простота делает его привлекательным для инженеров и исследователей.

Существует большое количество специальных критериев согласия для экспоненциального распределения:

  • Критерий Шапиро-Уилка для экспоненциального распределения [1]

  • Критерии типа Колмогорова-Смирнова для экспоненциального распределения [1] [1]

  • Критерии типа Смирнова-Крамера-фон Мизеса для цензурированных данных [1]

  • Критерий Фроцини для экспоненциального распределения [1]

  • Корреляционный критерий экспоненциальности [1]

  • Регрессионный критерий Брейна-Шапиро [1]

  • Критерий Кимбера-Мичела [1]

  • Критерий Фишера для экспоненциального распределения [1]

  • Критерий Бартлетта-Морана [1] [1]

  • Критерий Климко-Антла-Радемакера-Рокетта [1]

  • Критерий Холлендера-Прошана [1] [1]

  • Критерий Кочара [1]

  • Критерий Эппса-Палли-Чёрго-Уэлча [1]

  • Критерий Бергмана [1]

  • Критерий Шермана [1]

  • Критерий наибольшего интервала [1]

  • Критерий Хартли [1]

  • Критерий показательных меток [1]

  • Ранговый критерий независимости интервалов [1] [1]

  • Критерии, основанные на трансформации экспоненциального распределения в равномерное

    • Критерии   [1]

    • Критерий Гринвуда [1]

  • Критерий Манн-Фертига-Шуера для распределения Вейбулла [1]

  • Критерий Дешпанде [1]

  • Критерий Лоулесса [1]

№20 сравнение генерального ско с гипотетическим значением

№21 сравнение двух дисперсий нормальных генеральных совокупностей