Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 РА 22---осн.docx
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.92 Mб
Скачать

Применение гипотеза Хилла для оценки минимально необходимого объема выборки. Клюшин Дмитрий Анатольевич, Доказательная медицина. Применение статистических методов.

Пусть генеральная совокупность СлВел-ы с неизвестным симметричным распределением вероятности , а R множество действительных чисел.

Основной распределеной массой называется подмножество такое, что , где - произвольный элемент выборки, который получен с помощью случайного отбора (по рр закону??) из , - заданный уровень значимости ( допустим ).

Пусть выполнено следующее:

  1. Для получения выборки используется случайный выбор. Обозначим как - члены соответствующего выриационного ряда.

Напомним: вариационный ряд - это выборка , упорядоченая по величине и полученная последовательность обозначена как

2.Выборочные значения являются реализацией СВ с симметричным абсолютно непрерывным распределением

Тогда выполняется гипотеза Хилла:

(1)

(Все доказательства пока опустим)

Теорема 1

Если симметрично зависимые одинаково распределенные случайные величины с абсолютно непрерывной функцией распределения такой, что при , то

Теорема 2.

Если симметрично зависимые одинаково распределенные случайные величины с абсолютно непрерывной ф-цией распределения такой, что

при , а – вариацоный ряд, построенный из первых n значений, то

С вяжем этот результат с

уровнем значимости α, как он

введен выше. Уровень значимости

определен так, что 5% точек

попадает в хвосты.

Значит, считая что хотя бы 1 интервал вариационного ряда попал какой-то из 2-х хвостов (это определяет минимальное количество точек в выборке, что-бы данное событие произошло) то можно написать что . Отсюда при заданном α можно записать

и получить оценку для n:

Отсюда при α=0,05 имеем

То мы нашли минимальное количество испытаний достаточное для проверки утверждения: если полученные реализации не вышли за пределы +-2сигма - то похожее на нормальное распределение - действительно нормальное

???????Данное утверждение находит связь между значимостью результата (0.05) и минимальным количеством точек, которые нужны для утверждения гипотезы допустим Н0. Условием корректности применения оценки для n есть симметричность и непрерывность рассматриваемых распределений.

Это дает наконец точку опоры для применения теории статичтических гbпотез для относительно небольшиз размеров выборки.

Небольшое отвлечение -

Об условиях применения гипотезы Хилла - напомним

она применима к СВ которые имеют симметричные и абсолютно непрерывные плотности распределения

Ч то такое не абсолютно непрерывная функция - это такая непрерывная функция у которой нет производной в несчетном количестве точек.

рис 33

Канторова лестница - граффик массы канторова стержня от коорд-ы х

канторов стержень - стержень масса которого пропорциональна мощности канторова множества Канторово множество

Множества C0, C1, C2, C3, C4, C5, C6

C=⋂Сi i=0,...∞ называется Канторовым множеством.

Из единичного отрезка C0=[0,1] удалим среднюю треть, то есть интервал (1/3,2/3). Оставшееся точечное множество обозначим через C1. Множество C1=[0,1/3]∪[2/3,1] состоит из двух отрезков; удалим теперь из каждого отрезка его среднюю треть, и оставшееся множество обозначим через C2. Повторив эту процедуру опять, удаляя средние трети у всех четырёх отрезков, получаем C3. Дальше таким же образом получаем последовательность замкнутых множеств C0⊃C1⊃C2⊃…. Пересечение

СВ с Пл Р как видоизм кантор лестница рис. 33 - будет

непр но не абсолютно непрерывна