Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ММ глава 1,2.doc
Скачиваний:
1
Добавлен:
14.11.2019
Размер:
89.09 Кб
Скачать

Извлечение выборки.

    Как следует из изложенного выше, существенную роль в выполнении ряда свойств оценок играет способ извлечения выборки. Рассмотрим пример числовой лотереи типа спортлото 5 из 36. Перед извлечением шаров вероятность извлечения любого шара равна 1/36. Допустим извлечен шар номер 17, тогда вероятность извлечения любого из оставшихся шаров 1/35, шара 17 - ноль. После извлечения второго шара, например с номером 6 вероятность извлечения любого оставшегося 1/34, а шара 17 или шара 6 -ноль. Очевидно, что при таком изъятии шаров последующие значения номеров (элементов выборки) зависят от предыдущих. Об этом случае иногда говорят, что извлечение элемента выборки приводит к изменению КОМПЛЕКСА ВНЕШНИХ УСЛОВИЙ.     Если после каждого извлечения шара его возвращать в барабан и перемешивать, то вероятность извлечения любого шара будет постоянной и равной 1/36. В этом случае комплекс внешних условий неизменен. Процедуру извлечения выборки называют СХЕМОЙ. Процедуру извлечения, при которой комплекс внешних условий неизменен (процедура с возвращением) называют СХЕМОЙ БЕРНУЛЛИ. Очевидно, что не всегда возможна реализация схемы Бернулли, например, при разрушающем контроле качества и т.п. В этом случае объем выборки должен составлять минимально возможную долю от генеральной совокупности. С другой стороны, увеличение объема выборки повышает точность оценки. Эти обстоятельства должен учитывать исследователь при определении объема выборки. И еще, можно показать, что: СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ЯВЛЯЕТСЯ НАИЛУЧШЕЙ ОЦЕНКОЙ МАТЕМАТИЧЕСКОГО ОЖИДАНИЯ!

Проверка статистических гипотез.

     СТАТИСТИЧЕСКОЙ ГИПОТЕЗОЙ называют некоторое утверждение относительно значения (или значений) какого-либо параметра случайной величины. Например, утверждение: Mx=5 (гипотеза о равенстве МО пяти) или утверждение: Dx=Dy (гипотеза о равенстве двух дисперсий). Под процедурой проверки статистических гипотез понимают последовательность действий, позволяющих с той или иной степенью достоверности подтвердить или опровергнуть утверждение гипотезы. Все статистические выводы являются следствием проверки одной или комплекса гипотез.     В основе проверки любой гипотезы лежит ПРИНЦИП ПРАКТИЧЕСКОЙ НЕВОЗМОЖНОСТИ     Этот принцип гласит: СОБЫТИЯ С МАЛЫМИ ВЕРОЯТНОСТЯМИ ПРАКТИЧЕСКИ НЕВОЗМОЖНЫ.     УРОВНЕМ ЗНАЧИМОСТИ называется максимальное значение вероятности, при котором событие можно считать еще практически невозможным. Уровень значимости обозначается греческой буквой α. В практике статистических вычислений приняты следующие стандартные значения α: 0,05, 0,02 и 0,01 (5%, 2% и 1% ).     Событие, вероятность которого превышает α называется ЗНАЧИМЫМ, а событие, вероятность которого не превышает α называется НЕЗНАЧИМЫМ.     При проверке статистической гипотезы исследователь сам назначает уровень значимости. Суть проверки гипотезы сводится к следующему. Исследователь предполагает, что гипотеза верна. Исходя из этого, исследователь делит будущие результаты на две группы. Первая группа - результаты, вероятность получить которые при справедливости гипотезы превосходит α. Вторая - результаты, вероятность получить которые не превосходит α. Затем извлекается выборка (или реализуется эксперимент) и определяется к какой группе относится результат. Если результат относится к первой группе, то нет оснований отвергать гипотезу (это вполне вероятный результат). Если результат принадлежит второй группе, то есть основания для отвержения гипотезы (это маловероятный результат).

     Рассмотрим основные этапы проверки гипотезы на примере проверки гипотезы о равенстве МО нормально распределенной случайной величины заданному значению.     ЭТАП I. Формулирование гипотезы. H0: Mx=C (гипотеза о равенстве МО значению C). Гипотеза о равенстве называется нулевой гипотезой о обозначается H0.    ЭТАП II. Определение статистики, с помощью которой будет проверятся гипотеза. Исследователю должен быть известен закон распределения этой статистики при справедливости гипотезы. Для нашего случая можно использовать T-статистику:

T = (X - C)*n1/2/S 

 где  n - объем выборки.

  ЭТАП III. Исследователь назначает уровень значимости. Пусть α=0,05. По выбранному уровню значимости т.к. известно распределение T-статистики при справедливости исходной гипотезы определяются две граничные величины T-статистики (T1 и T2), которые делят значения T-статистики на две области. При справедливости гипотезы вероятность попадания статистики в интервал (T1,T2) составляет величину 1-α (0,95 в нашем случае), вероятность принятия T-статистикой значений вне интервала (T1,T2) не превышает α (в нашем случае 0,05). Первая область называется ОБЛАСТЬЮ ПРИНЯТИЯ ГИПОТЕЗЫ, вторая - КРИТИЧЕСКОЙ ОБЛАСТЬЮ.

ЭТАП IV. Извлекается выборка и вычисляется статистика. (В нашем случае Tрасч).

ЭТАП V. Если вычисленное значение попадает в область принятия гипотезы (в нашем случае T1<Tрасч<T2), то говорят, что ДАННЫЕ НЕ ПРОТИВОРЕЧАТ ГИПОТЕЗЕ. Если Tрасч<T1 или Tрасч>T2 (вычисленное значение попадает в критическую область) то говорят, что ДАННЫЕ ПРОТИВОРЕЧАТ ГИПОТЕЗЕ

Необходимо подчеркнуть, что отвергает или принимает гипотезу исследователь. Процедура проверки лишь обосновывает приведенные выше утверждения. Утверждение - данные не противоречат гипотезе используется потому, что возможно справедлива не данная гипотеза, а некая другая, близкая к этой гипотезе (например H0: Mx=C1). Утверждение - данные противоречат гипотезе используется потому, что вероятность получить такой результат хоть и мала, но отлична от нуля.

ЕСЛИ ДАННЫЕ ПРОТИВОРЕЧАТ ГИПОТЕЗЕ И ГИПОТЕЗА ОТВЕРГАЕТСЯ, ТО ВЕРОЯТНОСТЬ ОШИБКИ ИССЛЕДОВАТЕЛЯ (гипотеза все таки верна) НЕ ПРЕВЫШАЕТ α (заданного уровня значимости).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]