Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ответы по мат..docx
Скачиваний:
3
Добавлен:
01.04.2025
Размер:
896.62 Кб
Скачать
  1. Методика проверки гипотезы случайности выборки способом длины и числа серий. Условия принятия гипотезы о случайности выборки.

Способ длины и числа серий. Пусть имеется последовательность, в которой наблюдается случайное чередование m элементов, состоящее из n1 элементов первого рода и n2 элементов второго рода. Если обозначить элементы первого рода буквой a, а элементы второго рода буквой b, то такую последовательность можно представить в виде чередования букв a и b, например: a a a b b a a b a a b b b b a a b b a b. Данная последовательность состоит из 10 элементов a и 10 элементов b, т. е. n1 = 10, n2 = 10 и m = n1 + n2 = 10 + 10 = 20. Совокупность следующих друг за другом одинаковых элементов называется серией. Число элементов, входящих в серию, называется длиной серии. В нашем примере последовательность состоит из 10 серий, в том числе имеется 5 серий из элементов a и 5 серий из элементов b. Эти серии расположены в следующей последовательности: серия a состоит из трех элементов, серия b – из двух, серия a – из двух, серия b – из одного элемента и т. д. Следовательно, длины этих серий равны: 3, 2, 2, 1 и т. д. Обозначим буквой K наибольшую длину серии любого элемента, а буквой R — общее число серий элементов a и b. В нашем примере K = 4, R = 10. Для величин K и R в случайных выборках из совокупностей с непрерывным распределением найдены законы из распределения. С помощью этих законов вычислены критические значения K и R в случайных выборках объема n = 10 200 при доверительном уровне вероятности q = 0,05. Эти критические значения K и R используются в качестве критериев для проверки гипотезы «случайности» выборки. Из приведенных данных следует, что, например, в выборке объема n = 10, если она случайна, появление серии длиной K = 5 или более имеет вероятность q = 0,05. Такую же вероятность имеет появление серии длиной K ≥ 6 для выборок объема n = 11 14.

Критические значения наибольшей длины серии K в случайных выборках объема n при доверительной вероятности q = 0,05:

K

5

6

7

8

9

10

11

12

n

10

14

22

34

54

86

140

230

Так как вероятность q = 0,05 очень мала, а маловероятные явления практически осуществляются очень редко или почти не осуществляются, то появление в выборке объема n такой длины серии K, какая приведена выше или более этого значения, укажет на то, что данная выборка является не случайной.

Критические значения чисел серий R в случайной выборке объема n при доверительной вероятности q = 0,05:

R

3

6

11

15

19

24

33

42

51

60

70

79

88

n

10

20

30

40

50

60

80

100

120

140

160

180

200

Например, в выборке объема n = 10, если она случайна, можно встретить общее число серий R3 только с вероятностью q = 0,05, а в выборке объема n= 41 50 с такой же вероятностью можно встретить R19. Поэтому, если в действительности в выборках объема n встретится такое общее число серий R, какое указано выше для соответствующего n или менее этого числа R, то в силу принципа практической невозможности маловероятных явлений надо считать наблюденное число серий, а следовательно, и выборку не случайными. Таким образом, если обозначим наблюденное значение длины серии в выборке буквой Kн, а наблюденное значение общего числа серий Rн то для принятия гипотезы случайности выборки необходимо наличие следующих двух условий одновременно: Kн < K, Rн > R, где К и R — табличные значения критерия для соответствующих значений n. Для того чтобы гипотезу случайности отвергнуть, достаточно наличие хотя бы одного из двух условий: KнK, Rн R. Сама процедура проверки гипотезы «случайности» выборки из генеральной совокупности с непрерывным распределением заключается в следующем. Берется выборка объема n и значения ее членов xi (например, действительных размеров) записываются в порядке извлечения экземпляров выборки. Затем определяется медиана наблюденного ряда значений xi и производится разбивка наблюденного ряда значений на два класса: на большие медианы и меньшие медианы. Значения xi большие или равные медиане, обозначают буквой а, значения xi меньшие медианы, буквой b. Таким образом, вся последовательность наблюденного ряда значений xi разбивается на элементы а и b, где a = xiMe, b = xi < Me. Составив последовательность из элемента а и b, определяют наибольшую длину серии Kн и общее число серий Rн. Затем сравнивают Kн и Rн с табличными значениями этих критериев и по результатам сравнения принимают или отвергают нулевую гипотезу. Нулевая гипотеза всегда заключается в том, что выборка предполагается «случайной».