
- •Числовые характеристики рассеивания значений случайной величины. Основные свойства математического ожидания и дисперсии.
- •Данные для вычисления критерия
- •Методика проверки гипотезы о законе распределения случайной величины. Методику пояснить на примере проверки гипотезы о законе нормального распределения случайной величины.
- •Методика проверки гипотезы случайности выборки способом последовательных разностей. Определение расчетного и критического значений критерия .
- •Методика проверки гипотезы случайности выборки способом длины и числа серий. Условия принятия гипотезы о случайности выборки.
- •Методика проверки гипотезы равенства двух выборочных средних для выборок, взятых из нормальной генеральной совокупности, с использованием критерия Стьюдента.
- •Методика проверка гипотезы равенства двух выборочных дисперсий для выборок, взятых из нормальной генеральной совокупности. Как определяется расчетное и критическое значения критерия т?
- •Методика проверки гипотезы однородности ряда дисперсий при равном объеме выборок, взятых из нормальной генеральной совокупности. Как определяется расчетное и критическое значения критерия g?
Методика проверки гипотезы случайности выборки способом длины и числа серий. Условия принятия гипотезы о случайности выборки.
Способ
длины и числа серий.
Пусть имеется последовательность, в
которой наблюдается случайное чередование
m
элементов, состоящее из n1
элементов первого рода и n2
элементов второго рода. Если обозначить
элементы первого рода буквой a,
а элементы второго рода буквой b,
то такую последовательность можно
представить в виде чередования букв a
и b,
например: a
a
a
b
b
a
a
b
a
a
b
b
b
b
a
a
b
b
a
b.
Данная последовательность состоит из
10 элементов a
и 10 элементов b,
т. е. n1
= 10, n2 = 10
и m
= n1
+ n2
= 10 + 10 = 20. Совокупность следующих друг
за другом одинаковых элементов называется
серией. Число элементов, входящих в
серию, называется длиной серии. В нашем
примере последовательность состоит из
10 серий, в том числе имеется 5 серий из
элементов a
и 5 серий из элементов b.
Эти серии расположены в следующей
последовательности: серия a
состоит из трех элементов, серия b
–
из двух, серия a
– из двух, серия b
– из одного элемента и т. д. Следовательно,
длины этих серий равны: 3, 2, 2, 1 и т. д.
Обозначим буквой K
наибольшую длину серии любого элемента,
а буквой R
— общее число серий элементов a
и b.
В нашем примере K
= 4, R
= 10. Для величин K
и R
в случайных выборках из совокупностей
с непрерывным распределением найдены
законы из распределения. С помощью этих
законов вычислены критические значения
K
и R
в случайных выборках объема n
= 10
200 при доверительном уровне вероятности
q
= 0,05. Эти критические значения K
и R
используются в качестве критериев для
проверки гипотезы «случайности» выборки.
Из приведенных данных следует, что,
например, в выборке объема n = 10,
если она случайна, появление серии
длиной K
=
5 или более имеет вероятность q
= 0,05. Такую же вероятность имеет появление
серии длиной K ≥ 6
для выборок объема n
= 11
14.
Критические значения наибольшей длины серии K в случайных выборках объема n при доверительной вероятности q = 0,05:
K |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
n |
10 |
14 |
22 |
34 |
54 |
86 |
140 |
230 |
Критические значения чисел серий R в случайной выборке объема n при доверительной вероятности q = 0,05:
R |
3 |
6 |
11 |
15 |
19 |
24 |
33 |
42 |
51 |
60 |
70 |
79 |
88 |
n |
10 |
20 |
30 |
40 |
50 |
60 |
80 |
100 |
120 |
140 |
160 |
180 |
200 |
Например, в выборке объема n = 10, если она случайна, можно встретить общее число серий R ≤ 3 только с вероятностью q = 0,05, а в выборке объема n= 41 50 с такой же вероятностью можно встретить R ≤ 19. Поэтому, если в действительности в выборках объема n встретится такое общее число серий R, какое указано выше для соответствующего n или менее этого числа R, то в силу принципа практической невозможности маловероятных явлений надо считать наблюденное число серий, а следовательно, и выборку не случайными. Таким образом, если обозначим наблюденное значение длины серии в выборке буквой Kн, а наблюденное значение общего числа серий Rн то для принятия гипотезы случайности выборки необходимо наличие следующих двух условий одновременно: Kн < K, Rн > R, где К и R — табличные значения критерия для соответствующих значений n. Для того чтобы гипотезу случайности отвергнуть, достаточно наличие хотя бы одного из двух условий: Kн ≥ K, Rн ≤ R. Сама процедура проверки гипотезы «случайности» выборки из генеральной совокупности с непрерывным распределением заключается в следующем. Берется выборка объема n и значения ее членов xi (например, действительных размеров) записываются в порядке извлечения экземпляров выборки. Затем определяется медиана наблюденного ряда значений xi и производится разбивка наблюденного ряда значений на два класса: на большие медианы и меньшие медианы. Значения xi большие или равные медиане, обозначают буквой а, значения xi меньшие медианы, буквой b. Таким образом, вся последовательность наблюденного ряда значений xi разбивается на элементы а и b, где a = xi ≥ Me, b = xi < Me. Составив последовательность из элемента а и b, определяют наибольшую длину серии Kн и общее число серий Rн. Затем сравнивают Kн и Rн с табличными значениями этих критериев и по результатам сравнения принимают или отвергают нулевую гипотезу. Нулевая гипотеза всегда заключается в том, что выборка предполагается «случайной».