Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие_Матем ч4.doc
Скачиваний:
9
Добавлен:
01.03.2025
Размер:
5.37 Mб
Скачать

5.2. Устойчивость выборочных средних

Применение теоремы Чебышева к выборочной средней дает возможность установить, что при достаточно большом объеме выборки выборочная средняя практически сколь угодно мало отличается от генеральной средней.

В самом деле, исходя из соответствующей этому условию формулировки следствия из теоремы Чебышева (см. п. 4.2)

,

выберем1) . Тогда вычитаемое в правой части

,

и наше неравенство преобразуется к виду

.

При достаточно большом объеме выборки можно добиться того, чтобы не только средняя ошибка выборки 2), но и t-кратная ошибка, т. е. , оказалась сколь угодно малой.

Вместе с тем с увеличением t правая часть полученного неравенства быстро приближается к единице. Действительно, при t = 2 в правой части получается , при t=3 имеем , при t = 4 имеем , при t = 5 имеем . При этом сама оцениваемая неравенством вероятность Р еще меньше отличается от единицы, чем ее граница по теореме Чебышева.

Возвращаясь к первоначальной формулировке, в которой вероятность оценивается неравенством , можно установить, что выполнение условия при любом сколь угодно малом значении  с заданной надежностью, т. е. с вероятностью, превышающей значение правой части неравенства, может быть достигнуто только за счет увеличения n — объема выборки. Это значит, что объем N генеральной совокупности здесь не имеет существенного значения.

При этом еще установлено, что надежность достижения заданного предела отклонения выборочной средней от генеральной при данном объеме выборки возрастает, когда этот предел расширяется (см. выше изменение Р с увеличением t).

Все это показывает, что независимо от объема генеральной совокупности, а только при достаточно большом объеме случайной выборки выборочная средняя сколь угодно близка к генеральной средней. Поэтому практически совпадают выборочные средние, вычисленные для нескольких случайных повторных выборок из одной и той же совокупности, если объемы этих выборок по своей численности достаточно велики. Это указывает на устойчивость выборочных средних, что и используется в выборочном методе.

5.3. Определение параметров выборки с помощью теоремы Ляпунова

В предыдущем параграфе выяснено, что применение теоремы Чебышева позволяет решать вопросы о достижении требуемого предела отклонения выборочной средней от генеральной и, в частности, о степени надежности, т. е. вероятности соблюдения этого предела при данном объеме выборки, а также о необходимом объеме выборки при заданной границе надежности. Но ответы на все эти вопросы выражаются в виде неравенств.

Так, искомая вероятность дается неравенством , или ; требуемый объем (n) выборки определяется неравенством , предел отклонения устанавливается неравенством .

Такое выражение параметров выборки лишено нужной точности, так как применение теорем закона больших чисел дает слишком грубую оценку вероятности и поэтому остается неизвестным, насколько искомая вероятность превышает найденную границу.

Возможность устранить эту неопределенность возникла на основании доказанной А. М. Ляпуновым центральной предельной теоремы. Она устанавливает, что сумма п независимых случайных величин, заданных произвольным распределением, но удовлетворяющих определенным условиям, при достаточно большом п подчиняется закону, сколь угодно близкому к нормальному распределению. Это позволяет применить для вычисления вероятности выполнения неравенства функцию Лапласа

.

Искомая вероятность определяется по формуле

(здесь вместо принятого в теореме Лапласа обозначения мы вводим t для сопоставления результата с оценкой по теореме Чебышева).

Сравнение результатов вычисления Р для ряда значений дает:

Значения t

По теореме Чебышева

По результатам теоремы Ляпунова

1

2

3

4

5

Р > 0

Р > 0,75

Р > 0,898

Р > 0,9375

Р > 0,96

Р= 0,68269

Р= 0,95450

Р= 0,99730

Р= 0,999993

Р= 0,999999

Величина t влияет на значение предельной ошибки, которая как указано выше, определяется в виде

.

Выбор t связывается с той вероятностью, с которой требуется гарантировать результаты выборки.

Обычно ограничиваются значением t=3, поскольку ему соответствует граница ошибки , и тогда

.

Этот результат, известный в виде «правила трех сигм», означает: «с вероятностью, близкой к достоверности, можно утверждать, что абсолютное отклонение средней выборочной от генеральной средней не превзойдет трехкратную среднюю ошибку выборки».

Основной задачей применения выборочного метода является определение по данным выборочного обследования признаков, характеризующих генеральную совокупность. В частности, выборочное наблюдение проводится для определения границ, в которых должна находиться генеральная средняя, а также для определения по данным о выборочной доле границ, в которых должна находиться генеральная доля.

Такая постановка вопросов требует применения теоремы Лапласа в виде

.

Здесь генеральная средняя, выборочная средняя, а — средняя квадратическая ошибка выборки.

Пользуясь этой формулой, можно получить ответы на такие вопросы:

1) какова вероятность того, что отклонение генеральной средней (доли) от выборочной не превышает заданного значения ;

2) в каких границах заключена генеральная средняя, если известна вероятность того, что отклонение генеральной средней (доли) от выборочной не нарушает соответствующего предела отклонения;

3) при каком объеме выборки выполнима заданная надежность того, что отклонение генеральной средней (доли) от выборочной не превышает определенного числа.

При решении всех таких вопросов требуется применение величины , выражающей среднюю ошибку репрезентативности.

Значения этой ошибки определяются по четырем формулам:

для случайной повторной выборки при определении средней признака

; (1)

для случайной повторной выборки при определении доли признака

(2)

для случайной бесповторной выборки при определении средней

(3)

для случайной бесповторной выборки при определении доли

. (4)

Опуская вывод этих формул, дадим некоторые пояснения к ним.

а) обозначает дисперсию средней в выборке, причем генеральная дисперсия заменяется дисперсией случайной величины в выборке (поскольку генеральная дисперсия неизвестна);

б) и обозначают доли данного и противоположного признака в выборке;

в) обозначает необследованную часть генеральной совокупности. При малом объеме выборки п правильная дробь приближается к 1, а поэтому значения , при бесповторной выборке обычно меньшие, чем при повторной выборке, оказываются приближенно равными между собой.