Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции Математическая статистика и элементы тео...doc
Скачиваний:
4
Добавлен:
01.07.2025
Размер:
1.44 Mб
Скачать

Собственно-случайная выборка для определения средней

Пусть из генеральной совокупности распределения признака, в которой характеризуется как варианты и частоты

Таблица 1

xi

Ni

Pi

x1

x2

..

xn

N1

N2

..

Nm

,

,

Для оценки неизвестной генеральной средней образуется повторная выборка объема N. Обозначим через x1,x2,…,xn случайные величины, выражающие значения интересующего нас признака при отборе 1-го, 2-го, n-го членов выборки. Каждый раз после возврата отобранного члена восстанавливается первоначальный состав генеральной совокупности, поэтому случайные величины x1,x2,…,xn одинаково распределены и независимы.

Выборочная средняя повторной выборки , образованной для оценки неизвестной генеральной средней -это среднее арифметическое случайных величин x1,x2,…,xn.

.

Таким образом , она является суммой - независимых одинаково распределенных случайных величин, имеющих абсолютные центральные моменты 3 порядка поскольку каждая из случайных величин принимает лишь конечное значение и эти значения ограничены , поэтому согласно следствия из теоремы Ляпунова, выборочная средняя повторной выборки достаточно большого объема распределена по нормальному закону. Нужно найти параметры этого распределения. Для этого вычислим математическое ожидание и дисперсию.

(1)

Также найдем дисперсию

(2)

Обозначим это значение как . Таким образом, математическое ожидание и дисперсия одинаковы и равны генеральной средней и генеральной дисперсии . Математическое ожидание выборочной средней равно генеральной средней, а дисперсия выборочной средней будет равна ;

;

.

Для оценки генеральной средней образовывают из этой же генеральной совокупности бесповторную выборку объема N случайной величины y1,y2,…,yn, выражающие значения, интересующего нас признака при отборе 1-го, 2-го, n-го члена выборки одинаково распределены и их закон распределения задается той же таблицей №1. Т.е. случайные величины x1 и y1 имеют один и тот же закон распределения.

.

Т.е. доказано, что случайные величины y1,y2 распределены одинаково. Также доказано, что такой же закон имеют и оставшиеся величины, закон распределения их распределения характеризуется таблицей №1, т.к. величины y1,y2,…,yn одинаково распределенные величины , то их математические ожидания также равны генеральной средней , а дисперсия равна генеральной дисперсии. В отличие от повторной выборки y1,y2,…,yn, зависимые случайные величины. Выборочная средняя у бесповторной выборки является средней арифметической случайных величин y1,y2,…,yn.

.

Выборочная средняя бесповторной выборки достаточно большого объема N распределена по нормальному закону , хотя и случайные величины yi зависимые.

1-й параметр случайной величины y равен генеральной средней .

.

Случайные величины yi2 также распределены одинаково и поэтому имеют одинаковые математические ожидания, поэтому

;

Математическое ожидание yi можно записать как

(3)

Рассмотрим произведение y1y2 , значение этой случайной величины является произведение всевозможных комбинаций значений случайных величин y1,y2 . Вероятности значений случайной величины находятся по теореме умножения вероятностей для зависимых событий, учитывая при этом число членов генеральной совокупности с соответствующим значением признака.

Представим это в таблице №2

y1

y2

y1y2

x1

x1

………………….

x1

x1

x2

………………………..

xm

x12

x1x2

…………………………..

x1xm

…………………

x2

x2

………………….

x2

x1

x2

………………….

xm

x1x2

x22

………………….

x2xm

………………….

……………………..

……………………….

………………

…………………

xm

xm

xm

……………………..

x1

x2

………………………..

xm

……………………….

xmx1

xmx2

…………………………..

xm2

………………

В соответствии с определением находим математическое ожидание . Перемножаем значения 3-го и4-го столбца и складываем , вынося общий множитель за скобки, находим , что

При любых i и j случайные величины yiyj имеют такие же математические ожидания, поэтому сумма M[yiyj] будет равна

Соединяем полученные результаты

(5)

Выборочная средняя бесповторной выборки является случайной величиной распределения по нормальному закону с параметрами.

, а дисперсия определяется по формуле (5).

В формуле (5) заменим N-1 на N, т.е.

(6)

При повторном и бесповторном отборе членов выборочная средняя является несмещенной и состоятельной оценкой генеральной средней.

Средние квадратические ошибки собственно-случайной выборки.

Вероятность того, что абсолютная величина отклонения выборочной средней от генеральной средней (доли) не превзойдет данного положительного числа называется доверительной вероятностью.

Доверительная вероятность определяется по формуле

Где x - выборочная средняя или выборочная доля в зависимости от цели выборки, математическое ожидание, либо генеральная средняя, либо генеральная доля , а -среднеквадратическое отклонение.

Среднеквадратические отклонения выборочной средней и выборочной доли называется среднеквадратическими ошибками.

В соответствии с результатами , получены формулы среднеквадратических ошибок

  1. Для выборочной средней повторной выборки

(1)

  1. Выборочной средней бесповторной выборки

(2)

  1. Выборочной доли повторной выборки

(3)

  1. Среднеквадратическая ошибка выборочной доли бесповторной выборки

(4)

Множитель всегда <1, поэтому среднеквадратические ошибки выборочной доли и выборочной средней в бесповторной выборки всегда меньше тех же характеристик повторной выборки того же объема. Бесповторная выборка более точна, чем повторная выборка того же объема, т.е. ее результаты характеризуются с большей вероятностью. Различие доверительных вероятностей заметно лишь тогда, когда объем выборки n составляет значительную часть объема генеральной совокупности N . В противном случае результаты повторной и бесповторной выборок в первом приближении совпадают. Точность результатов , главным образом, зависит от объема выборки и лишь незначительно от отношения .

На практике этими формулами (1-4), не пользуются , т.к. в формулах неизвестны генеральная доля и генеральная средняя. В формулах среднеквадратических ошибок генеральная дисперсия заменяется выборочной дисперсией, а генеральная доля выборочной долей.

Выборочная дисперсия для повторной выборки:

,

.

Для бесповторной :

,

,

где x и y - выборочные средние.

Теоремы

  1. Математическое ожидание выборочной дисперсии повторной выборки объема образованной для оценки генеральной средней равно

.

А для выборки ,образованной для генеральной доли p равно

, где -генеральная дисперсия.

2. Математическое ожидание выборочной дисперсии бесповторной выборки объема образованной для оценки генеральной средней равно

Для генеральной доли

Объем генеральной совокупности, как правило очень велик, поэтому дробь при .

Отсюда следует , что не выборочная дисперсия , а случайная величина

является несмещенной оценкой генеральной совокупности. Заменив в формулах с1-4 генеральную дисперсию на выборочную дисперсию , а генеральную долю p выборочной долей w , получим применяемые на практике формулы для определения среднеквадратических ошибок:

(5)

(6)

(7)

(8)

Предельная ошибка и необходимый объем собственно-случайной выборки.

Наибольшие отклонения в выборочной средней или доли от генеральной средней , которая возможна с заданной доверительной вероятностью называется предельной ошибкой выборки.

Теорема:

При заданной вероятности предельная ошибка выборки равна t -кратной величине среднеквадратической ошибке, где t - значение аргумента, при котором значение функции равно доверительной вероятности.

(1)

Среднеквадратическая ошибка определяется в зависимости от цели выборочной совокупности или способа отбора члена в нее. При этом можно использовать формулы с 5-8 , доверительная вероятность определяет вероятность выполнения неравенства , где a -математическое ожидание и генеральная средняя, -предельная средняя выборки, x -выборочная средняя или выборочная доля. Границы, в которых с заданной доверительной вероятностью заключена генеральная средняя служат , а интервал тогда - есть доверительный интервал , в котором с той же вероятностью заключена генеральная средняя. Аналогично, что границы - границы, в которых с заданной доверительной вероятностью заключена генеральная доля. Прежде чем образовывать выборочную совокупность необходимо решить вопрос о ее объеме. Найдем минимальный объем собственно-случайной выборки , с повторным отбором членов, при котором с заданной доверительной вероятностью точность оценки неизвестной генеральной средней определяется предельной ошибкой , для вывода искомой формулы , воспользуемся формулой (1)

, (2)

решить это уравнение относительно n

(3)

Поэтому вместо генеральной дисперсии используют выборочную дисперсию. Также можно получить формулу для получения повторной выборки из формулы, предназначенной для оценки неизвестной генеральной доли при заданной предельной ошибки и заданной доверительной вероятности.

(4)

В качестве p используют значения выборочной доли, полученные раннее, в тех же условиях или считают произведение .

Найти минимальный объем собственно-случайной бесповторной выборки для оценки неизвестной генеральной средней. Предельную ошибку обозначим , искомый объем обозначим через n:

;

;

;

первое слагаемое в знаменателе- это есть обратная величина необходимого объема выборки n повторной выборки, тогда ее можно заменить и из формулы получаем

;

Аналогично получаются формулы необходимого объема бесповторной выборки, образуемый для оценки неизвестной генеральной доли.

;

N-объем генеральной совокупности

;

n всегда меньше чем n.

При одинаковых предельных ошибках выборки и доверительной вероятности необходимый объем бесповторной выборки всегда меньше необходимого объема повторной выборки.