- •Математическая статистика
- •Исходные статистические данные и понятия выборки.
- •Основное требование к выборке.
- •Эмпирический закон распределения дискретных случайных величин
- •Эмпирическая функция распределения
- •Гистограмма
- •Полигон частот
- •Средняя арифметическая вариационного ряда
- •Дисперсия вариационного ряда, ее свойства
- •Правило сложения дисперсий
- •Точечные оценки неизвестных параметров распределения
- •Состоятельность и несмещенность оценок
- •Оценка для математического ожидания и дисперсии
- •Оценивание параметров распределения
- •Интервальные статистические оценки.
- •Основы теории выборочного метода
- •Собственная случайная величина для определения доли
- •Собственно-случайная выборка для определения средней
- •Проверка статистических гипотез.
- •Построение критерия проверки статистической гипотезы.
- •Понятие о критериях согласия.
- •Элементы теории корреляции
- •Общая средняя.
- •Линейная корреляционная зависимость.
- •Составление уравнений прямых регрессий
- •Не линейные корреляционные зависимости
- •Гиперболическая регрессия
- •Показательная корреляционная зависимость
- •Понятие о коэффициенте корреляции и корреляционных отношениях
- •Корреляционные отношения
- •Свойства коэффициента корреляции и корреляционных отношений
- •Свойства корреляционных отношений
- •Понятие множественной корреляции
- •Свойства совокупного коэффициента
Собственно-случайная выборка для определения средней
Пусть из генеральной совокупности распределения признака, в которой характеризуется как варианты и частоты
Таблица 1
-
xi
Ni
Pi
x1
x2
…..
xn
N1
N2
…..
Nm
,
,
Для оценки неизвестной генеральной средней образуется повторная выборка объема N. Обозначим через x1,x2,…,xn случайные величины, выражающие значения интересующего нас признака при отборе 1-го, 2-го, n-го членов выборки. Каждый раз после возврата отобранного члена восстанавливается первоначальный состав генеральной совокупности, поэтому случайные величины x1,x2,…,xn одинаково распределены и независимы.
Выборочная средняя повторной выборки , образованной для оценки неизвестной генеральной средней -это среднее арифметическое случайных величин x1,x2,…,xn.
.
Таким образом , она является суммой - независимых одинаково распределенных случайных величин, имеющих абсолютные центральные моменты 3 порядка поскольку каждая из случайных величин принимает лишь конечное значение и эти значения ограничены , поэтому согласно следствия из теоремы Ляпунова, выборочная средняя повторной выборки достаточно большого объема распределена по нормальному закону. Нужно найти параметры этого распределения. Для этого вычислим математическое ожидание и дисперсию.
(1)
Также найдем дисперсию
(2)
Обозначим
это значение как
.
Таким образом, математическое ожидание
и дисперсия одинаковы и равны генеральной
средней
и генеральной дисперсии
.
Математическое ожидание выборочной
средней равно генеральной средней, а
дисперсия выборочной средней будет
равна
;
;
.
Для оценки генеральной средней образовывают из этой же генеральной совокупности бесповторную выборку объема N случайной величины y1,y2,…,yn, выражающие значения, интересующего нас признака при отборе 1-го, 2-го, n-го члена выборки одинаково распределены и их закон распределения задается той же таблицей №1. Т.е. случайные величины x1 и y1 имеют один и тот же закон распределения.
.
Т.е. доказано, что случайные величины y1,y2 распределены одинаково. Также доказано, что такой же закон имеют и оставшиеся величины, закон распределения их распределения характеризуется таблицей №1, т.к. величины y1,y2,…,yn одинаково распределенные величины , то их математические ожидания также равны генеральной средней , а дисперсия равна генеральной дисперсии. В отличие от повторной выборки y1,y2,…,yn, зависимые случайные величины. Выборочная средняя у бесповторной выборки является средней арифметической случайных величин y1,y2,…,yn.
.
Выборочная средняя бесповторной выборки достаточно большого объема N распределена по нормальному закону , хотя и случайные величины yi зависимые.
1-й
параметр случайной величины y равен
генеральной средней
.
.
Случайные величины yi2 также распределены одинаково и поэтому имеют одинаковые математические ожидания, поэтому
;
Математическое ожидание yi можно записать как
(3)
Рассмотрим произведение y1y2 , значение этой случайной величины является произведение всевозможных комбинаций значений случайных величин y1,y2 . Вероятности значений случайной величины находятся по теореме умножения вероятностей для зависимых событий, учитывая при этом число членов генеральной совокупности с соответствующим значением признака.
Представим это в таблице №2
y1 |
y2 |
y1y2 |
|
x1
x1
………………….
x1 |
x1
x2
………………………..
xm |
x12
x1x2
…………………………..
x1xm |
…………………
|
x2
x2 ………………….
x2 |
x1
x2 ………………….
xm |
x1x2
x22 ………………….
x2xm |
|
…………………. |
…………………….. |
………………………. |
……………… |
………………… xm xm … xm |
…………………….. x1 x2 ……………………….. xm |
………………………. xmx1 xmx2 ………………………….. xm2 |
………………
|
В соответствии с определением находим математическое ожидание . Перемножаем значения 3-го и4-го столбца и складываем , вынося общий множитель за скобки, находим , что
При любых i и j случайные величины yiyj имеют такие же математические ожидания, поэтому сумма M[yiyj] будет равна
Соединяем полученные результаты
(5)
Выборочная средняя бесповторной выборки является случайной величиной распределения по нормальному закону с параметрами.
,
а дисперсия определяется по формуле
(5).
В формуле (5) заменим N-1 на N, т.е.
(6)
При повторном и бесповторном отборе членов выборочная средняя является несмещенной и состоятельной оценкой генеральной средней.
Средние квадратические ошибки собственно-случайной выборки.
Вероятность
того, что абсолютная величина отклонения
выборочной средней от генеральной
средней (доли) не превзойдет данного
положительного числа
называется доверительной вероятностью.
Доверительная вероятность определяется по формуле
Где
x - выборочная средняя или выборочная
доля в зависимости от цели выборки,
математическое ожидание, либо генеральная
средняя, либо генеральная доля , а
-среднеквадратическое
отклонение.
Среднеквадратические отклонения выборочной средней и выборочной доли называется среднеквадратическими ошибками.
В соответствии с результатами , получены формулы среднеквадратических ошибок
Для выборочной средней повторной выборки
(1)
Выборочной средней бесповторной выборки
(2)
Выборочной доли повторной выборки
(3)
Среднеквадратическая ошибка выборочной доли бесповторной выборки
(4)
Множитель
всегда <1, поэтому среднеквадратические
ошибки выборочной доли и выборочной
средней в бесповторной выборки всегда
меньше тех же характеристик повторной
выборки того же объема. Бесповторная
выборка более точна, чем повторная
выборка того же объема, т.е. ее результаты
характеризуются с большей вероятностью.
Различие доверительных вероятностей
заметно лишь тогда, когда объем выборки
n составляет значительную часть объема
генеральной совокупности N . В противном
случае результаты повторной и бесповторной
выборок в первом приближении совпадают.
Точность результатов , главным образом,
зависит от объема выборки и лишь
незначительно от отношения
.
На практике этими формулами (1-4), не пользуются , т.к. в формулах неизвестны генеральная доля и генеральная средняя. В формулах среднеквадратических ошибок генеральная дисперсия заменяется выборочной дисперсией, а генеральная доля выборочной долей.
Выборочная дисперсия для повторной выборки:
,
.
Для бесповторной :
,
,
где x и y - выборочные средние.
Теоремы
Математическое ожидание выборочной дисперсии повторной выборки объема образованной для оценки генеральной средней равно
.
А для выборки ,образованной для генеральной доли p равно
,
где
-генеральная
дисперсия.
2. Математическое ожидание выборочной дисперсии бесповторной выборки объема образованной для оценки генеральной средней равно
Для генеральной доли
Объем
генеральной совокупности,
как правило
очень велик, поэтому дробь
при
.
Отсюда следует , что не выборочная дисперсия , а случайная величина
является несмещенной оценкой генеральной совокупности. Заменив в формулах с1-4 генеральную дисперсию на выборочную дисперсию , а генеральную долю p выборочной долей w , получим применяемые на практике формулы для определения среднеквадратических ошибок:
(5)
(6)
(7)
(8)
Предельная ошибка и необходимый объем собственно-случайной выборки.
Наибольшие отклонения в выборочной средней или доли от генеральной средней , которая возможна с заданной доверительной вероятностью называется предельной ошибкой выборки.
Теорема:
При
заданной вероятности предельная ошибка
выборки равна t -кратной величине
среднеквадратической ошибке, где t -
значение аргумента, при котором значение
функции
равно доверительной вероятности.
(1)
Среднеквадратическая
ошибка определяется в зависимости от
цели выборочной совокупности или способа
отбора члена в нее. При этом можно
использовать формулы с 5-8 , доверительная
вероятность определяет вероятность
выполнения неравенства
, где a
-математическое ожидание и генеральная
средняя,
-предельная
средняя выборки, x
-выборочная средняя или выборочная
доля. Границы, в которых с заданной
доверительной вероятностью заключена
генеральная средняя служат
,
а интервал тогда - есть доверительный
интервал , в котором с той же вероятностью
заключена генеральная средняя. Аналогично,
что границы
-
границы, в которых с заданной доверительной
вероятностью заключена генеральная
доля. Прежде чем образовывать выборочную
совокупность необходимо решить вопрос
о ее объеме. Найдем минимальный объем
собственно-случайной выборки , с повторным
отбором членов, при котором с заданной
доверительной вероятностью точность
оценки неизвестной генеральной средней
определяется предельной ошибкой
,
для вывода искомой формулы , воспользуемся
формулой (1)
, (2)
решить это уравнение относительно n
(3)
Поэтому
вместо генеральной дисперсии используют
выборочную дисперсию. Также можно
получить формулу для получения повторной
выборки из формулы, предназначенной
для оценки неизвестной генеральной
доли при заданной предельной ошибки
и заданной доверительной вероятности.
(4)
В
качестве p используют значения выборочной
доли, полученные раннее, в тех же условиях
или считают произведение
.
Найти
минимальный объем собственно-случайной
бесповторной выборки для оценки
неизвестной генеральной средней.
Предельную ошибку обозначим
,
искомый объем обозначим через n:
;
;
;
первое слагаемое в знаменателе- это есть обратная величина необходимого объема выборки n повторной выборки, тогда ее можно заменить и из формулы получаем
;
Аналогично получаются формулы необходимого объема бесповторной выборки, образуемый для оценки неизвестной генеральной доли.
;
N-объем генеральной совокупности
;
n всегда меньше чем n.
При одинаковых предельных ошибках выборки и доверительной вероятности необходимый объем бесповторной выборки всегда меньше необходимого объема повторной выборки.
