
- •1. Генеральная и выборочная совокупности. Варианта и вариационный ряд. Статистическое распределение выборки.
- •2. Полигон частот и гистограмма частот и относительных частот. Эмпирическая функция распределения. Выборочная плотность распределения.
- •3. Выборочная средняя и выборочная дисперсия.
- •4. Cтатистическое оценивание числовых характеристик. Несмещенность.
- •5. Точечная оценка математического ожидания генеральной совокупности по выборочной средней. Ее несмещенность.
- •6. Точечная оценка дисперсии, ее смещенность. Исправленная выборочная дисперсия.
- •7. Понятие о точечных оценках параметров распределения. Метод моментов получения точечных оценок параметров распределения случайных величин.
- •8. Метод моментов для построения оценок параметров равномерного распределения, нормального распределения, показательного распределения.
- •9. Интервальные оценки, доверительный интервал, доверительная вероятность.
- •Линейная регрессия (в статистике):
- •15. Проверка гипотезы о законе распределения. Критерий Пирсона.
- •Однофакторная дисперсионная модель имеет вид:
9. Интервальные оценки, доверительный интервал, доверительная вероятность.
Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.
Пусть найденная
по данным выборки величина θ* служит
оценкой неизвестного параметра θ. Оценка
θ* определяет θ тем точнее, чем меньше
,
т. е. чем меньше δ в неравенстве
<
δ, δ>0. Т. к. θ* - случ. величина, то и
-
случ. величина, поэтому неравенство
<
δ при заданном δ может выполняться
только с некоторой вероятностью.
Доверительной вероятностью (надежностью) оценки θ* параметра θ называется вероятность γ, с которой оценивается неравенство < δ. Чаще всего γ задается значениями 0,95 и выше и определяется δ. Неравенство < δ можно записать в виде: - δ< θ-θ*< δ или θ*-δ< θ<θ*+δ.
Доверительным интервалом называется интервал (θ*-δ; θ*+δ), который покрывает неизвестный параметр θ с заданной надежностью γ.
Теорема: если генеральная совокупность подчиняется нормальному закону распределения, то для доверительной вероятности и доверительного интервала справедливы формулы:
1) Интервальной оценкой (с надежностью γ) математического ожидания α нормально распределенного количественного признака Х по выборочной средней в при известном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал: в – t(σ/√n) < α< в + t(σ/√n), где t(σ/√n)= δ – точность оценки, n – объем выборки, t – значение аргумента функции Лапласа Ф(t) (определяется по таблице), при котором Ф(t)= γ/2; при неизвестном среднем квадратическом отклонении σ и объеме выборки n<30: в – t γ (s/√n) < α< в + t γ (s/√n), где s – исправленное выборочное среднее квадратическое отклонение, t γ находят по таблице по заданным n и γ.
Вероятность
того, что в результате испытания значение
отклонения выборочного среднего от
математического ожидания будет меньше
t(σ/√n)
или t
γ
(s/√n):
Р(
<
t(σ/√n))
= 2Ф(t)
или Р(
<t
γ
(s/√n))
= γ.
2) Интервальной оценкой (с надежностью γ) среднего квадратического отклонения σ нормально распределенного количественного признака Х по исправленному выборочному среднему квадратическому отклонению s служит доверительный интервал: s(1-q) < σ < s(1+q) при q<1 и 0 < σ < s(1+q) при q>1, где q – объем выборки, находят по таблице по заданным n и γ.
Р(
<
sq) = γ
11. Интервальная оценка математического ожидания случайной величины, распределенной по нормальному закону, при известном среднем квадратическом отклонении σ.
Интервальной называют оценку, которая определяется двумя числами –концами интервала, покрывающего оцениваемый параметр.
Интервальной оценкой (с надежностью γ) математического ожидания a нормально распределенного количественного признака Х по выборочной средней хв при неизвестном среднем квадратическом отклонении σ генеральной совокупности служит доверительный интервал
xв-tγ(s-√n)<a<xв+ tγ(s-√n), где s-«исправленное» выборочное среднее квадратическое отклонение, tγ находят по таблице.
Пример:
Пусть случ. величина Х имеет нормальное распределение и известно ее среднее квадратическое отклонение σх. Требуется найти доверительный интервал, покрывающий математическое ожидание Мх с надежностью γ, с учетом полученного значения выборочного среднего в.
Выборочная средняя
является случ. величиной, поэтому
в=
.
М(
)=Мх
, σ(
)=σх/√n.
Будем считать, что вероятность попадания
выборочного
среднего в некоторую еще неизвестную
δ-окрестность математического ожидания
равна γ: Р(
<δ)
= γ. Для нормального распределения случ.
величины Х: Р(
<δ)
= 2Ф(
),
где Ф(
)
– функция Лапласа в точке
.
Т. к. выборочное среднее как среднее
арифметическое нормально распределенных
случ. величин Х1,
Х2,
…Хn
распределено нормально, получаем: Р(
<δ)
= 2Ф(δ√n/σх)
= 2Ф(z),
где z=δ√n/σх.
Отсюда δ=z
σх
/√n.
Р(
<z
σх
/√n)
= 2Ф(z)
или Р(
-
z
σх
/√n
< Mx
< (
+
z
σх
/√n)
= γ. Доверительный интервал (
-
z
σх
/√n;
+
z
σх
/√n)
покрывает неизвестное Мх
с надежностью γ. 2Ф(z)
= γ, значит Ф(z)
= γ/2. По таблице функции Лапласа находим
z,
соответствующее значению Ф(z)
= γ/2.
12. Построение доверительного интервала для дисперсии генеральной совокупности.(этот материал из Интернета, не однозначный, возможно не верный, в книгах нет, и в лекциях тоже)
Доверительный
интервал для дисперсии
Определяют
доверительный интервал в такой
последовательности: вычисляют параметр
выборки
,
выбирают доверительную вероятность
определяют
соответствующее выбранному значению
числом
из таблицы табулированных значений
стандартного нормального распределения;
вычисляют доверительный интервал
.
13. Регрессионный анализ. Основные положения регрессионного анализа:
Регрессионный анализ – статистический метод, используемый для исследования отношений между двумя величинами.
Регрессия в математической статистике – зависимость среднего значения одной величины (y) от другой величины (или нескольких величин) x. В регрессионной модели одному и тому же значению величины x могут соответствовать несколько значений величины y, иными словами, при фиксированном значении x величина y имеет некоторое случайное распределение.
Регрессионный анализ используется для определения общего вида уравнения регрессии (наиболее часто используется линейная модель), оценки параметров этого уравнения, а также проверки различных статистических гипотез относительно регрессии.