
Ответы на контрольные вопросы
Что называется генеральной совокупностью?
Пусть X – некоторая случайная величина. Числа x1, x2,x3…,xn, являющиеся значениями X, называются её реализацией и образуют статистическую (генеральную) совокупность.
Что называется выборкой? В чем состоит репрезентативность выборки?
Выбранные из генеральной совокупности элементы образуют выборку S={ x1, x2,x3…,xn }. Репрезентативность выборки состоит в том, что характеристики выборки соответствуют характеристикам генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана. Можно утверждать, что выборка репрезентативна, если она (выборка) осуществлена случайно.
Как строится вариационный ряд?
Вариационный ряд — упорядоченная по величине последовательность выборочных значений x1, x2,x3…,xn наблюдаемой случайной величины, т.е. x(1) ≤ x(2), x(2) ≤ x(3) и т.д..
Какое распределение называется выборочным? Выборочным распределением называется распределение дискретной случайной величины, принимающей значения х1, х2, …, хn с вероятностями
.
Как строится гистограмма? Полигон? График выборочной функции распределения?
Гистограмма – ступенчатая фигура, состоящая из прямоугольников, основаниями которых являются случайные частичные интервалы длинной b, а высоты равны отношению ni/b или ni. Для построения на оси абсцисс откладываются частичные интервалы длинной b, а над ними проводятся отрезки, параллельные оси абсцисс на расстоянии ni/b или ni от неё. Полигон – ломаная линия, отрезки которой соединяют точки (z1, n1),…, (zk, nk). для построения на оси ординат откладываются значения частот ni, а на оси абсцисс – середины интервалов zi. Точки (zi, ni) соединяются отрезками.
Как вычисляется выборочное среднее? Выборочная дисперсия? Выборочное стандартное отклонение? Выборочный центральный момент?
Выборочное
среднее характеризует наиболее вероятное
значение ВСВ и определяется как:
xср
=
Выборочная
дисперсия характеризует наиболее
вероятную степень отклонения xi
от xср и
определяется как:
Dx
=
=
(несмещенная)
D*x
=
=
(смещенная)
Выборочное стандартное отклонение определяет среднеквадратическую погрешность xi если за точное значение принять xср и определяется как:
σ
=
Выборочный центральный момент определяется как:
Mk
=
В чем состоят особенности вычислений числовых характеристик для группированного ряда?
Для
вычислений
числовых характеристик группированного
ряда
Как определяется выборочная мода? Медиана?
Выборочной модой dx является элемент выборки, встречающийся с наибольшей частотой.
Выборочная
медиана hx
– число, которое делит вариационный
ряд на 2-е части, содержащие равное число
элементов. Если n – нечетное
число (n=2k+1),
то hx=
xk+1.
Если n – четное число
(n=2k), то hx=
(xk
+ xk+1).
Как вычисляется и что характеризует коэффициент асимметрии выборки? Коэффициент эксцесса?
Коэффициент асимметрии А характеризует скошенность графика функции плотности f(x) относительно графика функции плотности для СВ, распределенной по нормальному закону распределения. При А=0 – график симметричен,
А>0 – вытянута правая часть графика,
А<0 – вытянута левая часть графика.
A
=
=
Коэффициент эксцесса E – степень остроты вершины графика по отношению к графику f(x) для СВ, распределенной но нормальному закону распределения.
E=0 – график совпадает с графиком нормального распределения,
E>0 – вершина более острая,
E<0 – вершина менее острая.
E
=
=
Какие оценки параметров называются точечными? Перечислите основные свойства точечных оценок. Точечной оценкой θ* параметра θ называется приближенное значение этого параметра по выборке. Основные свойства:
Состоятельность. Оценку называют θ* состоятельной, если она обладает следующими свойствами:
для любого
> 0
На практике применяют следующие свойства:
Несмещенность. θ* - несмещенная оценка для θ, если
.
Эффективность. θ* - эффективная оценка для θ, если в классе линейных несмещенных оценок θ* обладает линейной дисперсией.
Каковы точечные оценки математического ожидания и дисперсии? Точечной оценкой математического ожидания является выборочное среднее. Точечной оценкой дисперсии является выборочная дисперсия.
В чем состоит метод максимального правдоподобия? Метод максимального правдоподобия состоит в том, что в качестве оценки неизвестного параметра θ принимается значение
, доставляющее максимум функции правдоподобия L(θ)=
.
Доказать несмещенность и состоятельность выборочной средней как оценки математического ожидания. xср = Рассмотрим эту статистику как функцию выборочного вектора (X1, …, Xn). По определению выборочного вектора имеем: M[Xi] = m и D[Xi]= σ2, i = 1,2,…,n, причем Xi – независимые в совокупности случайные величины. Следовательно, M[Xi] = M[ ] =
=
= m D[Xi] = D[ ] =
=
=
Отсюда получаем, что xср – несмещенная оценка m, и так как D[xср]
0 при n
, то xср является состоятельной оценкой математического ожидания m генеральной совокупности.
Как определяется несмещенная дисперсия? Dx = =
Перечислите основные распределения, используемые в статистических расчетах. Как определяются квантили этих распределений? От чего они зависят?
Распределение Стъюдента
Нормальное распределение
Распределение Фишера
Распределение “хи-квадрат”
Квантили этих распределений табулированы и зависят от доверительной вероятности и степеней свободы.
Как строится доверительный интервал для математического ожидания? Дисперсии?
Используя формулу , получаем доверительный интервал для математического ожидания. В формуле:
Выборочное
среднее, S2
-
дисперсия несмещенная,
S=
стандартное
отклонение,
- уровень значимости, n
- объем выборки,
квантиль
распределения Стьюдента.
Можно
утверждать, что с вероятностью
математическое ожидание лежит в пределах
от
до
.
Используя
формулу
,
получаем
доверительный интервал для дисперсии.
В формуле:
S2 -дисперсия несмещенная, - уровень значимости, n - объем выборки, квантиль распределения “хи-квадрат”.
Можно
утверждать, что с вероятностью
дисперсия лежит в пределах от
до
.
Какая гипотеза называется нулевой? Альтернативной? В чем состоят ошибки первого и второго рода? Нулевой гипотезой H0 называют проверяемую гипотезу. Альтернативной гипотезой H1 называют гипотезу, которая рассматривается наряду с нулевой, и принимается в случае её отклонения (отклонения нулевой гипотезы).
Ошибкой первого рода называется ошибка, состоящая в том, что гипотеза H0 отклоняется, в то время как она верна.
Вероятность такой ошибки: P(Zв ∈Vk|H0)=α
Ошибкой второго рода называется ошибка, состоящая в том, что гипотеза
H0 принимается, в то время как она не верна.
Вероятность такой ошибки: P(Zв ∈V\Vk|H1)=β
В какой последовательности проводится проверка параметрической гипотезы?
Формулируются нулевая H0 и альтернативная H1 гипотезы. Правило, по которому принимается решение принять или отвергнуть нулевую гипотезу называют критерием K и задают некоторой случайной выборочной величиной.
Выбирают статистику Z критерия K для проверки нулевой гипотезы.
Назначают уровень значимости α. α равна вероятности попадания критерия во множество значений V статистики Z при условии H0.
Определяют выборочное распределение статистики Z при условии, что нулевая гипотеза верна.
Определяют критическую область Vk.
Вычисляют выборочное значение статистики Z=Zв.
Принимают статистическое решение. Если Zв принадлежит критической области Vk, то нулевая гипотеза отклоняется. Если Zв принадлежит области V и не принадлежит критической области Vk, то нулевая гипотеза принимается как согласующаяся с результатами наблюдений.
Как проверяется гипотеза о равенстве двух дисперсий, если математические ожидания известны? Неизвестны?
Используется предыдущий алгоритм.
H0
–
.
Если
математические ожидания известны, то
в качестве Z
,
,
распределение Z:
F(n1
n2),
область
принятия нулевой гипотезы для двустороннего
критерия:
,
альтернативная
гипотеза H1
–
и область принятия гипотезы H0
для правостороннего критерия:
.
Если математические ожидания неизвестны, используется критерий Бартлетта.
Какие критерии используются для проверки гипотез о виде распределения? В чем состоит критерии согласия хи-квадрат?
Для
проверки гипотез о виде распределения
используется критерий согласия, критерий
нормальности(частный случай критерия
согласия), критерий
Колмогорова-Смирнова,
критерий
хи-квадрат
(Пирсона), критерий
омега-квадрат
(фон Мизеса). Критерий согласия хи-квадрат
состоит в том, что для проверки критерия
вводится статистика:
где
—
предполагаемая вероятность попадания
в k-й
интервал,
—
соответствующее эмпирическое значение
частоты, nk —
фактическая частота интервала k,
n —
полный объём выборки. Если
полученная статистика превосходит
квантиль
закона
распределения
заданного
уровня значимости
α с (k-p-1)
степенями
свободы, где
k—
число наблюдений или число интервалов
(для случая интервального
вариационного
ряда), а p—
число оцениваемых параметров
закона
распределения,
то гипотеза H0
отвергается. В противном случае гипотеза
принимается на заданном уровне значимости
α.
.