
- •Экзаменационный билет № 1
- •Основные задачи теории выборки
- •Экзаменационный билет № 3
- •Экзаменационный билет № 4
- •Доверительная вероятность
- •Средняя квадратическая и предельная ошибки выборки
- •Статистическая гипотеза и общая схема ее проверки
- •Бесповторный отбор:
- •Проверка гипотезы о равенстве дисперсий двух генеральных совокупностей
- •Статистическая и корреляционная зависимости между переменными
- •Коэффициент корреляции и его свойства
- •Основные задачи теории корреляции и регрессионного анализа
- •Парная регрессия
Экзаменационный билет № 1
Закон больших чисел в теории вероятностей утверждает, что эмпирическое среднее (среднее арифметическое) конечной выборки из фиксированного распределения близко к теоретическому среднему (математическому ожиданию) этого распределения. В зависимости от вида сходимости различают слабый закон больших чисел, когда имеет место сходимость по вероятности, и усиленный закон больших чисел, когда имеет место сходимость почти наверняка.
Лемма Маркова гласит [6]: если случайная величина Х не принимает отрицательных значений, то для любого положительного числа α справедливо следующее неравенство: Р (Х > α) ≤ М (х) / α, (13) где М (х) – математическое ожидание, то есть среднее значение случайной величины; Х – любая случайная величина. Неравенство Чебышева имеет вид: Р(|х - х| > ε) ≤ σ²/ε². (14) Оно позволяет находить верхнюю границу вероятности того, что случайная величина Х отклонится в обе стороны от своего среднего значения на величину больше ε. Эта вероятность равна или меньше (как максимум равна, не больше), чем σ²/ε², где σ² - дисперсия, исчисляемая по формуле: σ² = Σ (х – х)² / n. (15) Если нас интересует вероятность отклонения только в одну сторону, например, в большую, то вышеприведенное неравенство Чебышева надо было бы записать так: Р ((х – х) > ε) ≤ σ² / (ε²*2).
Д о к а з а т ь е л ь с т в о.
Проведем доказательство для дискретной случайной величины способом, получившим название метода урезания .
Пусть | x1|, | x2 |, ..., | xn | - есть упорядоченная совокупность всех значений случайной величины x , с соответствующими вероятностными
pi = P{| x | = | xi | }, причем å pi = 1.
Не нарушая общности доказательства, можно допустить, что абсолютные значения случайной величины x расположены в порядке убывания. Выберем произвольное e >0 и предположим, что первые r значений совокупности не меньше e (r £ n) . Запишем следующее неравенство:
| x1 | p1 + | x2 | p2 + ... + | xr | pr £ | x1 | p1 + ... + | xr | pr + ... + | xn | pn = M | x | .
Следовательно,
Заменяя в левой части последнего неравенства значение |xi| числом e , получим усиленное неравенство:
e × pi £ M
| x | или
.
Левая часть выражает вероятность того, что модуль случайной величины принимает значение, не меньшее e , т.е.
. n
Основные задачи теории выборки
При применении выборочного наблюдения возникают три основные задачи:
• определение объема выборки, необходимого для получения требуемой точности результатовс заданной вероятностью;
• определение возможного предела ошибки репрезентативности, гарантированного с заданнойвероятностью, и сравнение его с величиной допустимой погрешности.
• определение вероятности того, что Ошибка выборки не превысит допустимой погрешности.
Все эти задачи решаются на основе теоремы Чебышева, согласно которой Р {[ х - ? | < ε } ≥ 1 -h, когда п - достаточно большое число; ε и h — сколь угодно малые положительные числа.
Экзаменационный билет № 2
Неравенство Чебышева
Нера́венство Чебышёва в теории вероятностей утверждает, что случайная величина в основном принимает значения близкие к своему среднему. Более точно, оно даёт оценку вероятности, что случайная величина примет значение далёкое от своего среднего. Неравенство Чебышёва является следствием неравенства Маркова.
Пусть
случайная величина определена
на вероятностном
пространстве
,
и еёматематическое
ожидание
и дисперсия
конечны.
Тогда
,
где .
Если ,
где
-
стандартное отклонение и
,
то получаем
.
В
частности, случайная величина с конечной
дисперсией отклоняется от среднего
больше, чем на стандартных
отклонения с вероятностью меньше
.
Она отклоняется от среднего на
стандартных
отклонения с вероятностью меньше
.
Проблемы статистических выводов традиционно делятся на проблемы оценивания и проверку гипотез. Главное различие между этими двумя проблемами состоит в том, что при оценивании мы должны определить величину параметра или нескольких параметров. В то время как при проверке гипотез мы должны решить: принять или отвергнуть специфическую величину (или ряд специфических величин) параметра или нескольких параметров.
В общем виде задача оценки параметров формулируется следующим образом.
Пусть распределение признака Х - генеральной совокупности - задается функцией вероятности f(x, θ) = P(X=xi) для дискретной случайной величины или плотностью вероятностей для непрерывной случайной величины, которая содержит неизвестный параметр θ.
Для вычисления параметра θ используют выборку x1, x2, ..., xn, каждая из которых имеет один и тот же закон распределения, что и признак Х.
Оценкой θn параметра θ называют всякую функцию результатов наблюдений (иначе - статистику), с помощью которой делают вывод о значении параметра θ:
θn = θn(x1, x2, ..., xn).
Так как x1, x2, ..., xn - случайные величины, то и оценка θn является случайной величиной, которая зависит от закона распределения и объема выборки n. Оцениваемый параметр θ является постоянной величиной.
Всегда
существует множество функций от
результатов наблюдений x1, x2,
...xn,
которые можно предложить в качестве
оценки параметра θ. Например, для
математического ожидания в качестве
оценки θn по
выборке можно взять среднюю арифметическую
результатов наблюдений ,
моду M0,
медиану Me и
т. д.
Какими свойствами должна обладать оценка θn?
Так как θn - случайная величина, то невозможно предсказать индивидуальное значение оценки в данном частном случае. Поэтому о качестве оценки следует судить не по ее индивидуальным значениям, а по распределению ее значений при достаточно большом числе испытаний, т. е. по выборочному распределению оценки.