
- •Лекция 1
- •1.1. Введение в теоретические основы исследования статистических выборок.
- •1.1. Введение в теоретическин основы исследования статистических выборок.
- •1.2. Подходы статистического оценивания
- •1.3. Свойства среднего
- •1.4. Комплекс задач проблемы оценивания параметров закона распределения.
- •Лекция 2
- •2.1. Статистическая устойчивость выборочных характеристик.
- •2.2. Статистические оценки и их свойства.
- •2.1. Статистическая устойчивость выборочных характеристик
- •2.2. Статистические оценки и их свойства
- •Лекция 3
- •3.2. Распределение t-Стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •3.2. Распределение t- стьюдента
- •3.4. Пример определения эмпирической дисперсии
- •Из этих условий следует, что
- •Лекция 4
- •4.1. Метод моментов Пирсона.
- •4 .2. Метод наименьших квадратов.
- •4.3. Метод максимального правдоподобия.
- •4.1. Метод моментов пирсона
- •4.2. Метод наименьших квадратов
- •4.3.Метод максимального правдоподобия
- •Лекция 5
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения.
- •5.1. Точность и достоверность оценок параметров распределения.
- •5.2. Доверительные оценки параметров распределения
- •Лекция 6
- •6.2. Гипотеза независимости и стационарности обрабатываемого ряда наблюдений.
- •6.3. Анализ резко выделяющихся наблюдений
- •6.4. Гипотеза о типе закона распределения случайной величины.
- •6.5. Гипотезу об однородности двух или нескольких выборок.
- •6.6. Гипотезы о числовых значениях параметров генеральной совокупности.
- •Лекция 7
- •7.1. Сравнение доли признака с нормативом.
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •7.1. Сравнение доли признака с нормативом
- •7.2. Сравнение статистических частот, вычисленных по двум выборкам.
- •Лекция 8
- •8.1. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (выборки незпвисимы).
- •8.2. Сравнение двух средних, произвольно распределенных генеральных совокупностей (выборки большого объема и независимы).
- •8.3. Сравнение двых средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки).
- •8.4. Сравнение выборочной средней с гипотетичесчкой генеральной средней нормальной совокупности.
1.4. Комплекс задач проблемы оценивания параметров закона распределения.
Комплекс задач можно сформулировать в следующем виде.
1. Определение понятия статистической точечной оценки и установление ее свойств. Изучение этого материала позволяет понять вероятностную природу оценки и установить критерий оптимальности выборочных характеристик параметров распределения.
2. Установление точных распределений оценок неизвестных параметров. Это позволяет провести исследование статистических свойств выборочных характеристик, а также вычислить числовые характеристики искомых оценок.
3. Синтез процедур формирования выборочных характеристик, на основе которых можно вычислить точечные оценки с наперед заданными свойствами.
4. Вычисление количества информации, которое содержится в совокупности наблюдений относительно неизвестного параметра. Успешное решение этой задачи требует знания информации Фишера и неравенства Рао-Крамера-Фрише.
5. Определение степени погрешности, которая возникает в результате замены теоретических параметров их статистическими оценками. Эта задача имеет большое прикладное значение и может быть решена на основе теории точности и достоверности оценок.
6. Установление границ области, в которой может находиться с наперед заданной вероятностью оцениваемый параметр. Статистическая оценка неизвестного параметра является случайной величиной. Установленная оценка по выборке малого объема может существенно отличаться от истинного значения параметра. Это приводит к задаче определения интервальной оценки параметров распределения с заданной вероятностью. Интервальная оценка существенно повышает информативность решения задачи статистического оценивания.
7. Определение устойчивых оценок параметров распределения. В реальных задачах статистические данные довольно часто не подчиняются нормальному закону распределения, а хорошо апроксимируются законами распределения с "длинными хвостами". Это приводит к появлению оценок, чувствительных к вариациям элементов выборки. Таким образом, актуальна задача определения робастых, т.е. устойчивых, оценок.
8. Восстановление кривых распределения. Плотность распределения является универсальной характеристикой случайной величины. Следовательно, задача определения закона распределения является актуальной в процессе обработки статистической информации и принятия решений. Определение кривой распределения позволяет сформировать вероятностную модель для параметра и решать задачу оценивания в параметрической постановке.
Лекция 2
Вопросы лекции:
2.1. Статистическая устойчивость выборочных характеристик.
2.2. Статистические оценки и их свойства.
2.1. Статистическая устойчивость выборочных характеристик
Анализ статистической информации показывает, что результаты отдельных наблюдений могут колебаться с большой амплитудой, в то время как средние из большого числа наблюдений обнаруживают при этом статистическую устойчивость. К такого рода выборочным средним относятся; выборочные моменты ( начальные и центральные );
эмпирические функции и плотности распределения; статистическая частота.
При решении практических задач важно знание условий, при выполнении которых совокупное действие многих случайных факторов приводит к результату, почти не зависящему от случая, так как это позволяет предвидеть ход явлений. Эти условия содержатся в теоремах, носящих название "Закон больших чисел". К ним относятся теоремы Чебышева и Бернулли.
Рассмотрим теорему Чебышева, используя неравенство Чебышева.
Неравенство
Чебышева. Для любой случайной величины
X,
имеющей математическое ожидание
и
дисперсию
,
справедливо неравенство
где
— любое положительное число.
Неравенство Чебышева ограничивает сверху вероятности больших отклонений случайной величины от ее математического ожидания.
Используя неравенство
Чебышева, оценим сверху вероятность
того, что случайная величина Х
с любым законом распределения отклонится
от своего математического ожидания не
меньше чем на
.
Полагая
,
получим
,
т.е. для любой случайной величины
вероятность невыполнения "правила
трех сигма" не превышает 0.111. В
действительности, для большинства
случайных величин, встречающихся на
практике, ошибка "правила трех сигма"
существенно меньше.
Воспользуемся этим неравенством и сформулируем теорему Чебышева.
Теорема Чебышева.
Если
-попарно
независимые случайные величины, причем,
дисперсии их равномерно ограничены, то
как бы мало ни было положительное число
,
вероятность выполнения неравенства
будет сколь угодно близка к единице, если число случайных величин достаточно велико.
Теорема Чебышева утверждает, что если рассматривается достаточно большое число независимых случайных величин, имеющих ограниченные дисперсии, то почти достоверным можно считать событие, состоящее в том, что отклонение среднего арифметического случайных величин от среднего арифметического их математических ожиданий будет по абсолютной величине сколь угодно малым. Это утверждение относится к обобщенной теореме Чебышева, а не к форме, полученной из предыдущего неравенства.
Теорема Чебышева была сформулирована в предположении, что случайные величины имеют различные математические ожидания. На практике возможна ситуация, когда случайные величины имеют одно и то же математическое ожидание. Если допустить, что дисперсии этих величин ограничены, то к ним можно применить теорему Чебышева.
Обозначим математическое ожидание каждой из случайных величин через а. Среднее арифметическое математических ожиданий также равно а. Сформулируем теорему Чебышева для частного случая.
Теорема Чебышева (частный случай). Если - попарно независимые случайные величины, имеющие одно и тоже математическое ожидание а, и если дисперсии этих величин равномерно ограничены, то, как бы мало
ни было число
,
вероятность выполнения неравенства
будет как угодно близка к единице, если
число случайных величин достаточно
велико.
Итак, среднее арифметическое большого числа независимых случайных величин (дисперсии которых равномерно ограничены) утрачивает характер случайной величины, что позволяет прогнозировать этот параметр с достаточно высокой степенью точности.
Рассмотрим применение теоремы Чебышева к решению следующего примера.
Пример. Для оценки физической величины производят несколько измерений и их среднее арифметическое принимают в качестве значения искомого параметра. Необходимо определить, при каких условиях этот способ измерения можно использовать. Ответ на этот вопрос дает теорема Чебышева ( ее частный случай ).
Рассмотрим результаты каждого измерения как случайные величины . К этим величинам можно применить теорему Чебышева, если: они попарно независимы; имеют одно и тоже математическое ожидание; дисперсии их равномерно ограничены.
Первое требование выполняется, если результат каждого измерения не зависит от результатов остальных. Второе требование выполняется, если измерения произведены без систематических ошибок. Третье требование выполняется, если прибор обеспечивает определенную точность измерений.
Если указанные условия выполняются, то к результатам измерений можно применить теорему Чебышева: при достаточно большом значении n вероятность выполнения неравенства как угодно близка к единице.
Таким образом,
теорема Чебышева указывает условия,
при которых описанный способ измерения
может быть применен. Отметим, что,
увеличивая число измерений, нельзя
достичь сколь угодно большой точности.
Это объясняется тем, что прибор дает
показания лишь с точностью
.
Поэтому каждый из результатов измерений,
а следовательно, и их среднее арифметическое,
будут получены лишь с точностью, не
превышающей точности прибора.