
- •Минобрнауки россии
- •Содержание
- •Раздел I теория вероятностей 8
- •Раздел II математическая статистика 73
- •Введение
- •Раздел I теория вероятностей
- •Правило суммы
- •Правило произведения
- •Формулы комбинаторики
- •Размещения без повторения
- •Перестановки без повторений
- •Сочетания без повторений
- •Размещения с повторением
- •Сочетания с повторением
- •Перестановки с повторением
- •Лекция 2. Пространство элементарных событий. Классическое определение вероятности
- •Пространство элементарных событий
- •Свойства вероятности
- •Лекция 3. Различные определения вероятностей Статистическое определение вероятности
- •Геометрическая вероятность
- •Парадокс Бертрана
- •Аксиоматическое построение теории вероятностей
- •Лекция 4. Условная вероятность. Теорема умножения. Независимые события. Формула полной вероятности
- •Независимые события. Теорема умножения
- •Формула полной вероятности
- •Формула Бейеса
- •Лекция 5. Независимые испытания. Формула Бернулли.
- •Формула Бернулли
- •Наивероятнейшее число
- •Локальная предельная теорема Муавра-Лапласа
- •Интегральная предельная теорема Лапласа
- •Лекция 6. Дискретная случайная величина и ее числовые характеристики Виды случайных величин. Способы описания дискретной случайной величины
- •Функция распределения
- •Свойства функции распределения
- •Математическое ожидание и дисперсия дискретной случайной величины
- •Свойства математического ожидания дискретной случайной величины
- •Математическое ожидание и дисперсия некоторых случайных величин
- •Лекция 7. Непрерывная случайная величина и её распределения
- •Нормальное (гауссовское) распределение
- •Равномерное распределение
- •Лекция 8. Математическое ожидание, дисперсия, моменты непрерывной случайной величины
- •Закон больших чисел. Теорема Чебышева. Центральная предельная теорема
- •Лекция 9. Некоторые модели законов распределений, наиболее распространенных в практике статистических исследований
- •1. Биномиальное распределение
- •2. Распределение Пуассона
- •3. Нормальное (гауссовское) распределение
- •4. Логарифмически-нормальное распределение
- •5. Экспоненциальное распределение
- •7. Распределение Стьюдента с степенями свободы
- •8. Распределение Фишера-Снедекора (f-распределение).
- •Раздел II математическая статистика Лекция 1. Генеральная совокупность. Выборка. Способы образования выборки. Статистическая оценка параметров распределения.
- •Задача статистической оценки параметров
- •Точечные оценки основных параметров распределений
- •Лекция 2. Законы распределения выборочных характеристик, используемые при оценке параметров. Интервальные оценки параметров распределения.
- •1. Распределение средней арифметической.
- •2. Распределение Пирсона (- хи квадрат).
- •3. Распределение Стьюдента (t-распределение).
- •Интервальная оценка параметра распределения. Понятие доверительного интервала.
- •Интервальные оценки для генеральной средней.
- •Интервальные оценки для генеральной доли
- •Интервальные оценки для генеральной дисперсии и среднего квадратического отклонения
- •Лекция 3. Проверка статистических гипотез о значении параметров распределения. Понятие статистической гипотезы и статистического критерия.
- •1. Проверка гипотезы о значении генеральной средней нормально распределённой совокупности
- •2. Проверка гипотезы о значении генеральной дисперсии нормально распределённой совокупности.
- •3. Вычисление мощности критерия
- •Мощность критерия при проверке гипотезы о значении генеральной средней
- •Мощность критерия при проверке гипотезы о значении генеральной дисперсии
- •Лекция 4 Гипотезы о виде закона распределения генеральной совокупности
- •Вычисление теоретического ряда частот
- •Понятие о критериях согласия
- •Критерий согласия Пирсона
- •Лекция 5. Элементы корреляционного анализа Задачи корреляционного анализа. Двумерная корреляционная модель
- •Примерные вопросы к экзамену
- •Задачи к экзамену
Задача статистической оценки параметров
Пусть Х – случайная величина, имеющая закон распределения F(Х,θ), где θ – параметр распределения, числовое значение которого неизвестно. Всякую однозначно определенную функцию результатов наблюдения, с помощью которой судят о значении параметра θ, называют точечной оценкой (или статистикой) параметра θ.
Всякая статистическая оценка должна удовлетворять трем требованиям, быть: несмещенной, состоятельной и эффективной.
1. Статистика θ*(Хn) называется несмещенной оценкой параметра θ, если ее математическое ожидание совпадает с θ, т.е.
Мθ*(Хn) = θ
2. Статистика θ*(Хn) называется состоятельной оценкой параметра θ ,если с ростом объема выборки n она сходится по вероятности к θ, т.е.
P{|
θ*(Хn)
– θ
| < ε}
1,
приn
3. Статистика θ*(Хn) называется эффективной оценкой параметра θ, если среди всех несмещенных оценок данного класса, она имеет наименьшую дисперсию.
Иногда вместо термина «эффективная оценка» используют и другие термины: «несмещённая оценка с минимальной дисперсией», «оптимальная оценка».
Точечные оценки основных параметров распределений
Наиболее важными числовыми характеристиками случайной величины являются математическое ожидание и дисперсия. Рассмотрим вопрос о том, какими выборочными характеристиками оцениваются эти параметры.
Будем рассматривать различные выборки случайной величины Х данного объёма n.
1. Средняя арифметическая
является несмещённой,
состоятельной и эффективной оценкой
математического ожидания (генеральной
средней)
генеральной случайной величиныХ
с конечной дисперсией, в классе всех
линейных
оценок,
т.е. оценок вида
,
где
.
2. Выборочная
дисперсия
генеральной совокупности Х
с конечной дисперсией
является смещённой
состоятельной оценкой генеральной
дисперсии
.
Несмещённой оценкой является исправленная выборочная дисперсия
,
где дробь
называется поправкой Бесселя. При малых
значенияхn
эта дробь существенно отличается от
единицы, с увеличением n
она стремится к единице. При n>50
практически нет разницы между
и
.
Замечание: Если
известно значение математического
ожидания
,
то несмещённой, состоятельной и
эффективной оценкой генеральной
дисперсии является величина
3. Если генеральная совокупность имеет биномиальное распределение, то несмещённой и состоятельной оценкой генеральной доли
,
где М – число наступлений некоторого события А, а N – объём генеральной совокупности, является выборочная доля
,
где m – частота события А в выборке, а n – объем выборки.
Пусть по результатам n наблюдений построен вариационный дискретный ряд
-
Варианты Xi
x1
x2
x3
.....
xm
Частоты ni
n1
n2
n3
.....
xm
Тогда средняя арифметическая и выборочная дисперсия вычисляются по формулам:
Отметим некоторые свойства этих величин:
1. Если все варианты увеличить в одно и тоже число k, то средняя арифметическая увеличится в k раз, а дисперсия в k2 раз.
2. Если все варианты изменить на одно и то же число c, то средняя арифметическая изменится на это же число, а дисперсия своего значения не изменит
.
3. Если все частоты увеличить в одно и то же число раз, то средняя арифметическая и дисперсия не меняются.
Из этих свойств легко получить, так называемые, формулы упрощённого вычисления:
(1)
(2)
Пример 1. Дано распределение 1000 экземпляров северной сосны по диаметру ствола:
Диаметр ствола (см) |
Количество сосен |
Диаметр ствола (см) |
Количество сосен |
14-18 |
16 |
38-42 |
115 |
18-22 |
35 |
42-46 |
71 |
22-26 |
109 |
46-50 |
36 |
26-30 |
183 |
50-54 |
19 |
30-34 |
214 |
54-58 |
5 |
34-38 |
197 |
Всего: |
1000 |
Требуется вычислить среднюю арифметическую, выборочную дисперсию, среднее квадратическое отклонение.
Решение: Для вычисления применим формулы (1) и (2). Нам потребуется вариационный ряд данной выборки. В качестве вариант возьмём середины интервалов. Число с определим по наибольшей частоте. Все вычисления оформляются в таблице: c = 32, k = 4.
Интервалы |
Середины интервалов xi |
Частоты ni |
xi - c |
|
|
|
14-18 |
16 |
16 |
-16 |
-4 |
-64 |
256 |
18-22 |
20 |
35 |
-12 |
-3 |
-105 |
315 |
22-26 |
24 |
109 |
-8 |
-2 |
-218 |
436 |
26-30 |
28 |
183 |
-4 |
-1 |
-183 |
183 |
30-34 |
32 |
214 |
0 |
0 |
0 |
0 |
34-38 |
36 |
197 |
4 |
1 |
197 |
197 |
38-42 |
40 |
115 |
8 |
2 |
230 |
460 |
42-46 |
44 |
71 |
12 |
3 |
213 |
639 |
46-50 |
48 |
36 |
16 |
4 |
144 |
576 |
50-54 |
52 |
19 |
20 |
5 |
95 |
475 |
54-58 |
56 |
5 |
24 |
6 |
30 |
180 |
Итого: |
- |
1000 |
- |
- |
339 |
3717 |
.
Замечание: для того, чтобы изучаемое свойство генеральной совокупности адекватно отражалось в выборке, она должна иметь случайный характер. Этого можно добиться разными способами. Приведём примеры некоторых из них:
1. Собственно-случайная выборка.
Суть метода можно описать следующей схемой: члены генеральной совокупности предварительно занумеровывают, и каждый номер записывают на отдельные карточки. Отбирая наудачу после тщательного перемешивания по одной карточке, получим выборку нужного объёма. Номера карточек укажут, какие члены генеральной совокупности попали в выборку. Возможны два принципиально различных подхода к образованию такой выборки в зависимости от того, возвращается отобранная карточка обратно после регистрации её номера или нет. В первом случае выборка называется повторной, во втором – бесповторной.
2. Механическая выборка.
Выборка называется механической, если члены генеральной совокупности отбираются через определенный интервал. Например, для 10% выборки отбирается каждый десятый член генеральной совокупности, для 20% - каждый пятый и т.п.
3. Типическая выборка.
Если члены генеральной совокупности предварительно разбить на группы по какому-нибудь признаку (например при изучении качества изделий целесообразно выделить изделия, производимые разными цехами, сменами, станками и т.д.), а в каждой группе произвести собственно-случайную выборку, то получим выборку, которую принято называть типической.
4. Серийная выборка.
Если указанные выше группы (серии) рассматривать, как элементы новой совокупности и из них образовывать собственно-случайную выборку, то полученная из членов выбранных серий совокупность называется серийной выборкой.
При составлении случайной выборки допускаются ошибки двух видов:
- Ошибка регистрации – так называется разница между истинным и наблюдавшимся значениями изучаемого признака. Эта ошибка может носить случайный или умышленный характер. Последнее недопустимо в исследованиях. В случае же случайной ошибки, рекомендуется провести повторную выборку.
- Ошибка репрезентативности – расхождение характеристик признака в генеральной и выборочной совокупности, связанного со случайным характером выборки. Такая ошибка всегда присутствует и задача математической статистики как раз и состоит в оценке величины этой ошибки.