
- •.Основные понятия математической статистики. Статистический эксперимент. Виды задач математической статистики.
- •3)Некоторые распределения, использующиеся в мат.Статистике. Нормальное распределение, гамма распределение, хи – квадрат распределение.
- •5)Постановка задачи точечного оценивания параметра. Функция потерь. Риск.
- •6)Пусть х1,…,Хn –выборка из распеределения с начальными r моментами I порядка:
- •7)Регулярный эксперимент. Информация Фишера.Св-ва. Теорема о рег-ти прямого произв.Регулярн. Экспериментов
- •8) Выборка из нормального распределения. Представление Хи-квадрат распределения с помощью нормальных. Распределение Стьюдента. Распределение Фишера-Снедекора.
- •9)Постановка задачи доверительного оценивания. Простейший метод построения доверительных интервалов (без примеров).
.Основные понятия математической статистики. Статистический эксперимент. Виды задач математической статистики.
Математическая статистика занимается составлением выводов об имеющихся данных (о модели эксперимента).
Базовое вероятностное пространство (Ω,₣,Ρ)
Частный случай – распределение случайного вектора:
Ω=Х=Rn
; ₣=Дn
– борелевская
σ-алгебра
;
Ρ
– распределение
вероятностей
Получили
более мелкое пространство, которое
удобно использовать при работе с моделями
математической статистики (Х,
Дn,Ρ).
Статистический
эксперимент
– тройка объектов (Х,
Дn,Ρ),
где Ρ={Рθ,θєΘ}
- семейство вероятностей.
Стандартные предположения о семействе Ρ :
(1)
Рθ
=Рθ1
* Рθ2
…*Рθn
,
т.е. результат
наблюдений (Х1
… Хn)
є
Rn
– независимые
случайные величины при V
θєΘ
(2) Рθ1=Рθ2=…=Рθn , т.е. результат наблюдений (Х1 … Хn) є Rn – независимые одинаково распределенные случайные величины (НОРСВ).
Если (1) и (2) выполнены, то (Х1 … Хn) – выборка – набор независимых одинаково распределенных наблюдений.
В задачу математической статистики входит только анализ данных и их интерпретация.
Выбор модели определяется характером полученных данных и не входит в задачу математической статистики. Семейство вероятностей Ρ определяется целью статистических исследований (априорной информацией), поэтому Ρ может быть параметризованно по-разному.
Пусть имеется совокупность результатов эксперимента (генеральная совокупность), тогда выборка – набор элементов однородной генеральной совокупности.
Задача математической статистики – сделать выводы о характере распределения генеральной совокупности по выборке. Роль генеральной совокупности в нашей модели играет теоретическое распределение.
Рθ - теоретическое значение распределения, соответствует распределению генеральной совокупности.
Типы задач математической статистики:
Точное оценивание – по результатам наблюдений выбрать значение Рθє Ρ , которое оптимальным образом согласуется с данными.
Интервальное оценивание - по результатам наблюдений выбрать область
Θ0
(Х1
… Хn)
С Θ
т.ч. при V
θєΘ
Рθ(Θ0
(Х1
… Хn)
э
θ)≥1-α
, где α
- определенное маленькое число. Т.е.
выбор такого множества, которое накрывает
теоретическое значение параметра с
вероятностью не меньше (1-α).
Проверка статистических гипотез – по результатам наблюдений выбрать из
Н1… Нn наиболее подходящую, где Нi – взаимоисключающие гипотезы (предположения о значении параметров Нi: θєΘi ; Θi∩Θi=0 ; UΘi=Θ).
2+4)Выборочный метод. Эмпирическая функция распределения. Теорема Гливенко – Кантелли (план док-ва). Преобразование Смирнова. Теорема Колмогорова. Оценивание теоретической функции распределения эмпирической. Гистограмма и полигон частот.
Пусть (Х1 … Хn) выборка из распределения Рθ . Истинное значение Рθ - теоретическое распределение.
Эмпирическая функция распределения – функция следующего вида:
Fn(x)
= 1/n*
,
где
Т.е. ее значение в точке х равно отношению числа наблюдений меньше х к общему числу наблюдений.
Теорема (Гливенко – Кантелли)
Пусть(Х1 … Хn) выборка из распределения с ф.р. F,тогда sup|Fn(x)-F(x)| почти наверное->0
План док-ва:
доказывается
сходимость на ограниченном интервале
(т.к. F
неубывает и ограничена). Показывается,
что изменение между двумя соседними
точками мало. Доказывается, что сходимость
на концах следует из :
-> sup|Fn(x)-F(x)|->0
Преобразование Смирнова
Пусть Х случайная величина с ф.р. F (непрерывна),тогда F(x)=Y-новая с.в. имеющая равномерное распределение U(0,1), т.е.:
Если
F
строго возрастает, то
:
Теорема Колмогорова
Пусть
(Х1
… Хn)
выборка из распределения F(непрер.),тогда
, где К – распр-е Колмогорова, т.е.:
,
где
С
ростом n,
эмпирическая ф.р. приближается к
теоретической. У э.ф.р. имеется
-окрестность,
по т. Гливенко – Кантелли вероятность
того, что истинная ф.р. лежит в этой
эмпирической
-окрестности
->1 при
.
По
т. Колмогорова, вероятность того, что
истинная ф.р. лежит в
-
окрестности эмпирической стремится к
пределу K(
),
где К(х) – ф.р. Колмогорова.
Пусть
>0
– маленькое число, F
– истинная ф.р., тогда если F0=F
, где F0
предполагаемая
ф.р., то с вероятностью
, т.е.
-
доверительный интервал для теоретической
ф.р.
Гистограмма и полигон частот:
Один
из способов наглядного представления
статистических данных – Гистограмма
частот. Область значений с.в. разбивается
на равные интервалы, подсчитывается
число значений с.в. попавших в интервал
и на каждом интервале строится
прямоугольник, с основанием на этот
интервал и высотой V/(nh),
где V
– число выборочных точек попавших в
этот интервал, n
– объем выборки, h
– длина интервала. Площадь каждого
такого прямоугольника по т Бернулли
будет сходится при n->
к
вероятности попадания с.в. в интервал.
Для оценки гладких плотностей используют методику, основанную на полигоне частот – ломаной кривой, строящейся следующим образом: если построена гистограмма частот, то ординаты ее средних точек на каждом из интервалов последовательно соединяются отрезками прямых. Гистограмма и полигон – статистические аналоги теоретической плотности.