- •Математическая статистика Введение в математическую статистику
- •Предмет математической статистики
- •Возникновение и развитие математической статистики
- •Приложения математической статистики
- •Общая статистическая модель
- •Параметрические и непараметрические задачи
- •Случайные величины и статистики
- •Достаточные статистики
- •Критерий факторизации.
- •Полная достаточная статистика
- •Выборка и эмпирическая мера
- •Выбор статистической модели
- •Классическая статистическая модель.
- •Эмпирическая функция распределения
- •Выборочные характеристики
- •Свойства выборочных характеристик
- •Моделирование выборок на компьютере
- •Датчик случайных чисел
- •Моделирование дискретных распределений
- •Моделирование непрерывных распределений
- •Теория оценивания
- •Определение оценки и критерии качества оценок
- •Общие методы построения оценок
- •Метод подстановки и метод моментов
- •Метод максимального правдоподобия
- •Улучшение оценок
- •Теорема Рао-Блэкуэлла-Колмогорова
- •Построение оптимальных оценок
- •Несмещенные оценки с минимальной дисперсией
- •Эффективные оценки
- •Состоятельность и асимптотическая нормальность оценок
- •Асимптотическая нормальность оценок, полученных методом подстановки
- •Состоятельность и асимптотическая нормальность оценок, полученных методом максимального правдоподобия
- •Теория статистических решений
- •Основные понятия теории статистических решений
- •Байесовский подход
- •Допустимость байесовских оценок
- •Проверка двух простых гипотез
- •Байесовский подход
- •Наиболее мощный критерий. Лемма Неймана- Пирсона
- •Проверка сложных гипотез
- •Равномерно наиболее мощный критерий.
- •Проверка непараметрических гипотез. Критерии согласия
- •Критерий знаков
- •Состоятельность критерия
- •Критерий Колмогорова
- •Критерий хи-квадрат
- •Построение доверительных множеств и интервалов Постановка задачи
- •Методы построения доверительных множеств и интервалов
- •Случайные величины, свободные от распределения
- •Асимптотические доверительные интервалы
- •Доверительные интервалы для параметров нормального распределения
- •Примеры решения статистических задач в общей статистической модели.
- •Линейная регрессионная модель
- •Оценка матрицы переходных вероятностей конечной цепи Маркова
- •Оценка параметра пуассоновского процесса
Возникновение и развитие математической статистики
Первые исследования в области математической статистики встречаются у Д.Бернулли и Эйлера в связи с исследованием оценок, построенных по статистическим данным. Ряд основных понятий математической статистики был введен Лапласом, Лежандром и Гауссом. В конце 19 – начале 20 века большой вклад в развитие математической статистики внесли Гальтон, Пирсон, затем Фишер, Нейман, Крамер. Формальное описание математической статистики в терминах теории статистических решений дал Вальд. Среди российских ученых наибольший вклад в развитие математической статистики внесли Марков, Романовский, Колмогоров, Смирнов, Слуцкий, Большев.
Приложения математической статистики
|
Априорные сведения, – т. е. доопытные, имеющиеся до проведения опыта, до получения исследуемых статистических данных и, следовательно, не основанные на них, сведения. Часто априорные сведения также извлечены из ( предшест-вующих) статистических данных. |
Возможность и степень глубины применения методов математической статистики обусловлена, во многом, априорными сведениями (предположениями) о природе статистических данных. Наиболее полно методы математической статистики применяются в том случае, когда априорные сведения свидетельствуют о наличии статистической закономерности в данных, т.е. можно считать, что статистические данные получены соответствии с некоторой вероятностной моделью. Практически важными примерами таких ситуаций являются статистические задачи в теории азартных игр и лотерей, задачи обработки результатов научных и технических измерений, задачи контроля качества продукции, задачи оценки надежности технических систем и программного обеспечения, статистические задачи теории связи и телекоммуникаций, статистический анализ транспортных потоков, некоторые задачи криптографии и теории защиты информации, некоторые демографические, социологические и экономические задачи, исследование факторов риска в медицине и экологии, статистические задачи в теории страхования. В этом случае теория позволяет предложить обоснованные, и часто, оптимальные в некотором смысле, методы обработки статистических данных, оценить точность и достоверность полученных выводов, прогнозов и решений. |
Много практических задач нельзя считать полностью соответствующими вероятностным моделям. Это в частности, задачи прогнозирования экономических показателей (котировок акций, курсов валют, индексов и т.п.). Предположение о наличии статистической закономерности в данных для таких задач не является очевидным или не может быть обосновано теоретически. Применение методов математической статистики для обработки таких данных возможно, но формальное использование утверждений, полученных в строгих предположениях конкретных вероятностных моделей, для оценки точности и достоверности полученных выводов, недопустимо. В этих случаях степень доверия к выводам должна определяться исходя из других соображений.
Общая статистическая модель
Определение.
Назовем общей статистической моделью следующий математический объект
![]()
где
- измеримое пространство,
- некоторое семейство вероятностных
мер на
.
В случае, когда семейство
состоит из одной вероятностной меры
,
статистическая модель превращается в
вероятностное пространство![]()
Одной из основных
задач математической статистики является
задача разумного выбора меры
из семейства
на основании наблюдения значения
,
произошедшего в опыте, произведенном
в соответствии с моделью
.
При этом результат опыта (наблюдение)
известен, относительно вероятностной
меры
известно лишь, что![]()
В данной модели
представляет собой статистические
данные, семейство
- априорные сведения.
Пример.
Рассмотрим опыт, состоящий в бросании несимметричной монеты 1 раз.
Тогда
,
(единица интерпретируется как выпадение
монеты гербом вверх)
Обозначим
- вероятность выпадения монеты гербом
вверх,
-вероятность на
,
соответствующую вероятности выпадения
гербом вверх
.
Предположим, что
семейство
состоит из двух вероятностных мер
и
,
тогда следующий способ выбора вероятностной
меры в зависимости от значения
будет разумным:
Если
,
то выбираем![]()
Если
,
то выбираем![]()
Разумность данного способа выбора состоит в том, что при его применении мы никогда не ошибемся.
Предположим теперь,
что семейство
состоит из двух вероятностных мер
и
,
тогда следующий способ выбора вероятностной
меры в зависимости от значения
также будет разумным:
Если
,
то выбираем![]()
Если
,
то выбираем![]()
Разумность данного способа выбора состоит в том, что правильное решение принимается с вероятностью 0,9 (вероятность ошибки 0,1) независимо от того, какая в вероятностная мера реализуется в эксперименте. Три оставшихся способа выбора
2)Если
,
то выбираем![]()
Если
,
то выбираем![]()
3) Всегда выбираем
![]()
4) Всегда выбираем
![]()
имеют максимальную вероятность ошибки больше, либо равную 0,9
Если семейство
состоит из двух вероятностных мер
и
,
тогда разумность способа выбора:
если
,
то выбираем![]()
если
,
то выбираем![]()
представляется
сомнительной, потому что вероятность
ошибки не меньше 0,89. Более того, три
оставшихся способа выбора имеют еще
большие максимальные вероятности
ошибок. В этом случае содержательные
выводы о
по наблюдению
сделать невозможно, т.е. представленных
статистических данных для решения
задачи недостаточно.
Данный пример показывает, что, даже в простейшем случае, абсолютно достоверные выводы на основании статистических данных сделать, вообще говоря, невозможно.
Математическая статистика предлагает критерии качества выводов, позволяющие выбрать разумный или даже оптимальный, в некотором строго определенном смысле, способ обработки и интерпретации данных, установить точность и достоверность выводов, определить объемы статистических данных, необходимые для решения задачи с заданной точностью и достоверностью
