
- •Математическая статистика
- •1. Первичная обработка результатов измерений
- •1.1. Выборка и её вариационный ряд. Порядковые статистики. Статистический ряд результатов измерений
- •1.2. Гистограмма и полигон частот
- •1.3. Статистическая функция распределения
- •2. Точечные оценки параметров
- •2.1. Понятие о точечном оценивании параметров. Основные свойства оценок
- •2.2. Точечные оценки математического ожидания и дисперсии
- •3. Интервальные оценки параметров
- •3.1. Понятие об интервальном оценивании параметров
- •3.2. Построение доверительных интервалов для математического ожидания и дисперсии нормально распределённой св
- •4. Проверка статистических гипотез
- •4.1. Основные определения и общая схема проверки
- •4.2. Критерий согласия Пирсона
Математическая статистика
Предметом математической статистики является изучение методов сбора, систематизации и обработки экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. К основным задачам математической статистики относятся следующие:
1) задача нахождения неизвестного закона распределения СВ по статистическим данным;
2) задача нахождения неизвестных параметров распределения или числовых характеристик СВ;
3) задача проверки правдоподобия гипотез о законах или параметрах распределения СВ.
1. Первичная обработка результатов измерений
1.1. Выборка и её вариационный ряд. Порядковые статистики. Статистический ряд результатов измерений
Пусть некоторая СВ Х наблюдается
(измеряется) n раз. Это означает, что
эксперимент состоит в последовательном
наблюдении (измерении) СВ
,
где
– СВ, соответствующая результату i-го
наблюдения (измерения). Предполагается,
что наблюдения (измерения) проводятся
независимо друг от друга и условия
проведения эксперимента не изменяются
при переходе от одного измерения к
другому, т.е.
– независимые СВ, имеющие тот же закон
распределения, что и СВ Х.
Измеряемая СВ Х в математической
статистике называется генеральной
совокупностью, а соответствующий ей
случайный вектор
– случайной выборкой объёма n
из генеральной совокупности Х.
Числовой вектор
,
полученный в конкретной серии
последовательных измерений, называется
реализацией случайной выборки или
просто выборкой измерений СВ Х.
Вариационным рядом выборки
называется числовой вектор
,
компонентами которого являются элементы
выборки, расположенные в порядке
неубывания, т.е. имеет место
.
Величина
называется размахом выборки. Поскольку
значения
случайным образом меняются в различных
сериях измерений, то их можно считать
реализацией некоторых СВ
,
удовлетворяющих условию
.
Случайная величина
называется i-й порядковой
статистикой, а случайный вектор
– вариационным рядом случайной выборки.
При большом объёме n выборка перестаёт быть наглядной формой представления результатов измерений СВ Х. Поэтому на практике результаты измерений обычно представляют в виде статистического ряда.
Сначала рассмотрим случай, когда Х
– дискретная СВ. Пусть выборка
содержит k различных элементов
,
записанных в порядке возрастания, при
этом
встречается
раз, где
.
Число
называется частотой элемента
,
при этом
.
Статистическим рядом называется
последовательность пар
,
,
которая обычно записывается в виде
таблицы:
-
Z
...
...
При достаточно большом объёме выборки статистический ряд может служить статистическим аналогом ряда распределения дискретной СВ Х.
Рассмотрим случай, когда Х –
непрерывная СВ. Построив вариационный
ряд выборки
,
возьмём произвольный интервал числовой
прямой, охватывающий все элементы
выборки с небольшим запасом. Разобьём
этот интервал на k непересекающихся
интервалов
,
.
Пусть
– число элементов выборки, попавших в
i-й интервал (
),
тогда число
называется частотой интервала
,
при этом
.
Под статистическим рядом понимается следующая таблица:
Номер интервала i |
Границы интервала |
Середина интервала
|
Частота
|
Накопленная частота
|
1 |
|
|
|
|
2 |
|
|
|
|
... |
... |
... |
... |
... |
k |
|
|
|
|
Выбор количества интервалов k зависит
от объёма выборки n. Рекомендуется
брать
.
Длины интервалов проще взять одинаковыми,
однако при существенной неравномерности
распределения наблюдаемой СВ целесообразно
в области наибольшей плотности интервалы
брать короче, чем в областях малой
плотности. Желательно, чтобы каждый
интервал содержал не менее пяти элементов
выборки (интервалы, содержащие менее
пяти элементов, объединяются с соседними
интервалами).