
- •Глава 3. Описательная статистика
- •3.1. Случайные выборки и их описание
- •3.2. Оценка статистических параметров
- •3.2.1. Основные распределения статистических
- •3.2.2. Свойства статистических оценок
- •Оценка называется состоятельной, если
- •3.2.3. Определение точечных оценок
- •3.3. Построение доверительных интервалов
- •3.3.1. Построение доверительных интервалов
- •Методика определения доверительного интервала для математического ожидания сводится к следующему:
- •3.3.2. Построение доверительных интервалов
- •3.4. Формирование выборки
- •Приведем краткую классификацию отбора.
- •3.5. Построение гистограммы
- •Глава 4. Статистическая проверка гипотез
- •4.1. Проверка гипотезы об однородности двух или нескольких анализируемых совокупностей
- •4.2. Проверка гипотез о распределении
- •Решение. Результаты расчета включают:
- •4.2.2. Критерий однородности Смирнова
- •Задания для самостоятельной работы
- •4.3. Проверка гипотезы об однородности
- •4.3.1. Критерий Стьюдента (t-критерий)
- •В качестве критической статистики используется величина
- •Здесь tq, (n–1) – 100 % -я точка распределения Стьюдента с (n- 1) степенями свободы.
- •Решение
- •Задания для самостоятельной работы
- •4.3.2. Критерий Фишера (f-критерий)
- •4.3.3. Критерий Уилкоксона
- •Здесь критическая область примет вид {uUл(q,m,n)}.
- •4.3.5. Критерий знаков
Оценка называется состоятельной, если
|
(3.7) |
3. Они должны быть эффективными.
Оценка
называется более эффективной, чем
оценка
,
если
|
(3.8) |
Соблюдение указанных
условий свидетельствует о том, что
найдена такая функция
,
при которой случайная величина
более
точно аппроксимирует неслучайное
неизвестное число.
3.2.3. Определение точечных оценок
Для нахождения вида функции оценивания того или иного параметра используют один из следующих методов:
метод максимального правдоподобия;
метод моментов;
оценивание с помощью «взвешенных» статистик.
Наибольшее распространение получил метод максимального правдоподобия, согласно которому для выборки, имеющей нормальное распределение, точечные оценки можно вычислить по следующим формулам:
выборочное среднее
|
(3.9) |
выборочная дисперсия
|
|
Но так как оценка выборочной дисперсии является смещенной:
|
|
то
для получения несмещенной оценки
необходимо ввести поправочный коэффициент
,
тогда окончательно получим
|
(3.10) |
3.3. Построение доверительных интервалов
Использование метода наибольшего правдоподобия или другого метода получения оценок параметров приводит так или иначе к приближенному равенству
|
(3.11) |
где в левой части
находится неслучайное число a;
а в правойслучайная
величина, являющаяся функцией выборочных
значений.
Возникает проблема оценки точности
приближенного равенства (3.11). Это в общем
случае сводится к определению таких
двух границ
и
,
для которых постоянное значениеaс некоторой вероятностьюPлежало
бы между этими границами, т.е.
|
(3.12) |
Рассмотрим для
решения данной проблемы метод
доверительных интервалов, предложенный
Нейманом. Пусть для параметраaиз опыта получена несмещенная оценка.
Для того чтобы оценить возможную при
этом ошибку, возникающую при заменеaна
,
назначим достаточно большую вероятностьP и найдем
такое значение
,
для которого
|
(3.13) |
или
|
(3.14) |
где
допустимая ошибка
при вероятностиР.
При
этом диапазон возможных значений α
будет
,
а большие по абсолютной величине ошибки,
чем
,
будут появляться только с малой,
практически допустимой вероятностью
q = 1 – P, |
(3.15) |
называемой уровнем
значимости, который, как правило,
оценивается в процентах (%). Существуют
другие названияqвероятность ошибки, вероятность
превышения уровня и др. ВероятностьPназываютдоверительной вероятностью,
или коэффициентом доверия, или
доверительным уровнем, или статистической
надежностью, т.к. она характеризует
надежность полученной оценки. При оценке
информационных процессов часто
принимается доверительная вероятность,
равная0,8
0,9. В технических системах обычно
принимают более высокую вероятность,
например, в машиностроении эта вероятность
принимается равной0,95
0,99. Интервалназываютдоверительным интервалом,
а границы этого интервала
и
доверительными
границами. На практике обычно дляРпринимают значения0,9; 0,95или0,99и исходя из этого определяют
или
.
Для этого используют различные способы,
подобно тому, как разными способами
оценивают неизвестные параметры
распределения по выборке.