
- •2.Факторы
- •2.2.Требования, предъявляемые к факторам при планировании эксперимента
- •3. Выбор модели
- •3.2.Шаговый принцип формирования модели
- •3.3.Выбор модели
- •3.4. Полиномиальные модели
- •3.5. Полный факторный эксперимент
- •3.6. Выбор основного уровня.
- •3.7 Выбор интервалов варьирования.
- •3.8. Полный факторный эксперимент типа 2к
- •3.9. Свойства полного факторного эксперимента 2к
- •3.10. Полный факторный эксперимент и математическая модель
- •4. Дробный факторный эксперимент
- •4.1. Минимизация числа опытов
- •4.2. Дробная реплика
- •4.3. Выбор полуреплик. Генерирующие соотношения и определяющие контрасты
- •5. Проведение эксперимента
- •5.1. Анкета для сбора априорной информации
- •5. 2. Реализация плана эксперимента
- •5.3. Погрешности параллельных опытов
- •5.4. Элементы математической статистики
- •5.4.1. Выборка и ее характеристики
- •5.4.2. Эмпирическая функция распределения
- •5.4.3. Эмпирические (выборочные) моменты
- •5.5. Теория точечных оценок
- •5.6. Обработка результатов эксперимента
- •5.6.2. Регрессионный анализ
- •5.6.3. Проверка адекватности модели
- •5.7. Матричный подход к регрессионному анализу.
- •5.7.2. Некоторые операции над матрицами
5.4.3. Эмпирические (выборочные) моменты
Эмпирическая функция распределения содержит всю статистическую информацию, которая накоплена в процессе извлечения выборки. Статистические свойства выборки можно характеризовать не только такой функцией, но и более грубо — выборочными моментами, которые будем обозначать звездочкой в отличие от моментов случайных величин.
Выборочный момент к-го порядка
( 11 )
( 12 )
( 13 )
т.е. он равен среднему арифметическому k-x степеней выборочных значений.
Выборочный момент первого порядка называется выборочным средним
Выборочные моменты k-ro порядка служат оценкой моментов k-го порядка случайной величины X.
Аналогично оценкой k-ro центрального момента
ак == М(Х-МХ)к служат выборочные моменты
В случае k=2 получаем выборочную дисперсию
( 14 )
Выборочное среднее характеризует расположение выборки на действительной прямой, а выборочная дисперсия является мерой рассеяния выборочных значений относительно среднего.
Можно показать, что при достаточно общих ограничениях, налагаемых на неизвестную функцию распределения F(x), выборочные моменты близки к ее соответствующим теоретическим характеристикам
ак
= МХк;
=
М(Х-МХ)к.
5.5. Теория точечных оценок
Несмещенные оценки с минимальной дисперсией
Предположим, что о распределении случайной величины X известно, что оно принадлежит некоторому параметрическому семейству распределений. В случае непрерывной случайной величины это означает, что известен вид плотности р(х | θ), но неизвестно значение параметра θ, определяющее ее конкретно. Параметр θ может быть вектором, например, для нормального распределения θ = (μ, σ) :
В случае дискретной случайной величины р(х | θ) будет обозначать вероятность Р(Х - х), например для пуассоновского распределения
Пусть
— некоторый числовой параметр,
представлющий
для нас интерес, например,
;
;
/
Рассмотрим
задачу оценивания, состоящую в построении
такой функции t
=
(x1,
...,xn),
чтобы
при подстановке вместо аргументов
х1,
..., хп
данных выборки мы получили числа,
близкие
к
.
Такую близость можно обеспечить лишь
в среднем.
Поэтому требование, предъявляемое к
качеству оценок, формулируется
в вероятностных терминах, относящихся
к
распределению оценок, рассматриваемых
как случайные величины.
Это требование, состоящее в том, чтобы
значения оценки
в большинстве опытов были близки к
значению оцениваемого
параметра, можно сформулировать в виде
следующего
определения.
Определение.
Оценка
t
=
(x1,
...,xn)
называется
несмещенной
для
еслиMθ
t
(x1,
...,хn)
=
для
всех θ, где Мθ
—символ математического
ожидания при условии, что случайный
вектор (x1
...,хn)
имеет распределение L(x|
θ)
= р(х1|
θ
)... p(xn|
θ).
Например,
как, было показано ранее,
иS2
—
несмещенные оценки для μ и σ2
соответственно.
Как
правило, одно лишь требование несмещенности
не выделяет оценку t(x)
как лучшую. Поэтому следующим желательным
требованием является обеспечение
минимума дисперсии этой оценки.
Статистика может служить хорошей
оценкой данного параметра
,
если ее распределение
сосредоточено в достаточной близости
от неизвестного значения
,
вследствие чего вероятность больших
отклонений
этой статистики от
будет достаточно мала. Тогда присистематическом
многократном применении такой статистики
в качестве оценки некоторой характеристики
она в среднем
окажется достаточно точной. Вероятность
больших отклонений окажется малой,
т.е. они будут встречаться редко. Таким
образом, среди всех несмещенных оценок
t(x)
для
более
желательной является та оценка, которая
имеет минимальную
дисперсию для всех θ. Такие
оценки называются несмещенными оценками
с минимальной
дисперсией (НОМД).
Определение. Несмещенной оценкой с минимальной дисперсией называется такая оценка t*(xl..., хn), что Dt* ≤ Dt для всех
θ
, для любой несмещенной оценки t(x1
..., хn)
параметра
.
Уже эти требования, как правило, выделяют оценку t(x) однозначно, если она вообще существует. Наличие НОМД имеет место далеко не всегда, так как дисперсия для этих оценок должна быть минимальной равномерно по θ . Это обстоятельство является, пожалуй, самым серьезным аргументом против таких сильных требований.
Состоятельность оценки означает, что при достаточно большом количестве наблюдений n со сколь угодно большой достоверностью отклонение оценки от истинного значения параметра меньше любой наперед заданной величины.
Для того чтобы несмещенная оценка была состоятельной, достаточно, чтобы ее дисперсия стремилась к нулю при п→∞ (следует из неравенства Чебышева).