
- •Содержание
- •1.8. Проверка однородности нескольких дисперсий, 23
- •1. Первичная обработка результатов мониторинга
- •1.1. Общие сведения
- •1.2. Статистические оценки результатов наблюдений
- •1.3. Расчет доверительного интервала для математического ожидания
- •1.4. Определение необходимого объема выборки
- •1.5. Отбрасывание сомнительных наблюдений
- •1.6. Проверка гипотезы об однородности двух дисперсий
- •1.7. Проверка однородности нескольких дисперсий, найденных по выборкам одинакового объема
- •1.8. Проверка однородности нескольких дисперсий, найденных по выборкам различного объема
- •1.9. Проверка однородности средних
- •1.10. Проверка нормальности распределения
- •1.11. Коэффициент корреляции
- •1.12. Ранговая корреляция
- •1.13. Обработка экспертных оценок при ранжировании
- •2.2. Дисперсионный анализ данных
- •2.3. Корреляционный анализ данных
- •3.2. Основные задачи планирования эксперимента
- •4.2. Метод наименьших квадратов для моделей с одной переменной
- •4.3. Метод наименьших квадратов для многофакторных экспериментов
- •4.3.1.Случай линейной регрессионной модели с k варьируемыми факторами. Регрессионная модель здесь имеет вид (4.2). Значения факторов, принимаемые в каждом опыте, можно свести в табл. 4.3.
- •4.5. Статистический анализ уравнения регрессии
- •4.5.4.Последовательность действий исследователя при проведении эксперимента с целью построения регрессионной модели объекта.
- •4.6. Пример обработки результатов экспериментальных исследований
- •5. Построение многофакторной линейной регрессионной модели в excel
- •6. Культура представления числовых значений измерений и вычислений
- •7. Контрольное задание
- •Методические рекомендации при оценке состояния загрязнения атмосферы населенных мест
- •Статистические характеристики загрязнения атмосферы (за)
- •Индексы загрязнения атмосферы
- •Список использованной литературы
1.2. Статистические оценки результатов наблюдений
Множество значений случайной величины, полученных в результате эксперимента или наблюдений над объектом исследования, представляет собой статистическую совокупность. Статистическая совокупность, содержащая в себе все возможные значения случайной величины, называется генеральной статистической совокупностью. Выборочной статистической совокупностью называется совокупность, в которой содержится только некоторая часть элементов генеральной совокупности. По результатам экспериментов практически всегда встречаются с выборочной, а не с генеральной совокупностью. Выборочную статистическую совокупность будем в дальнейшем называть выборкой, а число опытов (наблюдений) n, содержащееся в выборке, – объемом выборки.
При повторении опытов в одинаковых условиях обычно обнаруживается закономерность в частоте появления тех или иных результатов. Некоторые значения случайной величины появляются значительно чаще других, при этом в целом они группируются относительно некоторого значения – центра группирования, которое обозначим через My.. Для описания этого явления используется вероятностный подход [2]. Пусть pi – вероятность того, что случайная величина, являющаяся результатом эксперимента, примет значение yi, i = 1, 2, ..., п. Если значения pi известны для всех возможных значений yi из генеральной совокупности, то величину My можно найти по формуле
.
(1.1)
Величину My называют математическим ожиданием, или генеральным средним случайной величины. Одно только математическое ожидание не может отобразить все характерные черты статистической совокупности. Исследователю необходимо знать, кроме того, изменчивость (или вариацию) наблюдаемой характеристики объекта.
Рассеивание случайной величины относительно математического ожидания характеризуется величиной, называемой дисперсией. Обычно она обозначается через 2. Для генеральной совокупности дисперсия определяется по формуле
(1.2)
Дисперсию 2
часто называют генеральной дисперсией.
Квадратный корень из дисперсии называется
средним
квадратическим отклонением
случайной величины (или стандартом)
.
Как и дисперсия, среднее квадратическое
отклонение является характеристикой
рассеивания значений случайной величины
относительно математического ожидания.
Формулы (1.1) и (1.2) справедливы для дискретных случайных величин. Для непрерывных случайных величин математическое ожидание и дисперсия выражаются через соответствующие интегралы.
Поскольку экспериментатор встречается не с генеральной совокупностью, а с выборкой, необходимо иметь формулы, позволяющие приближенно оценить математическое ожидание My и дисперсию σ2 на основе экспериментальных данных. Пусть по результатам однородной серии опытов получена выборка y1, y2, ..., yn. Наилучшей оценкой для математического ожидания My является среднее арифметическое или просто «среднее»
(1.3)
Найденное значение ycp называют еще выборочным средним в отличие от генерального среднего My. Оценкой дисперсии σ2 случайной величины является выборочная, или эмпирическая дисперсия. Она обозначается через s2 и вычисляется по формуле
(1.4)
Числитель этой формулы представляет собой сумму квадратов отклонений значений случайной величины от среднего значения ycp. Знаменатель формулы для выборочной дисперсии называется числом степеней свободы, связанным с этой дисперсией, и обозначается через f:
f = (n – 1). (1.5)
Формулу (1.4) можно преобразовать к виду, более удобному для вычислений:
(1.6)
Величина
.
(1.7)
является оценкой среднего квадратического отклонения σ выборки. Ее также называют выборочным стандартом.
Часто для оценки изменчивости (вариации) случайных величин используют коэффициент вариации , равный
.
(1.8)
Коэффициент вариации характеризует не абсолютное, а относительное рассеивание случайной величины относительно среднего.
Важными в статистике являются также следующие статистические показатели:
средняя квадратическая ошибка среднего значения
;
(1.9)
показатель точности среднего значения
(1.10)
ошибка среднего квадратического отклонения
.
При изложении дальнейшего материала данного раздела будем предполагать, что результаты наблюдений свободны от систематических ошибок, а случайные ошибки (а значит, и результаты наблюдений) подчинены нормальному закону распределения.