- •Федеральное агентство по образованию северо–кавказский горно–металлургический институт (государственный технологический университет)
- •Владикавказ 2008
- •Тема 1. Случайные события и случайные величины, их числовые характеристики
- •Случайные события
- •Вероятность события Существует статистическое и классическое определение понятия «вероятность». Статистическое определение вероятности
- •Классическое определение вероятности
- •Свойства вероятности
- •Сложение и умножение вероятностей
- •Условная вероятность. Умножение вероятностей
- •1.2.3. Полная вероятность
- •1.3. Случайные величины
- •1.3.1. Функции распределения случайной величины
- •1.3.1.1. Свойства функции распределения
- •1.3.1.2. Функция распределения для дискретной случайной
- •1.3.1.3. Функция распределения непрерывной случайной
- •Исходя из определения функции распределения:
- •1.3.1.4. Плотность вероятности случайной величины
- •Геометрическое истолкование этой формулы
- •1.3.2.1. Свойства математического ожидания
- •1.3.2.2. Свойства дисперсии
- •1.3.3. Моменты случайной величины
- •1.4. Примеры законов распределения случайной величины
- •1.4.1. Равномерное распределение дискретной случайной
- •1.4.2. Равномерное распределение непрерывной случайной
- •1.4.3. Нормальный закон распределения (закон Гаусса)
- •Тема 2. Точечное оценивание параметров. Регрессионный и корреляционный анализ
- •2.1. Выборочный метод
- •2.1.1. Среднее и дисперсия выборки
- •2.2. Связь между случайными величинами. Корреляция
- •2.2.1. Свойства коэффициента корреляции
- •2.2.2. Определение коэффициента корреляции по данным наблюдений
- •2.2.3. Частная линейная корреляция
- •2.2.4. Множественная линейная корреляция
- •2.3. Регрессия
- •2.3.1. Линейная регрессия
- •2.3.2. Нелинейная парная регрессия
- •2.3.3. Множественная линейная регрессия
- •2.3.4. Определение параметров уравнения множественной
- •Тема 3. Проверка статистических гипотез и построение доверительных областей для параметров
- •3.1. Доверительные интервалы и доверительные вероятности
- •3.2. Оценка генерального среднего
- •3.3. Оценка генеральной дисперсии
- •3.4.1. Гипотеза о равенстве дисперсий. Критерий Фишера
- •3.5. Проверка адекватности уравнения регрессии
- •Тема 4. Математическое описание случайных сигналов в системах управления
- •4.1. Случайные процессы
- •4.2. Стационарные случайные процессы
- •4.3. Корреляционная функция
- •4.3.1. Свойства корреляционной функции
- •4.4. Спектральная плотность
- •4.4.1. Свойства спектральной плотности
- •Тема 5. Понятие передаточной функции и частотных характеристик системы
- •5.1. Элементы операционного исчисления. Преобразование
- •5.1.1. Основные свойства преобразования Лапласа
- •5.1.2. Примеры преобразования Лапласа для типовых функций
- •5.1.3. Решение линейных дифференциальных уравнений
- •Примеры
- •5.2. Понятие передаточной функции
- •5.3. Временные и частотные характеристики сау
- •5.3.1. Временные характеристики сау
- •5.3.2. Частотные характеристики сау
3.3. Оценка генеральной дисперсии
Для оценки генеральной дисперсии 2 используется выборочная дисперсия S2. Эта дисперсия в силу случайности выборки сама является случайной величиной. Но математическим ожиданием для S2 служит генеральная дисперсия 2. Отсюда следует, что 2 можно оценить по S2, если известно распределение величины S2.
Распределение величины S2 можно получить с помощью так называемого распределения Пирсона (или 2 – распределения). Для выборки с элементами х1, х2,…,хn через 2 обозначается сумма
.
В этой сумме есть связь , поэтому число степеней свободыf = n 1. Плотность 2 – распределения зависит только от f, соответствующие графики приведены на рисунке.
Нетрудно установить связь между величинами 2 и S2:
или .
Теоретически доказано и подтверждено практикой, что для уровня значимости = 1 р доверительная оценка величины 2 имеет вид
,
где и– соответствующие квантили распределения Пирсона.
Отсюда
или после преобразований
.
Таким образом получили двустороннюю доверительную оценку для генеральной дисперсии 2.
3.4. Проверка статистических гипотез применяется для того, чтобы использовать полученную по выборке информацию для суждения о законе распределения генеральной совокупности. При этом имеется определенное представление о неизвестном вероятностном законе F(x) и его параметрах, которое формулируется в виде статистической гипотезы, обозначаемой символом Но (нулевая, или основная гипотеза).
Запись означает допущение («гипотезу») о том, чтоFo(x) есть функция распределения генеральной совокупности.
С помощью статистических методов или критериев для проверки гипотезы устанавливается, соответствуют ли взятые из выборки данные выдвинутой гипотезе или нет, т.е. нужно ли принять или отвергнуть гипотезу.
Если вид функции распределения F(x) задан отдельными параметрами и если гипотеза строится именно по этим неизвестным параметрам, то говорят о параметрических гипотезах.
Для проверки гипотезы вводят критерий – правило, позволяющее принять или отвергнуть гипотезу в соответствии с данными эксперимента.
Особое положение занимает проверка адекватности модели регрессии.
Адекватная модель регрессии, как правило, неизвестна. Подбирая, например, параболическую модель мы не знаем заранее, какого она должна быть порядка, на какой степени следует остановиться. Не знаем мы также, сколько факторов надо учитывать. Поэтому обычно начинают с моделей первого порядка – линейных моделей и затем повышают порядок модели (степень многочлена) до тех пор, пока при сравнительно небольшом числе параметров модель не станет адекватной, т.е. гипотеза об ее истинности не будет противоречить данным эксперимента (если это вообще возможно, если существует такая параболическая модель). Для проверки адекватности модели обычно используют критерий Фишера.
3.4.1. Гипотеза о равенстве дисперсий. Критерий Фишера
Сравнение двух или нескольких выборочных дисперсий является одной из важнейших задач статистической обработки наблюдений. Основной выясняемый вопрос при этом – можно ли считать сравниваемые выборочные дисперсии оценками одной и той же генеральной дисперсии.
Начнем со сравнения двух выборочных дисперсий и, имеющих соответственноf1 и f2 степеней свободы. Будем считать, что первая выборка сделана из генеральной совокупности с дисперсией , вторая – из генеральной совокупности с дисперсией. Выдвигается нулевая гипотеза – гипотеза о равенстве генеральных дисперсий. Для того, чтобы отвергнуть эту гипотезу, нужно доказать значимость расхождения междуипри выбранном уровне значимости = . В качестве критерия значимости обычно используется так называемоераспределение Фишера.
Распределением Фишера (или F–распределением) называется распределение случайной величины:
.
Это распределение зависит только от f1 и f2 при этом
.
Как и в случае 2–распределения, плотность рассматривается лишь на положительной полуоси, т.е. при 0 F . В литературе даются квантили F1–р для некоторых наиболее употребительных уровней значимости =и различных комбинацийf1 и f2. При нахождении квантилей Fр для значений р, не вошедших в таблицу, используется очевидное соотношение
Например: F0,95(4,3) = 9,1; F0,05(3,4) =.
Вернемся к рассмотрению нулевой гипотезы, согласно которой . В этом случаеи, следовательно,F–распределение может быть использовано непосредственно для оценки отношения . При этом должно выполняться двустороннее неравенство
. (*)
При этом будем обозначать через , большую из сравниваемых дисперсий. Если большей выборочной дисперсии заведомо не может соответствовать меньшая генеральная, т.е. если неравенствозаведомо невозможно, то нужно применять односторонний критерий, сравнивая отношениес односторонними доверительными оценками:
F1–(f1, f2).
Нулевая гипотеза отвергается, если F1–(f1, f2), где значение F берется из таблицы для квантилей распределения Фишера.
Пример. При изучении стабильности температуры в термостате получены данные 21,2; 21,8; 21,3; 21,0; 21,4; 21,3. К стабилизатору температуры применено некоторое усовершенствование, после чего (на другом режиме) получены данные: 37,7; 37,6; 37,6; 37,4. Можно ли при уровне значимости = 0,05 считать усовершенствование эффективным?
Эффективность стабилизаторов температуры, очевидно, зависит от даваемой ими дисперсии температур. Таким образом, задача состоит в том, чтобы сравнить генеральные дисперсии данных выборок температур. Вычисляем выборочные дисперсии, уменьшив для удобства вычислений все данные на 21 в первом случае и на 37,5 – во втором:
,
Отсюда .
Числа степеней свободы f1 = 5, f2 = 3.
Усовершенствование может лишь уменьшить дисперсию, поэтому применяем односторонний критерий значимости. По таблице квантилей распределения Фишера находим F0,95(5,3) = 9,0. Мы видим, что = 4,4 < 9,0. Следовательно, данные наблюдений не позволяют отвергнуть нулевую гипотезу и считать усовершенствование эффективным. Таким образом, различие дисперсий незначимо.