- •Федеральное агентство по образованию северо–кавказский горно–металлургический институт (государственный технологический университет)
- •Владикавказ 2008
- •Тема 1. Случайные события и случайные величины, их числовые характеристики
- •Случайные события
- •Вероятность события Существует статистическое и классическое определение понятия «вероятность». Статистическое определение вероятности
- •Классическое определение вероятности
- •Свойства вероятности
- •Сложение и умножение вероятностей
- •Условная вероятность. Умножение вероятностей
- •1.2.3. Полная вероятность
- •1.3. Случайные величины
- •1.3.1. Функции распределения случайной величины
- •1.3.1.1. Свойства функции распределения
- •1.3.1.2. Функция распределения для дискретной случайной
- •1.3.1.3. Функция распределения непрерывной случайной
- •Исходя из определения функции распределения:
- •1.3.1.4. Плотность вероятности случайной величины
- •Геометрическое истолкование этой формулы
- •1.3.2.1. Свойства математического ожидания
- •1.3.2.2. Свойства дисперсии
- •1.3.3. Моменты случайной величины
- •1.4. Примеры законов распределения случайной величины
- •1.4.1. Равномерное распределение дискретной случайной
- •1.4.2. Равномерное распределение непрерывной случайной
- •1.4.3. Нормальный закон распределения (закон Гаусса)
- •Тема 2. Точечное оценивание параметров. Регрессионный и корреляционный анализ
- •2.1. Выборочный метод
- •2.1.1. Среднее и дисперсия выборки
- •2.2. Связь между случайными величинами. Корреляция
- •2.2.1. Свойства коэффициента корреляции
- •2.2.2. Определение коэффициента корреляции по данным наблюдений
- •2.2.3. Частная линейная корреляция
- •2.2.4. Множественная линейная корреляция
- •2.3. Регрессия
- •2.3.1. Линейная регрессия
- •2.3.2. Нелинейная парная регрессия
- •2.3.3. Множественная линейная регрессия
- •2.3.4. Определение параметров уравнения множественной
- •Тема 3. Проверка статистических гипотез и построение доверительных областей для параметров
- •3.1. Доверительные интервалы и доверительные вероятности
- •3.2. Оценка генерального среднего
- •3.3. Оценка генеральной дисперсии
- •3.4.1. Гипотеза о равенстве дисперсий. Критерий Фишера
- •3.5. Проверка адекватности уравнения регрессии
- •Тема 4. Математическое описание случайных сигналов в системах управления
- •4.1. Случайные процессы
- •4.2. Стационарные случайные процессы
- •4.3. Корреляционная функция
- •4.3.1. Свойства корреляционной функции
- •4.4. Спектральная плотность
- •4.4.1. Свойства спектральной плотности
- •Тема 5. Понятие передаточной функции и частотных характеристик системы
- •5.1. Элементы операционного исчисления. Преобразование
- •5.1.1. Основные свойства преобразования Лапласа
- •5.1.2. Примеры преобразования Лапласа для типовых функций
- •5.1.3. Решение линейных дифференциальных уравнений
- •Примеры
- •5.2. Понятие передаточной функции
- •5.3. Временные и частотные характеристики сау
- •5.3.1. Временные характеристики сау
- •5.3.2. Частотные характеристики сау
2.1.1. Среднее и дисперсия выборки
Пусть М[Х] – математическое ожидание случайной величины Х. Это число нам неизвестно. Мы проводим наблюдения и при большом объеме выборки n можно вместо М[Х] рассматривать математическое ожидание Хn. Погрешность при этом будет тем меньше, чем больше объем выборки n.
Математическое ожидание выборки есть просто среднее арифметическое элементов выборки:
.
Будем
называть средним выборки
.
Если сгруппировать итоги наблюдений,
то можно записать
,
где хi – варианта выборки; ni – частота варианты хi; n – объем выборки.
Таким
образом, в качестве истинного результата
можно брать
.
Такой выбор вносит определенные
погрешности, которые тем меньше, чем
большеn.
Дисперсия D[Х] приближенно равна дисперсии D[Xn].
,
т.е.
D[Х]
D[Xn].
Это равенство было бы еще более надежным,
если бы в формуле для D[Xn]
вместо
стоял непосредственно истинный результатМ[Х].
Обычно получаем заниженную оценку
рассеяния значения генеральной
совокупности. В связи с этим D[Xn]
называется смещенной
оценкой дисперсии D[X].
Чтобы получить несмещенную оценку
дисперсии требуется рассмотреть величину
,
которая является несмещенной оценкой дисперсии.
Переход к несмещенной оценке S2 важен в основном для малых выборок, ибо разница между S2 и D[Xn] при больших n незаметна.
Таким образом, среднее выборки
,
а несмещенная оценка дисперсии выборки
.
В практических вычислениях для дисперсии S2 часто удобна формула
.
Величина S (корень квадратный из выборочной дисперсии) называется средним квадратическим отклонением выборки или выборочным стандартом.
Почему
в формуле дисперсии n
заменили на n
– 1? Это
связано с тем, что входящая в формулу
величина
сама зависит от элементов выборки. Если
бы в формуле еще одна величина была
функцией элементов выборки, то пришлось
бы взятьn
– 2 и т.д.
Каждая величина, зависящая от элементов выборки и участвующая в формуле выборочной дисперсии, называется связью. Эта разность показывает, какое количество элементов выборки можно произвольно изменять, не нарушая связей и называется числом степеней свободы. Таким образом, знаменатель выборочной дисперсии всегда равен разности между объемом выборки и числом связей, наложенных на эту выборку.
2.2. Связь между случайными величинами. Корреляция
До сих пор изучали наблюдения над одной случайной величиной. Между тем для выяснения тех или иных причинно–следственных связей в окружающей природе необходимо вести одновременные наблюдения над целым рядом случайных величин, чтобы по полученным данным изучать взаимоотношения этих величин. Ограничимся пока двумя случайными величинами Х и У.
В математическом анализе зависимость между двумя величинами выражается понятием функции у = f(x), где каждому допустимому значению одной переменной соответствует одно и только одно значение другой переменной. Такая зависимость называется функциональной, она обнаруживается с помощью строгих логических доказательств и не нуждается в опытной проверке. Если у = const при изменении х, то говорят, что у не зависит от х.
Гораздо сложнее обстоит дело с понятием зависимости случайных величин: если при изменении х изменилось у, мы не можем сказать, является ли это изменение результатом зависимости у от х или это результат влияния случайных факторов. Здесь имеет место связь особого рода, при которой с изменением одной величины меняется распределение другой – такая связь называется стохастической.
Выявление стохастической связи и оценка ее силы представляют задачу математической статистики.
Рассматривая свойства дисперсии, мы указали, что дисперсия суммы двух независимых величин равна сумме дисперсий этих величин. Поэтому если для двух случайных величин Х и У окажется, что
,
то это служит верным признаком наличия зависимости между Х и У, т.е. корреляции.
Из этого неравенства вытекает (доказано), что справедливо следующее неравенство:
,
где
называюткорреляционным
моментом.
Корреляционный момент зависит от единиц измерения величин Х и У. Поэтому на практике чаще используется безразмерная величина, которая называется коэффициентом корреляции.
.
