- •Федеральное агентство по образованию северо–кавказский горно–металлургический институт (государственный технологический университет)
- •Владикавказ 2008
- •Тема 1. Случайные события и случайные величины, их числовые характеристики
- •Случайные события
- •Вероятность события Существует статистическое и классическое определение понятия «вероятность». Статистическое определение вероятности
- •Классическое определение вероятности
- •Свойства вероятности
- •Сложение и умножение вероятностей
- •Условная вероятность. Умножение вероятностей
- •1.2.3. Полная вероятность
- •1.3. Случайные величины
- •1.3.1. Функции распределения случайной величины
- •1.3.1.1. Свойства функции распределения
- •1.3.1.2. Функция распределения для дискретной случайной
- •1.3.1.3. Функция распределения непрерывной случайной
- •Исходя из определения функции распределения:
- •1.3.1.4. Плотность вероятности случайной величины
- •Геометрическое истолкование этой формулы
- •1.3.2.1. Свойства математического ожидания
- •1.3.2.2. Свойства дисперсии
- •1.3.3. Моменты случайной величины
- •1.4. Примеры законов распределения случайной величины
- •1.4.1. Равномерное распределение дискретной случайной
- •1.4.2. Равномерное распределение непрерывной случайной
- •1.4.3. Нормальный закон распределения (закон Гаусса)
- •Тема 2. Точечное оценивание параметров. Регрессионный и корреляционный анализ
- •2.1. Выборочный метод
- •2.1.1. Среднее и дисперсия выборки
- •2.2. Связь между случайными величинами. Корреляция
- •2.2.1. Свойства коэффициента корреляции
- •2.2.2. Определение коэффициента корреляции по данным наблюдений
- •2.2.3. Частная линейная корреляция
- •2.2.4. Множественная линейная корреляция
- •2.3. Регрессия
- •2.3.1. Линейная регрессия
- •2.3.2. Нелинейная парная регрессия
- •2.3.3. Множественная линейная регрессия
- •2.3.4. Определение параметров уравнения множественной
- •Тема 3. Проверка статистических гипотез и построение доверительных областей для параметров
- •3.1. Доверительные интервалы и доверительные вероятности
- •3.2. Оценка генерального среднего
- •3.3. Оценка генеральной дисперсии
- •3.4.1. Гипотеза о равенстве дисперсий. Критерий Фишера
- •3.5. Проверка адекватности уравнения регрессии
- •Тема 4. Математическое описание случайных сигналов в системах управления
- •4.1. Случайные процессы
- •4.2. Стационарные случайные процессы
- •4.3. Корреляционная функция
- •4.3.1. Свойства корреляционной функции
- •4.4. Спектральная плотность
- •4.4.1. Свойства спектральной плотности
- •Тема 5. Понятие передаточной функции и частотных характеристик системы
- •5.1. Элементы операционного исчисления. Преобразование
- •5.1.1. Основные свойства преобразования Лапласа
- •5.1.2. Примеры преобразования Лапласа для типовых функций
- •5.1.3. Решение линейных дифференциальных уравнений
- •Примеры
- •5.2. Понятие передаточной функции
- •5.3. Временные и частотные характеристики сау
- •5.3.1. Временные характеристики сау
- •5.3.2. Частотные характеристики сау
2.1.1. Среднее и дисперсия выборки
Пусть М[Х] – математическое ожидание случайной величины Х. Это число нам неизвестно. Мы проводим наблюдения и при большом объеме выборки n можно вместо М[Х] рассматривать математическое ожидание Хn. Погрешность при этом будет тем меньше, чем больше объем выборки n.
Математическое ожидание выборки есть просто среднее арифметическое элементов выборки:
.
Будем называть средним выборки . Если сгруппировать итоги наблюдений, то можно записать
,
где хi – варианта выборки; ni – частота варианты хi; n – объем выборки.
Таким образом, в качестве истинного результата можно брать . Такой выбор вносит определенные погрешности, которые тем меньше, чем большеn.
Дисперсия D[Х] приближенно равна дисперсии D[Xn].
,
т.е. D[Х] D[Xn]. Это равенство было бы еще более надежным, если бы в формуле для D[Xn] вместо стоял непосредственно истинный результатМ[Х]. Обычно получаем заниженную оценку рассеяния значения генеральной совокупности. В связи с этим D[Xn] называется смещенной оценкой дисперсии D[X]. Чтобы получить несмещенную оценку дисперсии требуется рассмотреть величину
,
которая является несмещенной оценкой дисперсии.
Переход к несмещенной оценке S2 важен в основном для малых выборок, ибо разница между S2 и D[Xn] при больших n незаметна.
Таким образом, среднее выборки
,
а несмещенная оценка дисперсии выборки
.
В практических вычислениях для дисперсии S2 часто удобна формула
.
Величина S (корень квадратный из выборочной дисперсии) называется средним квадратическим отклонением выборки или выборочным стандартом.
Почему в формуле дисперсии n заменили на n – 1? Это связано с тем, что входящая в формулу величина сама зависит от элементов выборки. Если бы в формуле еще одна величина была функцией элементов выборки, то пришлось бы взятьn – 2 и т.д.
Каждая величина, зависящая от элементов выборки и участвующая в формуле выборочной дисперсии, называется связью. Эта разность показывает, какое количество элементов выборки можно произвольно изменять, не нарушая связей и называется числом степеней свободы. Таким образом, знаменатель выборочной дисперсии всегда равен разности между объемом выборки и числом связей, наложенных на эту выборку.
2.2. Связь между случайными величинами. Корреляция
До сих пор изучали наблюдения над одной случайной величиной. Между тем для выяснения тех или иных причинно–следственных связей в окружающей природе необходимо вести одновременные наблюдения над целым рядом случайных величин, чтобы по полученным данным изучать взаимоотношения этих величин. Ограничимся пока двумя случайными величинами Х и У.
В математическом анализе зависимость между двумя величинами выражается понятием функции у = f(x), где каждому допустимому значению одной переменной соответствует одно и только одно значение другой переменной. Такая зависимость называется функциональной, она обнаруживается с помощью строгих логических доказательств и не нуждается в опытной проверке. Если у = const при изменении х, то говорят, что у не зависит от х.
Гораздо сложнее обстоит дело с понятием зависимости случайных величин: если при изменении х изменилось у, мы не можем сказать, является ли это изменение результатом зависимости у от х или это результат влияния случайных факторов. Здесь имеет место связь особого рода, при которой с изменением одной величины меняется распределение другой – такая связь называется стохастической.
Выявление стохастической связи и оценка ее силы представляют задачу математической статистики.
Рассматривая свойства дисперсии, мы указали, что дисперсия суммы двух независимых величин равна сумме дисперсий этих величин. Поэтому если для двух случайных величин Х и У окажется, что
,
то это служит верным признаком наличия зависимости между Х и У, т.е. корреляции.
Из этого неравенства вытекает (доказано), что справедливо следующее неравенство:
,
где называюткорреляционным моментом.
Корреляционный момент зависит от единиц измерения величин Х и У. Поэтому на практике чаще используется безразмерная величина, которая называется коэффициентом корреляции.
.