- •Общие положения Введение
- •Общие положения
- •Итеративная процедура построения модели
- •1. Формализация априорных данных.
- •2. Выдвижение гипотезы о структуре модели.
- •3. Выбор алгоритма съема информации с объекта.
- •4. Реализация алгоритма съема информации.
- •5. Оценивание параметров модели.
- •6. Проверка адекватности модели.
- •Вероятность и случайные величины. Описание поведения случайной величины.
- •Методы математической статистики Параметрическое описание поведения случайной величины
- •Методы математической статистики Свойства математического ожидания. Свойства дисперсии.
- •Свойства дисперсии.
- •Статистики и оценки.
- •Точечные и интервальные оценки.
- •Свойства среднего арифметического. Свойства дисперсии среднего арифметического.
- •Извлечение выборки.
- •Проверка статистических гипотез.
Свойства дисперсии.
Свойства дисперсии определяются свойствами МО. Напомним, дисперсия является центральным моментом второго порядка: D(x) = M[(x-Mx)2]. Дисперсия любой случайной величины независимо от вида распределения, которому она подчиняется обладает следующими свойствами. 1.ДИСПЕРСИЯ НЕСЛУЧАЙНОЙ ВЕЛИЧИНЫ РАВНО НУЛЮ. Пусть а - неслучайная величина. Тогда D(a)=M[(a-M(a))2]=M[0]=0. 2. ДИСПЕРСИЯ СУММЫ НЕСЛУЧАЙНОЙ И СЛУЧАЙНОЙ ВЕЛИЧИН РАВНА ДИСПЕРСИИ СЛУЧАЙНОЙ ВЕЛИЧИНЫ (ДИСПЕРСИЯ ИНВАРИАНТНА СДВИГУ). Пусть а - неслучайная величина. Тогда D(a+x)=M[(a+x-M(a+x))2]= M[(x-M(x))2]=D(x). 3.ДИСПЕРСИЯ ПРОИЗВЕДЕНИЯ НЕСЛУЧАЙНОЙ ВЕЛИЧИНЫ НА СЛУЧАЙНУЮ РАВНА ПРОИЗВЕДЕНИЮ СЛУЧАЙНОЙ ВЕЛИЧИНЫ НА КВАДРАТ НЕСЛУЧАЙНОЙ ВЕЛИЧИНЫ. Пусть а - неслучайная величина. Тогда D(a*x)=M[(a*x-M(a*x))2]=M[(a*(x-M(x))2]=
=M[a2*(x-M(x))2]=a2*D(x). 4. ДИСПЕРСИЯ СУММЫ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН РАВНА СУММЕ ДИСПЕРСИЙ ЭТИХ ВЕЛИЧИН И УДВОЕННОЙ КОВАРИАЦИИ ЭТИХ ВЕЛИЧИН. Пусть x и у - случайные величины. Тогда D(x+y)=M[((x+y)-M(x+y))2]= =M[((x-Mx)+(y-My))2]=M[(x-Mx)2+(y-My)2+2*(x-Mx)*(y-My)]=M[(x-Mx)2]+ +M[(y-My)]+2*M[(x-Mx)*(y-My)]=D(x)+D(y)+2*COV(x,y). Величина COV(x,y)=M[(x-Mx)*(y-My)] называется ковариацией и обладает свойством: ДЛЯ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕЛИЧИН КОВАРИАЦИЯ ВСЕГДА РАВНА НУЛЮ. Отсюда, следует: ДИСПЕРСИЯ СУММЫ ДВУХ НЕЗАВИСИМЫХ (И ТОЛЬКО НЕЗАВИСИМЫХ) СЛУЧАЙНЫХ ВЕЛИЧИН РАВНА СУММЕ ДИСПЕРСИЙ ЭТИХ ВЕЛИЧИН.
Статистики и оценки.
В практических приложениях, как правило, параметры случайной величины неизвестны. Возникает задача оценивания параметров. Эта задача решается методом выборочного анализа, который состоит в следующем. Вся совокупность возможных реализаций (наблюдений) случайной величины определяется как ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ. Параметры генеральной совокупности (случайной величины) оцениваются по ВЫБОРОЧНОЙ СОВОКУПНОСТИ (ВЫБОРКЕ) - части генеральной совокупности. Например, для оценивания МО доходов работников образования России, из всей генеральной совокупности доходов работников образования по тем или иным правилам отбираются доходы некоторых. Количество элементов в выборке, отобранных из генеральной совокупности называется ОБЪЕМОМ ВЫБОРКИ. После извлечения выборки ее анализируют. РЕЗУЛЬТАТЫ АНАЛИЗА ВЫБОРКИ РАСПРОСТРАНЯЮТ НА ВСЮ ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ. В этом основная методологическая ошибка выборочного анализа (вспомните ошибки в рейтингах политических деятелей!). Задача исследователя состоит в том, что бы свести ошибку к минимуму. Исследователь должен так извлечь выборку, так ее обработать, чтобы ошибка была минимальной.
Любая функция от выборочных данных называется СТАТИСТИКОЙ. Очевидно, что статистика всегда является случайной величиной, т.к. элементы выборки - суть случайные величины. Примером статистики может служить сумма всех значений в выборке. Некоторые статистики являются ОЦЕНКАМИ ПАРАМЕТРОВ исследуемой случайной величины, т.е. с определенной точностью совпадающие с истинными неизвестными значениями параметров. Необходимо совершенно четко представлять, что ЛЮБОЙ ПАРАМЕТР СЛУЧАЙНОЙ ВЕЛИЧИНЫ - НЕСЛУЧАЙНАЯ ВЕЛИЧИНА, ЛЮБАЯ СТАТИСТИКА ИЛИ ОЦЕНКА - СЛУЧАЙНАЯ ВЕЛИЧИНА. В силу сказанного поведение любой оценки как статистики может быть описано параметрами (МО, дисперсия и другие). Эти параметры используются для определения точности оценок. Рассмотрим некоторые из характеристик оценок. Пусть x - случайная величина, U - параметр случайной величины x, u - выборочная оценка параметра U.
СМЕЩЕНИЕ ОЦЕНКИ - разность между истинным значением параметра случайной величины и МО оценки параметра.
B(u) = U - Mu.
Если смещение оценки равно нулю, то оценка u называется НЕСМЕЩЕННОЙ ОЦЕНКОЙ ПАРАМЕТРА U.
ДИСПЕРСИЯ ОЦЕНКИ - центральный момент второго порядка оценки u.
D(u) = M[(u-Mu)2].
Очевидно, что для параметра U может существовать несколько оценок. Например, для МО оценками могут быть среднее арифметическое, среднее геометрическое и др.
НАИЛУЧШЕЙ ОЦЕНКОЙ ПАРАМЕТРА U называется такая НЕСМЕЩЕННАЯ оценка, которая обладает МИНИМАЛЬНОЙ ДИСПЕРСИЕЙ среди всех возможных несмещенных оценок.
СРЕДНЕ-КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ ОЦЕНКИ - момент второго порядка вида:
С.К.О.(u) = M[(u-U)2]
Обратите внимание, под знаком МО отклонение оценки от истинного значения оцениваемого параметра. Можно показать, что С.К.О.(u) = D(u) + B(u)2 - сумма дисперсии оценки и квадрата смещения оценки. Если B(u) = 0, то С.К.О.(u) = D(u).