- •Математическая статистика
- •351400 – «Прикладная информатика (в экономике)»
- •Содержание
- •Методические указания, задачи и упражнения по темам
- •Тема 1. Теория вероятностей и математическая статистика – основной инструментарий для прикладной статистики
- •Дисперсией случайной величины х называется число dx , равное математическому ожиданию квадрата отклонения случайной величины от своего математического ожидания: . (1.4)
- •Контрольные вопросы и задачи
- •Тема 2. Статистическое оценивание
- •Интервальная оценка для генеральной доли
- •Контрольные вопросы и задачи
- •Тема 3. Статистическая проверка гипотез
- •Общая логическая схема статистического критерия.
- •Проверка гипотезы о значении генеральной средней
- •Проверка гипотезы о значении дисперсии генеральной совокупности
- •Гипотеза об однородности рада вероятностей
- •Гипотезы о виде законов распределения генеральной совокупности
- •Контрольные вопросы и задачи
- •Тема 4. Методика статистического анализа количественных и качественных показателей
- •Контрольные вопросы и задачи
- •Тема 5. Многомерные статистические методы
Дисперсией случайной величины х называется число dx , равное математическому ожиданию квадрата отклонения случайной величины от своего математического ожидания: . (1.4)
Если известен закон распределения случайной величины Х, то для дискретной и непрерывной случайных величин дисперсию можно вычислить соответственно по формулам: (1.5)
, (1.6)
где - плотность распределения случайной величины.
В качестве меры рассеивания случайной величины наряду с дисперсией используют среднеквадратическое отклонение , равное квадратному корню из дисперсии случайной величины: = . (1.7)
Среднеквадратическое отклонение случайной величины выражается в тех же единицах, что и сама случайная величина и ее математическое ожидание.
Приведем без доказательств основные свойства дисперсии. Свойства среднеквадратического отклонения непосредственно вытекают из соответствующих свойств дисперсии.
Дисперсия постоянной с равна нулю: D(c)=0.
2) Дисперсия произведения случайной величины Х на постоянную с равна произведению дисперсии случайной величины Х на квадрат постоянной: .
Если случайные величины X иY независимы, то дисперсия их суммы равна сумме их дисперсий: .
4) Дисперсия случайной величины Х не изменится, если к ней прибавить постоянную с, т.е. .
Моменты случайной величины обобщают понятия математического ожидания и дисперсии.
Моментом k – порядка называется математическое ожидание k –й степени отклонения случайной величины Х от некоторой постоянной с.
Если в качестве с берется нуль, моменты называют начальными, то есть
. (1.8)
Если с=М(Х), то моменты называются центральными, то есть
. (1.9)
Таким образом, математическое ожидание – ни что иное, как первый начальный момент, а дисперсия – второй центральный момент.
Существует формула, связывающая центральные моменты с начальными:
. (1.10)
Для первых четырех моментов эта формула дает следующие равенства:
(1.11)
Формула может быть использована для нахождения дисперсии случайной величины: (1.12)
В теории и практических приложениях используют две числовые характеристики случайной величины, основанные на центральных моментах третьего и четвертого порядков соответственно – коэффициент асимметрии и эксцесс . Данные коэффициенты дают представление о форме плотности распределения или многоугольника распределения.
Коэффициентом асимметрии случайной величины Х называется число, равное отношению третьего центрального момента к кубу среднеквадратического отклонения случайной величины Х: (1.13)
Коэффициент асимметрии случайной величины, закон распределения которой симметричен относительно математического ожидания, равен нулю, поскольку в этом случае . Если распределение вероятностей несимметрично, причем «длинная часть» распределения расположена справа от центра группирования, то >0 и асимметрию называют положительной, если же «длинная часть» расположена слева, то <0 и асимметрию называют отрицательной.
В качестве характеристики большей или меньшей степени «сглаженности» плотности или многоугольника распределения по сравнению с нормальной плотностью используют понятие эксцесса. Эксцессом случайной величины Х называется число, равное разности отношения четвертого центрального момента к четвертой степени среднеквадратического отклонения случайной величины и числа 3:
(1.14)
Эксцесс нормального закона распределения вероятностей равен нулю. Если распределение вероятностей случайной величины Х одномодально и плотность распределения более «островершинна», чем плотность распределения нормальной случайной величины с той же дисперсией, то >0, если же менее «островершинна» и более «сглажена» по сравнению с плотностью соответствующего нормального распределения, то <0.
В математической статистике широко используются понятия q-квантилей и Q-процентных точек распределения F(x).
Квантилью уровня q (или q-квантилью) непрерывной случайной величины Х, обладающей непрерывной функцией распределения F(x), называется такое возможное значение этой случайной величины, для которого вероятность события Х < равна заданной величине q, т.е. . (1.15)
Очевидно, чем больше заданное значение q (0<q<1), тем больше будет и соответствующая величина квантили . Частным случаем квантили - 0.5 –квантилью является характеристика центра группирования - медиана.
Для дискретной случайной величины функция q-квантиль определяется как любое число , лежащее между двумя значениями и , такими, что < q, но q.
Под Q-процентной точкой (0< Q<100) случайной величины Х понимается такое ее возможное значение , для которого вероятность события Х , равна Q/100:
. (1.16)
Для дискретной случайной величины это определение корректируется аналогично тому, как это делалось при определении квантилей.
Между квантилями и процентами точками существует следующее соотношение: .
Нормальное распределение (закон Гаусса) занимает центральное место в теории и практике статистических исследований. Распределение задается плотностью:
, (1.17)
где - математическое ожидание; - среднеквадратическое отклонение.
Кривая нормального распределения симметрична относительно прямой, параллельной оси ординат и проходящей через точку , и имеет в этой точке единственный максимум, равный . С уменьшением кривая становится более вытянутой по отношению к прямой . Изменение при постоянном не меняет формы кривой, а вызывает лишь ее смещение вдоль оси абсцисс. Таким образом, нормальное распределение зависит от двух параметров: и . Площадь, заключенная под кривой нормального распределения, равна единице. Коэффициент асимметрии и эксцесс равны нулю.
Логарифмически-нормальное распределение (логнормальное распределение) – распределение положительной случайной величины, логарифм которой распределен по нормальному закону. Таким образом, если случайная величина Х распределена по нормальному закону, то случайная величина имеет логнормальное распределение. Распределение является асимметричным.
Плотность вероятности задается следующим выражением:
. (1.18)
Математическое ожидание и дисперсия определяются по следующим формулам:
; (1.19)
, (1.20)
где - математическое ожидание Х; - среднеквадратическое отклонение Х.
Биномиальное распределение – распределение вероятностей дискретной случайной величины X=m, принимающей значение 0,1,2,…, n и задаваемой функцией вероятностей :
, (1.20)
где - вероятность появления события А m раз в n независимых испытаниях, в каждом из которых событие А появляется с одно и той же вероятностью p и не появляется с вероятностью ;
- число сочетаний из n по m.
Параметрами распределения являются величины n и р. Математическое ожидание и дисперсия задаются следующим образом:
(1.21)
Равномерное распределение – распределение вероятностей непрерывной случайной величины на каком-либо отрезке , где , имеющее плотность:
при (1.22)
Математическое ожидание и дисперсия соответственно равны:
(1.23)