УСР№3 Средние величины и показатели вариации количественных признаков
**
23БХ-1
Основной характеристикой вариационного ряда являются средние величины: степенные (средняя арифметическая) и структурные (медиана, мода). Средняя величина – это наиболее типичное для совокупности значение признака.
В статистике выделяют несколько видов средних величин:
1. По наличию признака-веса:
а) невзвешенная средняя;
б) взвешенная средняя.
2. По форме расчета:
а) средняя арифметическая;
б) средняя гармоническая;
в) средняя геометрическая;
г) средняя квадратическая, кубическая и т.д.
В случае, если известны лишь экстремальные значения признака (хmin и хmax), средняя рассчитывается как корень квадратный произведения между ними.
Средняя гармоническая величина – это сумма обратных значений вариант, деленная на их число.
Средняя геометрическая величина – более точная характеристика при определении средних прибавок, прироста численности популяции или изменения линейных размеров за определенный промежуток времени.
Структурные средние.
Медиана (Ме) – это средняя величина, относительно которой вариационный ряд распределения делится на две половинки. Мода (Мо) – величина, которая встречается в данной совокупности наиболее часто.
Лимиты (lim) – значения минимальной xmin и максимальной xmax вариант совокупности. Например, для выборки (таблица 3): xmin = 4, xmax = 8.
Размах вариации (R) – это разность между максимальной и минимальной вариантами выборки, он отражает пределы изменчивости признака:
R = (xmax) – (xmin). Для выборки (таблица 3): R = 8 – 4 = 4.
Сумму квадратов отклонений вариант от их среднего значения называют девиатой (Dx):
Средний квадрат отклонений вариант от средней величины называется смещенной дисперсией (Variance):
Чем менее однородна совокупность, тем большее значение будет иметь дисперсия.Для получения несмещенной дисперсии вводят поправку на смещенность , называемую поправкой Бесселя. В результате:
Нормированное отклонение – отклонение варианты от средней величины, отнесенное к величине среднего квадратического отклонения:Этот показатель позволяет измерять отклонения отдельных вариант от среднего значения и сравнивать их для разных признаков.
Квантили.
К структурным характеристикам вариационного ряда относятся квантили, отсекающие в пределах ряда определенную часть его членов (вариант). К ним относятся квартили, децили и перцентили (процентили или персентили).
Квартиль – величина, отсекающая 1/4 всех членов ряда. Три квартиля – q1, q2, q3 – делят весь вариационный ряд на четыре равночисленные части (кварты).
Дециль – величина, отделяющая 1/10 всех членов ряда. Девять децилей делят весь вариационный ряд на десять равных частей.
Соответственно, перцентиль (процентиль) (Pi) – величина, отделяющая 1/100 всех членов ряда. Девяносто девять перцентилей делят весь вариационный ряд на сто равных частей. В практике используются обычно перцентили: P3, P5, P10, P25, P50, P75, P90, P95, P97, причем P50 равен медиане, второму квартилю q2 и пятому децилю данного распределения. Между P25 и P75 и соответственно между q1 и q3 находится 50 % всех членов совокупности (P25 = q1 и P75 = q3), этот интервал называется интерквартильный диапазон (IQR).
исловые показатели, характеризующие генеральную совокупность некоторой случайной величины (изучаемого признака), называют генеральными параметрами, а числовые показатели, характеризующие выборку, – выборочными характеристиками или статистиками. Генеральные параметры принято обозначать буквами греческого алфавита, а выборочные – латинского. К выборочным характеристикам относятся , , , wd, к соответствующим генеральным параметрам – генеральная средняя , генеральная дисперсия , среднее квадратическое отклонение , генеральная доля Pd.
Выборочные характеристики являются приближенными оценками генеральных параметров. Это величины случайные, варьирующие вокруг своих параметров. Оценки генеральных параметров по выборочным характеристикам могут быть точечными и интервальными. Выборочная средняя является оценкой генеральной средней , выборочная дисперсия – оценкой генеральной дисперсии , среднее квадратическое отклонение – оценкой стандартного отклонения , выборочная доля wd – оценкой генеральной доли Pd.
Точечные оценки представляют собой числа («точки»), вычисляемые по случайной выборке.
Оценка называется несмещенной, если ее математическое ожидание (сумма произведений отдельных значений xi случайной величины X на их вероятности рi) совпадает со значением генерального параметра. Выборочная средняя – несмещенная оценка генеральной средней , но выборочная дисперсия и среднее квадратическое отклонение оказываются смещенными относительно параметров и . Поэтому для получения несмещенных дисперсии и СКО сумму квадратов отклонений нужно относить не к числу наблюдений, а к числу степеней свободы k = n – 1.
Статистические ошибки. Выборочные характеристики, как правило, не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой или ошибкой репрезентативности. Статистические ошибки присущи только выборочным характеристикам, они возникают в процессе отбора вариант из генеральной совокупности. Ошибки обозначаются буквой S, в качестве индекса ставится показатель (параметр), ошибку которого рассчитывают.
Ошибки репрезентативности уменьшаются при увеличении объема выборки. Чем меньше ошибка, тем ближе выборочная характеристика к величине генерального параметра.
Существует несколько способов создания статистических выводов. Первый – построение доверительных интервалов. Второй – проверка статистических гипотез.
Интервальные оценки. По известным выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью, называемой доверительной, находится генеральный параметр. В качестве доверительных используют вероятности Р1 = 0,95; Р2 = 0,99; Р3 = 0,999. Выбор того или иного порога доверительной вероятности осуществляется исходя из практических соображений той ответственности, с какой делаются выводы о генеральных параметрах.
窗体顶端