
Показатели скошенности и крутизны
Для больших выборок (N=100 и более) вычисляют еще два статистических показателя, характеризующих распределение численностей. Дело в том, что в одних случаях распределение численностей является нормальным и описывается уравнением Лапласа-Гаусса. В других случаях распределения отличаются от нормального. Кривая распределения при этом может быть скошенной. Она может быть также островершинной или, наоборот, туповершинной.
Скошенность кривой называют асимметрией.
В нормальном распределении только 3 варианты наблюдения из 1000 лежат вне пределов утроенного стандартного отклонения в ту и другую стороны от средней величины.
Если за эти пределы выходит большее число единиц совокупности, то такое явление сопровождается большей крутизной кривой, т. е. большим скоплением вариант около M, чем в нормальном распределении.
Получаемая кривая оказывается островершинной.
Если значения признака (варианты) расположены в более узких пределах, чем M±3, то это явление называют дефектом. Кривая оказывается плосковершинной.
В статистике степень крутизны кривой распределения характеризуется показателем, названым эксцессом. Эксцесс называют положительным при островершинной кривой и отрицательным – при плосковершинной.
Доверительный интервал для генеральной средней
При большом количестве вариант N выборочные средние M распределены приближенно нормально вокруг генеральной средней со стандартным отклонением s. Это значит, что относительное отклонение выборочного среднего M от генерального среднего , т.е. величина =(M-)/s распределена так же, как относительные отклонения вариант x от , т.е. величины u=(xi-)/ в нормально распределенной генеральной совокупности. Поэтому вероятность того, что будет находиться в пределах s, можно приближенно описывать функцией, выражающей площади под нормальной кривой в заданных пределах. Значения критерия приводятся в специальной таблице для заданного уровня значимости (Приложение 1). Получаемый интервал (x-s; x+s) называют доверительным интервалом для генеральной средней. Его смысл заключается в следующем: если взято 100 выборок объемом N каждая и, следовательно, получено 100 интервалов (M-s; M+s). Все они будут несколько различаться между собой положениями своих центров M, но 68 из этих интервалов покроют .