Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка_Статистика.doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
1.2 Mб
Скачать

2.2 . Анализ эмпирического распределения

2.2.1. Расчет выборочных статистик

Статистический анализ распределения переменной work1 начнем, в соответствии с заданием, с расчета основных выборочных статистик, который реализуется с использованием опции Summary Statistics в разделе главного меню PLOTTING AND DESCRIPTIVE STATISTICS (F. Descriptive Metods\Summary Statistics). В поле Data vectors введем имя ST000000.work1, для чего весьма удобно пользоваться клавишей F7. Нажатием клавиши ENTER

имя отмеченной переменной заносится в активное поле (табл.2.3). Допускается одновременная обработка нескольких переменных, имена которых должны быть помещены в поле ввода в столбец (действует правило: одна переменная — одна строка).

Статистический анализ распределения переменной work1 начнем с расчета основных выборочных статистик, который реализуется с использованием опции Summary Statistics в разделе главного меню PLOTTING AND DESCRIPTIVE STATISTICS (F. Descriptive Metods\Summary Statistics). В поле Data vectors введем имя ST000000.work1, для чего удобно пользоваться клавишей F7. Нажатием клавиши ENTER имя отмеченной переменной заносится в активное поле (табл.5). Допускается одновременная обработка нескольких переменных, имена которых должны быть помещены в поле ввода в столбец (действует правило: одна переменная — одна строка).

Таблица 5

Summary Statistics

===============================================================

Data vectors: ST000000.work1

Statistics: ABCDEFGHIJKLMNOPQRS

(а)Average (f) Std.deviat (k)Lower quartile (p) Kurtosis

(b) Median (g) Std. Error (l)Upper quartile (q) Std.kurt.

(c)I Mode (h) Minimum (m)Interq.range I Coeff.of var

(d) Geom.mean (i) Maximum (n) Skewness (s) Sum

(e) Variance (j) Range (o) Std. Skewness Complete input fields and press F6.

1Help 2Edit 3Savscr 4Prtscr5 6Go 7Vars 8Cmd 9Device 10Quit

INPUT 4/ 6/95 10:44 STATGRAPHICS Vers. 5.1 Display STATS

Пользователю предоставлена возможность расчета любого набора из 19 статистик, помеченных литерами A,…,S. В учебных целях рассчитывается полный набор показателей. Запуск программы на выполнение, как обычно – F6. Результат выводится на экран дисплея в форме табл. 6.

Таблица 6

Variable: ST000000.work1

=========================================================

Sample size 148

Average 119.041

Median 119.5

Mode 123

Geometric mean 118.447

Variance 141.903

Standard deviation 11.9123

Standard error 0.979186

Minimum 88

Maximum 151

Range 63

Lower quartile 112

Upper quartile 126

Interquartile range 14

Skewness 0.171856

Standardized skewness 0.853531

Kurtosis 0.296863

Standardized kurtosis 0.737193

Coeff. Of variation 10.0069

Sum 17618

=========================================================

Press Esc, Cursor keys or Page Number Pag. 1.1 of 1.1

1Help 2Edit 3Savscr 4Prtscr 5Prtopt 6Go7 VarsCmd 9Devicе 10Quit

INPUT 4/ 6/95 10:44 STATGRAPHICS Vers. 5.1Display STATS

Экран вывода результатов расчета выборочных статистик

Таблица 2.3

Рассчитаны следующие выборочные статистики:

Sample size — объем выборки (число единиц в совокупности).

Average — средняя арифметическая, рассчитываемая по формуле простой средней:

.

Median — медиана:

, если n — четное,

, если n — нечетное.

Mode — мода Мо определяется непосредственно по исходным данным.

Geometric mean — геометрическая средняя:

.

Variance — дисперсия:

.

Standard deviation — среднее квадратическое отклонение:

.

Standard error — средняя ошибка выборки:

.

Minimum — минимальное значение: Xmin .

Maximum — максимальное значение: Xmax.

Range — размах вариации: R = Xmax – Xmin.

Lower quartile — нижний (первый) квартиль:

, , ,

где floor округление до ближайшего целого;

ceiling округление до ближайшего большего.

Upper quartile — верхний (третий) квартиль:

, где , .

Interquartile range — межквартильная разность: Q3Q1.

Skewness — асимметрия:

.

Standardized skewness — стандартизованная асимметрия:

.

Kurtosis — коэффициент эксцесса (куртозис):

.

Standardized kurtosis — стандартизованный куртозис:

.

Coeff. оf variation — коэффициент вариации по среднему квадратическому отклонению (%):

.

Sum — сумма значений элементов выборки: .

Содержательная интерпретация перечисленных статистик даётся на основе изучения учебной литературы и конспекта лекций. В пояснительной записке необходимо проанализировать асимметрию и эксцесс распределения и сделать выводы об их статистической значимости.

Для получения наглядного представления о порядковых статистиках анализируемого распределения (медиана, квартили и т.д.)необходимо ранжировать исследуемую совокупность, для чего удобно воспользоваться опцией редактора “Sort in ascending order”, вызываемой клавишей F5 в режиме редактирования файла. Ранжированная по возрастанию переменная work1 (переименованная в work11) представлена в табл. 7.

Таблица 7

Анализируемая статистическая совокупность,

ранжированная по возрастанию

Variable: ST000000.work11 (length = 148) 148)================================================================

( 1) 88 ( 19) 105 *( 37) 112 ( 55) 115 ( 73) 119 ( 91) 122

( 2) 94 ( 20) 105 ( 38) 112 ( 56) 115 ( 74) 119 ( 92) 122

( 3) 94 ( 21) 106 ( 39) 112 ( 57) 115*( 75) 120 ( 93) 123

( 4) 94 ( 22) 107 ( 40) 112 ( 58) 115 ( 76) 120 ( 94) 123

( 5) 97 ( 23) 108 ( 41) 113 ( 59) 116 ( 77) 120 ( 95) 123

( 6) 98 ( 24) 108 ( 42) 113 ( 60) 116 ( 78) 120 ( 96) 123

( 7) 99 ( 25) 109 ( 43) 113 ( 61) 116 ( 79) 120 ( 97) 123

( 8) 99 ( 26) 109 ( 44) 113 ( 62) 116 ( 80) 121 ( 98) 123

( 9)100 ( 27) 109 ( 45) 113 ( 63) 117 ( 81) 121 ( 99) 123

( 10)100 ( 28) 109 ( 46) 113 ( 64) 117 ( 82) 121 (100) 123

( 11)100 ( 29) 110 ( 47) 113 ( 65) 118 ( 83) 121 (101) 124

( 12)102 ( 30) 110 ( 48) 113 ( 66) 118 ( 84) 121 (102) 124

( 13)102 ( 31) 11 ( 49) 114 ( 67) 118 ( 85) 121 (103) 124

( 14)103 ( 32) 110 ( 50) 114 ( 68) 118 ( 86) 122 (104) 124

( 15)103 ( 33) 111 ( 51) 114 ( 69) 118 ( 87) 122 (105) 124

( 16)104 ( 34) 111 ( 52) 114 ( 70) 118 ( 88) 122 (106) 124

( 17)105 ( 35) 111 ( 53) 115 ( 71) 119 ( 89) 122 (107) 124

( 18)105 ( 36) 112 ( 54) 115 ( 72) 119 ( 90) 122 (108) 124

(109) 125 (127) 132 (145) 146

(110) 125 (128) 132 (146) 149

*(111) 126 (129) 132 (147) 151

*(112) 126 (130) 133 (148) 151

(113) 126 (131) 133

(114) 126 (132) 133

(115) 127 (133) 133

(116) 127 (134) 133

(117) 127 (135) 134

(118) 127 (136) 136

(119) 127 (137) 137

(120) 127 (138) 137

(121) 127 (139) 138

(122) 127 (140) 138

(123) 128 (141) 141

(124) 129 (142) 141

(125) 130 (143) 142

(126) 131 (144) 145

На ранжированной совокупности определяются порядковые статистики:

  • нижний (первый) квартиль — Q1 = (X37 + X38)/2 = 112,0

  • медиана (второй квартиль) — Me= Q2 = (X74+X75)/2 = 119,5

  • верхний (третий) квартиль — Q3 = (X111 + X112)/2 = 126,0.

(Звездочками отмечены варианты, по которым определяются соответствующие порядковые статистики).

STATGRAPHICS предоставляет возможность расчета процентилей (перцентилей) — P[I] (PLOTTING AND DESCRIPTIVE STATISTICS: F.Descriptive Metods\Percentiles).

Для иллюстрации возможностей опции «Percentiles» рассчитаем P[0.25], P[0.50], P[0.75], P[0.95], P[0.99].

Очевидно, что P[0.25]=Q1, P[0.50]= Q2=Me и P[0.75]=Q3 (табл.8).

Результаты, полученные в табл. 8, полезно сравнить с расчетом выборочных статистик (табл. 6).

Таблица 8

Экран расчета процентилей

Percentiles ====================================================

Data vector: ST000000work1

Percentages Percentiles

25 = 112

50 = 119.5

75 = 126

90 = 133

95 = 141

99 = 151

Complete input fields and press F6.

1Help 2Edit 3Savscr4 Prtscr 5Opts 6Go 7Vars 8Cmd 9Device 10Quit

INPUT 4/ 6/95 12:14 STATGRAPHICS Vers. 5.1 Display PTILE

Если сразу после ввода имени переменной активизировать клавишу F5, получим подменю:

Switch input fields

Save percentages

Save percentiles

Выбрав в меню «Switch input fields» (переключение полей ввода), можно решить задачу, обратную предыдущей, то есть вычислить процент наблюдений, лежащих слева от введенного в поле ввода «Percentiles» числа.

Отметим, что вводимое число не обязано быть элементом анализируемой выборки.