- •Программа дисциплины
- •Статистика
- •Цели изучения дисциплины
- •2. Объем дисциплины по видам учебной работы и формы контроля
- •3. Содержание дисциплины
- •3.1. Разделы дисциплины и распределение времени работы студентов по видам занятий
- •3.2 Содержание разделов дисциплины
- •Статистическое наблюдение, сводка и группировка
- •Средние величины и показатели вариации
- •Анализ вариационных рядов
- •Выборочное наблюдение
- •Измерение связей
- •Многомерный статистический анализ
- •Методы анализа динамических рядов
- •5. Учебно - методическое обеспечение дисциплины
- •5.1 Рекомендуемая литература
- •Дополнительная
- •5.2 Материально-техническое обеспечение дисциплины
- •5.3. Программное обеспечение дисциплины
- •2. Методические указания к выполнению курсового проекта
- •2.1 Ввод статистики в базу данных statgraphics
- •2.2 . Анализ эмпирического распределения
- •2.2.1. Расчет выборочных статистик
- •2.2.2. Графическое и табличное представление статистики
- •2.2.3 Сглаживание эмпирического распределения
- •2.3. Проведение выборочного наблюдения
- •Кафедра Предпринимательства и коммерции
- •Задание на курсовой проект по дисциплине «статистика».
- •Вариант №______ Группа № ___________
- •Фамилия и.О. Студента__________________________
- •1. Анализ эмпирического распределения
- •2. Проведение выборочного наблюдения
- •Курсовой проект
- •Содержание
2.2 . Анализ эмпирического распределения
2.2.1. Расчет выборочных статистик
Статистический анализ распределения переменной work1 начнем, в соответствии с заданием, с расчета основных выборочных статистик, который реализуется с использованием опции Summary Statistics в разделе главного меню PLOTTING AND DESCRIPTIVE STATISTICS (F. Descriptive Metods\Summary Statistics). В поле Data vectors введем имя ST000000.work1, для чего весьма удобно пользоваться клавишей F7. Нажатием клавиши ENTER
имя отмеченной переменной заносится в активное поле (табл.2.3). Допускается одновременная обработка нескольких переменных, имена которых должны быть помещены в поле ввода в столбец (действует правило: одна переменная — одна строка).
Статистический анализ распределения переменной work1 начнем с расчета основных выборочных статистик, который реализуется с использованием опции Summary Statistics в разделе главного меню PLOTTING AND DESCRIPTIVE STATISTICS (F. Descriptive Metods\Summary Statistics). В поле Data vectors введем имя ST000000.work1, для чего удобно пользоваться клавишей F7. Нажатием клавиши ENTER имя отмеченной переменной заносится в активное поле (табл.5). Допускается одновременная обработка нескольких переменных, имена которых должны быть помещены в поле ввода в столбец (действует правило: одна переменная — одна строка).
Таблица 5
Summary
Statistics ===============================================================
Data
vectors: ST000000.work1
Statistics:
ABCDEFGHIJKLMNOPQRS
(а)Average
(f) Std.deviat (k)Lower quartile (p) Kurtosis
(b)
Median (g) Std. Error (l)Upper quartile (q) Std.kurt.
(c)I
Mode (h) Minimum (m)Interq.range I Coeff.of var (d)
Geom.mean (i) Maximum (n) Skewness (s) Sum (e)
Variance (j) Range (o) Std. Skewness Complete input
fields and press F6. 1Help
2Edit 3Savscr 4Prtscr5 6Go 7Vars 8Cmd 9Device 10Quit
INPUT
4/ 6/95 10:44 STATGRAPHICS
Vers.
5.1 Display
STATS
Пользователю предоставлена возможность расчета любого набора из 19 статистик, помеченных литерами A,…,S. В учебных целях рассчитывается полный набор показателей. Запуск программы на выполнение, как обычно – F6. Результат выводится на экран дисплея в форме табл. 6.
Таблица 6
Variable: ST000000.work1
========================================================= Sample
size 148
Average 119.041
Median
119.5
Mode 123
Geometric
mean 118.447
Variance 141.903
Standard
deviation 11.9123
Standard
error 0.979186
Minimum
88
Maximum 151
Range
63
Lower
quartile 112
Upper
quartile 126
Interquartile
range 14
Skewness
0.171856
Standardized
skewness 0.853531
Kurtosis
0.296863
Standardized
kurtosis 0.737193
Coeff.
Of variation 10.0069
Sum
17618
=========================================================
Press
Esc, Cursor keys or Page Number Pag. 1.1 of 1.1 1Help
2Edit 3Savscr 4Prtscr 5Prtopt 6Go7 VarsCmd 9Devicе
10Quit INPUT
4/ 6/95 10:44 STATGRAPHICS
Vers.
5.1Display
STATS
Таблица
2.3
Sample size — объем выборки (число единиц в совокупности).
Average — средняя арифметическая, рассчитываемая по формуле простой средней:
.
Median — медиана:
,
если n
— четное,
,
если n
— нечетное.
Mode — мода Мо определяется непосредственно по исходным данным.
Geometric mean — геометрическая средняя:
.
Variance — дисперсия:
.
Standard deviation — среднее квадратическое отклонение:
.
Standard error — средняя ошибка выборки:
.
Minimum — минимальное значение: Xmin .
Maximum — максимальное значение: Xmax.
Range — размах вариации: R = Xmax – Xmin.
Lower quartile — нижний (первый) квартиль:
,
,
,
где floor — округление до ближайшего целого;
ceiling — округление до ближайшего большего.
Upper quartile — верхний (третий) квартиль:
,
где
,
.
Interquartile range — межквартильная разность: Q3 – Q1.
Skewness — асимметрия:
.
Standardized skewness — стандартизованная асимметрия:
.
Kurtosis — коэффициент эксцесса (куртозис):
.
Standardized kurtosis — стандартизованный куртозис:
.
Coeff. оf variation — коэффициент вариации по среднему квадратическому отклонению (%):
.
Sum
— сумма значений
элементов выборки:
.
Содержательная интерпретация перечисленных статистик даётся на основе изучения учебной литературы и конспекта лекций. В пояснительной записке необходимо проанализировать асимметрию и эксцесс распределения и сделать выводы об их статистической значимости.
Для получения наглядного представления о порядковых статистиках анализируемого распределения (медиана, квартили и т.д.)необходимо ранжировать исследуемую совокупность, для чего удобно воспользоваться опцией редактора “Sort in ascending order”, вызываемой клавишей F5 в режиме редактирования файла. Ранжированная по возрастанию переменная work1 (переименованная в work11) представлена в табл. 7.
Таблица 7
Анализируемая статистическая совокупность,
ранжированная по возрастанию
Variable: ST000000.work11 (length = 148) 148)================================================================
( 1) 88 ( 19) 105 *( 37) 112 ( 55) 115 ( 73) 119 ( 91) 122
( 2) 94 ( 20) 105 ( 38) 112 ( 56) 115 ( 74) 119 ( 92) 122
( 3) 94 ( 21) 106 ( 39) 112 ( 57) 115*( 75) 120 ( 93) 123
( 4) 94 ( 22) 107 ( 40) 112 ( 58) 115 ( 76) 120 ( 94) 123
( 5) 97 ( 23) 108 ( 41) 113 ( 59) 116 ( 77) 120 ( 95) 123
( 6) 98 ( 24) 108 ( 42) 113 ( 60) 116 ( 78) 120 ( 96) 123
( 7) 99 ( 25) 109 ( 43) 113 ( 61) 116 ( 79) 120 ( 97) 123
( 8) 99 ( 26) 109 ( 44) 113 ( 62) 116 ( 80) 121 ( 98) 123
( 9)100 ( 27) 109 ( 45) 113 ( 63) 117 ( 81) 121 ( 99) 123
( 10)100 ( 28) 109 ( 46) 113 ( 64) 117 ( 82) 121 (100) 123
( 11)100 ( 29) 110 ( 47) 113 ( 65) 118 ( 83) 121 (101) 124
( 12)102 ( 30) 110 ( 48) 113 ( 66) 118 ( 84) 121 (102) 124
( 13)102 ( 31) 11 ( 49) 114 ( 67) 118 ( 85) 121 (103) 124
( 14)103 ( 32) 110 ( 50) 114 ( 68) 118 ( 86) 122 (104) 124
( 15)103 ( 33) 111 ( 51) 114 ( 69) 118 ( 87) 122 (105) 124
( 16)104 ( 34) 111 ( 52) 114 ( 70) 118 ( 88) 122 (106) 124
( 17)105 ( 35) 111 ( 53) 115 ( 71) 119 ( 89) 122 (107) 124
( 18)105 ( 36) 112 ( 54) 115 ( 72) 119 ( 90) 122 (108) 124
(109) 125 (127) 132 (145) 146
(110) 125 (128) 132 (146) 149
*(111) 126 (129) 132 (147) 151
*(112) 126 (130) 133 (148) 151
(113) 126 (131) 133
(114) 126 (132) 133
(115) 127 (133) 133
(116) 127 (134) 133
(117) 127 (135) 134
(118) 127 (136) 136
(119) 127 (137) 137
(120) 127 (138) 137
(121) 127 (139) 138
(122) 127 (140) 138
(123) 128 (141) 141
(124) 129 (142) 141
(125) 130 (143) 142
(126) 131 (144) 145
На ранжированной совокупности определяются порядковые статистики:
нижний (первый) квартиль — Q1 = (X37 + X38)/2 = 112,0
медиана (второй квартиль) — Me= Q2 = (X74+X75)/2 = 119,5
верхний (третий) квартиль — Q3 = (X111 + X112)/2 = 126,0.
(Звездочками отмечены варианты, по которым определяются соответствующие порядковые статистики).
STATGRAPHICS предоставляет возможность расчета процентилей (перцентилей) — P[I] (PLOTTING AND DESCRIPTIVE STATISTICS: F.Descriptive Metods\Percentiles).
Для иллюстрации возможностей опции «Percentiles» рассчитаем P[0.25], P[0.50], P[0.75], P[0.95], P[0.99].
Очевидно, что P[0.25]=Q1, P[0.50]= Q2=Me и P[0.75]=Q3 (табл.8).
Результаты, полученные в табл. 8, полезно сравнить с расчетом выборочных статистик (табл. 6).
Таблица 8
Экран расчета процентилей
Percentiles
==================================================== Data
vector: ST000000work1
Percentages Percentiles
25
= 112
50
= 119.5
75
= 126
90
= 133
95
= 141
99
= 151
Complete
input fields and press F6.
1Help
2Edit 3Savscr4 Prtscr 5Opts 6Go 7Vars 8Cmd 9Device 10Quit
INPUT
4/ 6/95 12:14 STATGRAPHICS
Vers.
5.1 Display
PTILE
Если сразу после ввода имени переменной активизировать клавишу F5, получим подменю:
Switch
input fields
Save
percentages
Save
percentiles
Выбрав в меню «Switch input fields» (переключение полей ввода), можно решить задачу, обратную предыдущей, то есть вычислить процент наблюдений, лежащих слева от введенного в поле ввода «Percentiles» числа.
Отметим, что вводимое число не обязано быть элементом анализируемой выборки.
