
- •Программа дисциплины
- •Статистика
- •Цели изучения дисциплины
- •2. Объем дисциплины по видам учебной работы и формы контроля
- •3. Содержание дисциплины
- •3.1. Разделы дисциплины и распределение времени работы студентов по видам занятий
- •3.2 Содержание разделов дисциплины
- •Статистическое наблюдение, сводка и группировка
- •Средние величины и показатели вариации
- •Анализ вариационных рядов
- •Выборочное наблюдение
- •Измерение связей
- •Многомерный статистический анализ
- •Методы анализа динамических рядов
- •5. Учебно - методическое обеспечение дисциплины
- •5.1 Рекомендуемая литература
- •Дополнительная
- •5.2 Материально-техническое обеспечение дисциплины
- •5.3. Программное обеспечение дисциплины
- •2. Методические указания к выполнению курсового проекта
- •2.1 Ввод статистики в базу данных statgraphics
- •2.2 . Анализ эмпирического распределения
- •2.2.1. Расчет выборочных статистик
- •2.2.2. Графическое и табличное представление статистики
- •2.2.3 Сглаживание эмпирического распределения
- •2.3. Проведение выборочного наблюдения
- •Кафедра Предпринимательства и коммерции
- •Задание на курсовой проект по дисциплине «статистика».
- •Вариант №______ Группа № ___________
- •Фамилия и.О. Студента__________________________
- •1. Анализ эмпирического распределения
- •2. Проведение выборочного наблюдения
- •Курсовой проект
- •Содержание
2.2.3 Сглаживание эмпирического распределения
Построение модели эмпирического распределения, т.е. сглаживание его тем или иным известным из теории распределением, реализуется в разделе «Distribution Fitting» (табл. 13). В качестве теоретической модели возможно использовать 18 типов распределений, широко используемых в теории вероятностей и математической статистике. Выбор типа модельного распределения осуществляется либо на основе содержательного анализа исследуемой выборки (в том случае, если исходные данные представляют собой реальную статистику), либо исходя из самых общих соображений, опирающихся на визуальный анализ графиков распределений. После выбора теоретической модели распределения и соответствующего заполнения поля «Distribution number:» пользователю предлагается сделать выбор из нескольких опций, что определит содержание последующего решения (табл.13).
Таблица 13
Экран ввода данных для решения задачи сглаживания
Distribution
Fitting ============================================================== Data
vector: ST000000.work1
Distributions
available:
(1)
Bernoulli ( 7) Beta (13) Lognormal
(2)
Binomial ( 8) Chi-square (14) Normal
(3)
Discrete uniform ( 9) Erlang (15) Student’s t
(4)
Geometric (10) Exponential (16) Triangular
(5)
Negative binomial (11) F (17) Uniform
(6)
Poisson (12) Gamma (18) Weibull Distribution
number: 14
¦ Histogram ¦
Mean:
119.041 ¦ Chi-square test ¦
Standard
deviation: 11.9123 ¦ K-S test ¦
¦ Tail areas ¦ ¦ Critical values ¦
Highlight desired entry and press ENTER to select.
1Help
2Edit 3Savscr 4Prtscr 5 6Go 7Vars 8Cmd 9Device 10Quit INPUT
4/ 6/95 12:50 STATGRAPHICS
Vers.
5.1 Display
DSTFIT
Chi-square test — решается задача проверки гипотезы о законе распределения по критерию Пирсона, критерий ХИ – квадрат (табл. 14,15,16). Расчет производится по следующей формуле
,
где fi - эмпирические абсолютные частоты (Observed Frequency)
fi’-абсолютные частоты теоретического распределения (Expected Frequency)2
к – число интервалов при построении гистограммы.
K – S test — решается задача проверки гипотезы о законе распределения по критерию Колмогорова-Смирнова (в русскоязычной литературе это критерий λ). Рассчитываются значения статистик Колмогорова-Смирнова D (Estimated KOLMOGOROV statistic DPLUS) и D (Estimated KOLMOGOROV statistic DMINUS), а также значение статистики Колмогорова D (Estimated overall statistic DN) и минимальный уровень значимости последней статистики в случае простой гипотезы (Approximate significance level); Отметим, что критерий Колмогорова, строго говоря, не может быть использован в решаемой задаче (и во всех задачах подобного типа), так как в данном случае параметры модельного распределения определены по выборочным данным3.
Tail
areas —
вычисляется значение интегральной
функции модельного распределения
(с заданными параметрами «Mean» и
«Standard deviation») для заданного значения
аргумента. Предопределено
значение
,
равное
выборочной
средней
.
Сritical values — решается задача, обратная предыдущей, а именно по значению функции распределения находится соответствующий квантиль распределения.
Проиллюстрируем работу «Distribution Fitting», сгладив эмпирическое распределение переменной work1 нормальным, логарифмически-нормальным и треугольным распределениями (рис. 3,4,5). Формулы, по которым рассчитывается плотность модельного распределения, не приводятся. При необходимости они могут быть легко найдены в общедоступной справочной и учебной литературе по теории вероятностей и математической статистике.
Chisquare
Test
===============================================================
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chisquare
=============================================================== at
or below 97.33 5 5.1 .000769
97.33 104.00 11 10.2 .057238
104.00 110.67 16 20.4 .939415
110.67 117.33 32 29.9 .148590
117.33 124.00 44 32.3 4.218188
124.00 130.67 17 25.8 2.978559
130.67 137.33 13 15.1 .299748
above
137.33
10 9.2 .065394
=============================================================== Chisquare
= 8.7079 with 5 d.f. Sig. Level = 0.121298
Press
Esc, Cursor keys or Page Number: Page 1.1 of 1.1
1Help
2Edit 3Savscr4Prtscr 5Prtopt 6Go 7Vars8Cmd 9Device 10Quit
INPUT
10/ 2/95 11:58 STATGRAPHICS Vers. 5.1 Display DSTFIT
Проверка гипотезы о нормальном распределении переменной work1
Рис
3. Гистограмма
и
расчетная
кривая
нормального
распределения
для
переменной
work1
Таблица 15
Проверка гипотезы о логарифмически-нормальном распределении
переменной work1
Chisquare
Test ==============================================================
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chisquare
============================================================== at
or below
104.00 16 14 .15696
104.00 110.67 16 22 1.85437
110.67 117.33 32 32 .00749
117.33 124.00 44 32 4.92554
124.00 130.67 17 24 1.87704
130.67 137.33 13 14 .05663
above
137.33 10 10 .01964
=============================================================== Chisquare
= 8.89767 with 4 d.f. Sig. Level = 0.0637087
Press
Esc, Cursor keys or Page Number: Page 1.1 of 1.1
1Help
2Edit3Savscr 4Prtscr 5Prtopt 6Go 7Vars 8Cmd 9Device 10Quit INPUT
10/ 2/95 11:58 STATGRAPHICS Vers. 5.1 Display DSTFIT
Рис.
4. Гистограмма
и
расчетная
кривая
логарифмически-нормального
распределения
для
переменной
work1
Таблица 16
Проверка гипотезы о треугольном распределении
переменной work1
Chisquare
Test ==============================================================
Lower Upper Observed Expected
Limit Limit Frequency Frequency Chisquare
============================================================== at
or below
97.33 5 6.8 .474
97.33 104.00 11 13.2 .358
104.00 110.67 16 20.1 .838
110.67 117.33 32 27.0 .911
117.33 124.00 44 28.8 8.015
124.00 130.67 17 22.5 1.365
130.67 137.33 13 16.2 .631
above
137.33
10 13.3 .839
============================================================== Chisquare
= 13.4297 with 4 d.f. Sig. Level = 9.35648E-3
Press
Esc, Cursor keys or Page Number: Page 1.1 of 1.1
1Help
2Edit3Savscr 4Prtscr 5Prtopt 6Go 7Vars 8Cmd 9Device 10Quit INPUT
10/ 2/95 11:59 STATGRAPHICS Vers. 5.1 Display DSTFIT
Рис.5.
Гистограмма
и
расчетная
кривая
треугольного
распределения
для
переменной
work1
Сгладив эмпирическое распределение каким либо теоретическим законом распределения, необходимо оценить правомерность такого сглаживания, то есть провести проверку статистической гипотезы о законе распределения. Как было сказано выше, в нашем распоряжении два статистических критерия согласия, обычно используемых в подобных задачах: критерий хи-квадрат и критерий Колмогорова. По очевидным причинам (см. стр. ) используем критерий Пирсона ( «Chi-square test»). Решение задачи представлено в таблицах 14, 15.16 . Результаты решения сведены в табл. 17.
Таблица 17
Результаты решения задачи сглаживания
Тип
распределения |
Число степеней свободы r |
Расчетное значение критерия
|
Табличное значение критерия
|
(расчетное значение уровня значимости) |
нормальное |
5 |
8.7079 |
11,07 |
0.121298 |
логнормальное |
4 |
8.8967 |
9,488 |
0.0637087 |
треугольное |
4 |
13.4297 |
9,488 |
9.35648E-3 |
Принятие
решения
о
справедливости гипотезы
о законе распределения можно
осуществить,
ориентируясь
на
эмпирическое
значение
критерия
,
либо
на
расчетное
значение
вероятности
(расчетный уровень значимости)
.
Первое сравнивается с табличным значением
,
второе с принятым уровнем значимости
( примем
).
Окончательные выводы по проверке гипотез о законе распределения:
1. Так как
=
8,7079 <
=
11,07 и
то гипотеза о нормальном распределении переменной work1 не противоречит статистическим данным.
Так как
=
8,8967 <
=
9,488 и
то гипотеза о логнормальном распределении переменной work1 не противоречит статистическим данным.
Так как
= 13,4297 > = 9,488 и
то гипотеза о треугольном распределении переменной work1 отвергается на 9.35648Е-3 уровне значимости.