Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка_Статистика.doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.2 Mб
Скачать

2.2.3 Сглаживание эмпирического распределения

Построение модели эмпирического распределения, т.е. сглаживание его тем или иным известным из теории распределением, реализуется в разделе «Distribution Fitting» (табл. 13). В качестве теоретической модели возможно использовать 18 типов распределений, широко используемых в теории вероятностей и математической статистике. Выбор типа модельного распределения осуществляется либо на основе содержательного анализа исследуемой выборки (в том случае, если исходные данные представляют собой реальную статистику), либо исходя из самых общих соображений, опирающихся на визуальный анализ графиков распределений. После выбора теоретической модели распределения и соответствующего заполнения поля «Distribution number:» пользователю предлагается сделать выбор из нескольких опций, что определит содержание последующего решения (табл.13).

Таблица 13

Экран ввода данных для решения задачи сглаживания

Distribution Fitting

==============================================================

Data vector: ST000000.work1

Distributions available:

(1) Bernoulli ( 7) Beta (13) Lognormal

(2) Binomial ( 8) Chi-square (14) Normal

(3) Discrete uniform ( 9) Erlang (15) Student’s t

(4) Geometric (10) Exponential (16) Triangular

(5) Negative binomial (11) F (17) Uniform

(6) Poisson (12) Gamma (18) Weibull Distribution number: 14

¦ Histogram ¦

Mean: 119.041 ¦ Chi-square test ¦

Standard deviation: 11.9123 ¦ K-S test ¦

¦ Tail areas ¦ ¦ Critical values ¦

Highlight desired entry and press ENTER to select.

1Help 2Edit 3Savscr 4Prtscr 5 6Go 7Vars 8Cmd 9Device 10Quit

INPUT 4/ 6/95 12:50 STATGRAPHICS Vers. 5.1 Display DSTFIT

Histogram – строится гистограмма эмпирического распределения, на которую накладывается модельное распределение (рис. 3,4,5).

Chi-square test — решается задача проверки гипотезы о законе распределения по критерию Пирсона, критерий ХИ – квадрат (табл. 14,15,16). Расчет производится по следующей формуле

,

где fi - эмпирические абсолютные частоты (Observed Frequency)

fi-абсолютные частоты теоретического распределения (Expected Frequency)2

к – число интервалов при построении гистограммы.

K – S test — решается задача проверки гипотезы о законе распределения по критерию Колмогорова-Смирнова (в русскоязычной литературе это критерий λ). Рассчитываются значения статистик Колмогорова-Смирнова D (Estimated KOLMOGOROV statistic DPLUS) и D (Estimated KOLMOGOROV statistic DMINUS), а также значение статистики Колмогорова D (Estimated overall statistic DN) и минимальный уровень значимости последней статистики в случае простой гипотезы (Approximate significance level); Отметим, что критерий Колмогорова, строго говоря, не может быть использован в решаемой задаче (и во всех задачах подобного типа), так как в данном случае параметры модельного распределения определены по выборочным данным3.

Tail areas — вычисляется значение интегральной функции модельного распределения (с заданными параметрами «Mean» и «Standard deviation») для заданного значения аргумента. Предопределено значение , равное выборочной средней .

Сritical values — решается задача, обратная предыдущей, а именно по значению функции распределения находится соответствующий квантиль распределения.

Проиллюстрируем работу «Distribution Fitting», сгладив эмпирическое распределение переменной work1 нормальным, логарифмически-нормальным и треугольным распределениями (рис. 3,4,5). Формулы, по которым рассчитывается плотность модельного распределения, не приводятся. При необходимости они могут быть легко найдены в общедоступной справочной и учебной литературе по теории вероятностей и математической статистике.

Chisquare Test

===============================================================

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chisquare

===============================================================

at or below 97.33 5 5.1 .000769

97.33 104.00 11 10.2 .057238

104.00 110.67 16 20.4 .939415

110.67 117.33 32 29.9 .148590

117.33 124.00 44 32.3 4.218188

124.00 130.67 17 25.8 2.978559

130.67 137.33 13 15.1 .299748

above 137.33 10 9.2 .065394

===============================================================

Chisquare = 8.7079 with 5 d.f. Sig. Level = 0.121298

Press Esc, Cursor keys or Page Number: Page 1.1 of 1.1

1Help 2Edit 3Savscr4Prtscr 5Prtopt 6Go 7Vars8Cmd 9Device 10Quit

INPUT 10/ 2/95 11:58 STATGRAPHICS Vers. 5.1 Display DSTFIT

Таблица 14

Проверка гипотезы о нормальном распределении переменной work1

Рис 3. Гистограмма и расчетная кривая нормального распределения для переменной work1

Таблица 15

Проверка гипотезы о логарифмически-нормальном распределении

переменной work1

Chisquare Test

==============================================================

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chisquare

==============================================================

at or below 104.00 16 14 .15696

104.00 110.67 16 22 1.85437

110.67 117.33 32 32 .00749

117.33 124.00 44 32 4.92554

124.00 130.67 17 24 1.87704

130.67 137.33 13 14 .05663

above 137.33 10 10 .01964

===============================================================

Chisquare = 8.89767 with 4 d.f. Sig. Level = 0.0637087

Press Esc, Cursor keys or Page Number: Page 1.1 of 1.1

1Help 2Edit3Savscr 4Prtscr 5Prtopt 6Go 7Vars 8Cmd 9Device 10Quit

INPUT 10/ 2/95 11:58 STATGRAPHICS Vers. 5.1 Display DSTFIT

Рис. 4. Гистограмма и расчетная кривая логарифмически-нормального распределения для переменной work1

Таблица 16

Проверка гипотезы о треугольном распределении

переменной work1

Chisquare Test

==============================================================

Lower Upper Observed Expected

Limit Limit Frequency Frequency Chisquare

==============================================================

at or below 97.33 5 6.8 .474

97.33 104.00 11 13.2 .358

104.00 110.67 16 20.1 .838

110.67 117.33 32 27.0 .911

117.33 124.00 44 28.8 8.015

124.00 130.67 17 22.5 1.365

130.67 137.33 13 16.2 .631

above 137.33 10 13.3 .839

==============================================================

Chisquare = 13.4297 with 4 d.f. Sig. Level = 9.35648E-3

Press Esc, Cursor keys or Page Number: Page 1.1 of 1.1

1Help 2Edit3Savscr 4Prtscr 5Prtopt 6Go 7Vars 8Cmd 9Device 10Quit

INPUT 10/ 2/95 11:59 STATGRAPHICS Vers. 5.1 Display DSTFIT

Рис.5. Гистограмма и расчетная кривая треугольного распределения для переменной work1

Сгладив эмпирическое распределение каким либо теоретическим законом распределения, необходимо оценить правомерность такого сглаживания, то есть провести проверку статистической гипотезы о законе распределения. Как было сказано выше, в нашем распоряжении два статистических критерия согласия, обычно используемых в подобных задачах: критерий хи-квадрат и критерий Колмогорова. По очевидным причинам (см. стр. ) используем критерий Пирсона ( «Chi-square test»). Решение задачи представлено в таблицах 14, 15.16 . Результаты решения сведены в табл. 17.

Таблица 17

Результаты решения задачи сглаживания

Тип

распределения

Число

степеней

свободы

r

Расчетное

значение

критерия

Табличное

значение

критерия

(расчетное значение

уровня значимости)

нормальное

5

8.7079

11,07

0.121298

логнормальное

4

8.8967

9,488

0.0637087

треугольное

4

13.4297

9,488

9.35648E-3

Принятие решения о справедливости гипотезы о законе распределения можно осуществить, ориентируясь на эмпирическое значение критерия , либо на расчетное значение вероятности (расчетный уровень значимости) . Первое сравнивается с табличным значением , второе с принятым уровнем значимости ( примем ).

Окончательные выводы по проверке гипотез о законе распределения:

1. Так как

= 8,7079 < = 11,07 и

то гипотеза о нормальном распределении переменной work1 не противоречит статистическим данным.

  1. Так как

= 8,8967 < = 9,488 и

то гипотеза о логнормальном распределении переменной work1 не противоречит статистическим данным.

  1. Так как

= 13,4297 > = 9,488 и

то гипотеза о треугольном распределении переменной work1 отвергается на 9.35648Е-3 уровне значимости.