Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб практикум часть 2 (последняя версия).doc
Скачиваний:
25
Добавлен:
09.02.2015
Размер:
2.9 Mб
Скачать

3. Критерий согласия

Критерием согласия называют критерии проверки статистических гипотез о виде закона распределения г.с. Примером статистической гипотезы о виде закона распределения г.с. X является: «Г.с. X имеет нормальный (равномерный и т.д.) закон распределения». Такая гипотеза принимается за основную гипотезу H0.

Рассмотрим подробно эффективный критерий согласия Пир-сона .

Пусть проверяется гипотеза «Г.с. X имеет гипотетическую функцию распределения », где– неизвестные параметры распределения, вид функцииF известен, l 1. Рассмотрим случай непрерывного распределения.

На первом этапе по реализации выборки объёма n строится интервальный статистический ряд с k = [1+3.32lg n] +1 частичными промежутками (см. п. 1). Пусть получены равные промежутки с границами в точках . Рассмотрим промежутки:

. (3)

Пусть по выборке найдены точечные оценки неизвестных параметров (методом максимального правдоподобия). Тогда при помощи гипотетической функции распределения можно найти вероятности

(4)

.

Известно, что при достаточно больших значениях объёма выборки n случайная величина

(5)

имеет распределение, близкое к распределению (хи- квадрат) со степенью свободы s = k– l – 1, где k – число интервалов, l – число неизвестных параметров, заменённых их точечными оценками, mi – частота i-го интервала. Если основная гипотеза верна, то величина npi будет близка к частоте ni, т.е. сумма будет мала. В качестве статистики критерия выбирается случайная величина . Тогда при заданном уровне значимости основная гипотеза отвергается, когда . Это равенство эквивалентно. А это означает, что– квантиль распределения порядка 1– со степенью свободы s = k– l – 1.

Таким образом, если выборочное значение статистикиокажется меньше квантили, то основная гипотеза принимается.

Сформулируем кратко критерий проверки гипотезы о виде закона распределения г.с.

1) По данной реализации выборки построить интервальный статистический ряд, найти промежутки (3).

2) Вычислить по реализации выборки точечные оценки неизвестных параметров .

3) Вычислить величины npi (i = 1, …, k) по формулам (4). Проверить выполнение условий npi  5. Если для некоторых интервалов это условие нарушается, то этот интервал объединяется с соседним (при этом складываются вероятности pi и частоты этих интервалов). Эта процедура продолжается до тех пор, пока для всех интервалов не будет выполняться условие npi  5.

4) По формуле (5) вычислить выборочное значениестатистики.

5) По таблице найти квантиль распределения порядка 1– со степенью свободы s = k– l – 1, где k – число интервалов после пересчёта в пункте 3, l – число неизвестных параметров, заменённых их точечными оценками в пункте 2.

6) Если <, то основная гипотеза принимается на уровне значимости ; если , то основная гипотеза отвергается.

Статистические вычисления в Maple

Пакет stats поддерживает разнообразные статистические вычисления и включает в себя следующие подпакеты:

describe − содержит функции для вычисления статистических характеристик данных;

fit − для регрессионного анализа (аппроксимации данных заданными зависимостями);

transform − для преобразования статистических данных;

random − для генерирования случайных массивов данных с заданными свойствами;

statevalf − для получения численных оценок массивов данных;

statplots − для графического представления данных.

Задание. Для изучения некоторой дискретной случайной величины из генеральной совокупности была извлечена выборка объёма .

  1. Получить статистический ряд частот и относительных частот выборки.

  2. Определить накопленные частоты и накопленные относительные частоты.

  3. Построить полигон частот и кумуляту выборки.

  4. Записать эмпирическую функцию распределения и построить её график.

  5. Получить выборочное среднее, моду, медиану, выборочную дисперсию, несмещённую выборочную дисперсию, выборочное сред-неквадратическое отклонение.

Варианты заданий

    1. 0, 3, 1, 2, 2, 0, 3, 3, 0, 1, 3, 2, 2, 1, 0, 3, 1, 1, 3, 0, 2, 2, 3, 2, 3, 2, 1, 3, 1, 3, 0, 3, 1, 0, 0, 2, 0, 2, 0, 1;

    2. 3, 3, 1, 3, 1, 1, 1, 3, 1, 3, 1, 1, 3, 1, 4, 4, 3, 1, 4, 1, 2, 2, 4, 2, 2, 4, 3, 1, 4, 3, 4, 4, 4, 3, 1, 1, 3, 1, 2, 2;

    3. 4, 5, 2, 4, 2, 3, 4, 4, 5, 4, 5, 5, 4, 2, 2, 5, 2, 5, 2, 5, 5, 5, 5, 3, 5, 3, 5, 2, 2, 4, 4, 3, 3, 4, 3, 4, 4, 5, 3, 3;

    4. 5, 4, 6, 4, 3, 3, 3, 4, 5, 3, 4, 6, 4, 3, 3, 5, 6, 5, 5, 5, 3, 3, 4, 6, 4, 5, 5, 5, 3, 6, 3, 4, 3, 6, 6, 4, 3, 4, 6, 5;

    5. 5, 7, 6, 7, 7, 7, 4, 5, 5, 7, 7, 6, 4, 5, 5, 4, 5, 4, 7, 7, 5, 5, 7, 7, 5, 6, 6, 5, 7, 7, 7, 7, 7, 6, 7, 5, 5, 4, 7, 6;

    6. 5, 5, 6, 5, 5, 7, 8, 5, 8, 6, 8, 6, 7, 5, 6, 8, 7, 5, 8, 7, 7, 7, 8, 8, 8, 6, 6, 5, 5, 7, 5, 8, 7, 5, 5, 8, 7, 6, 5, 5;

    7. 6, 7, 8, 7, 7, 8, 7, 6, 8, 7, 8, 7, 6, 8, 8, 8, 7, 9, 9, 7, 7, 7, 9, 7, 6, 9, 6, 7, 7, 7, 6, 7, 6, 9, 8, 9, 8, 8, 6, 6;

    8. 8, 10, 8, 9, 8, 9, 8, 7, 10, 7, 8, 7, 7, 10, 8, 7, 9, 9, 10, 8, 8, 8, 10, 9, 7, 7, 10, 10, 9, 7, 7, 9, 7, 9, 10, 8, 7, 7, 10, 7;

    9. 9, 10, 9, 9, 8, 8, 11, 11, 9, 8, 9, 11, 9, 10, 9, 11, 8, 9, 10, 10, 8, 8, 8, 9, 10, 10, 9, 10, 10, 11, 9, 11, 8, 9, 11, 8, 10, 10, 11, 11;

    10. 12, 10, 10, 10, 10, 10, 12, 12, 12, 12, 10, 12, 12, 10, 9, 11, 10, 11, 9, 9, 9, 11, 12, 11, 9, 10, 10, 12, 11, 12, 12, 9, 10, 10, 9, 9, 10, 11, 12, 10;

    11. 13, 11, 10, 10, 11, 10, 11, 12, 11, 12, 12, 12, 10, 13, 10, 12, 10, 11, 11, 10, 10, 13, 11, 10, 13, 12, 12, 13, 12, 11, 12, 10, 11, 10, 13, 10, 13, 10, 13, 12;

    12. 13, 14, 12, 13, 14, 11, 13, 13, 11, 13, 13, 13, 12, 12, 11, 12, 14, 14, 11, 13, 12, 14, 11, 13, 12, 14, 13, 11, 11, 12, 11, 12, 11, 13, 11, 12, 13, 13, 11, 13;

    13. 14, 14, 15, 12, 14, 12, 14, 14, 14, 14, 13, 13, 15, 15, 12, 13, 12, 14, 14, 12, 12, 13, 14, 13, 12, 13, 13, 15, 14, 12, 14, 14, 14, 14, 13, 12, 14, 12, 15, 12;

    14. 15, 15, 14, 16, 13, 16, 15, 13, 15, 16, 15, 14, 14, 16, 13, 13, 15, 15, 15, 13, 15, 16, 14, 16, 16, 14, 13, 16, 13, 14, 14, 16, 15, 13, 13, 15, 15, 13, 13, 16;

    15. 17, 15, 17, 15, 14, 15, 16, 14, 17, 15, 16, 14, 15, 16, 16, 14, 15, 15, 15, 14, 15, 17, 14, 17, 15, 17, 16, 15, 14, 15, 17, 16, 15, 17, 14, 16, 17, 17, 14, 17;

    16. 17, 16, 18, 16, 18, 15, 18, 17, 17, 16, 17, 17, 16, 16, 16, 18, 16, 17, 17, 16, 18, 17, 17, 16, 16, 18, 17, 18, 17, 18, 16, 17, 18, 16, 15, 18, 16, 16, 17, 18;

    17. 17, 16, 18, 18, 19, 18, 19, 17, 19, 16, 17, 16, 18, 17, 19, 19, 16, 18, 16, 18, 17, 17, 17, 16, 18, 17, 18, 18, 17, 18, 19, 17, 17, 18, 19, 18, 17, 17, 17, 17;

    18. 17, 19, 17, 19, 19, 20, 19, 17, 17, 18, 20, 19, 19, 19, 19, 18, 18, 19, 20, 20, 19, 19, 19, 19, 18, 19, 17, 18, 18, 19, 17, 18, 19, 17, 18, 20, 19, 19, 20, 17;

    19. 21, 20, 18, 19, 21, 21, 18, 18, 21, 20, 21, 21, 19, 19, 21, 21, 19, 21, 21, 18, 19, 18, 18, 18, 19, 21, 19, 21, 19, 19, 21, 18, 18, 19, 20, 19, 18, 20, 21, 19;

    20. 20, 22, 21, 21, 21, 21, 19, 22, 20, 20, 22, 22, 22, 20, 19, 20, 20, 22, 21, 21, 22, 19, 22, 21, 22, 22, 22, 22, 22, 21, 22, 22, 20, 19, 20, 19, 22, 21, 20, 19;

    21. 20, 21, 23, 22, 21, 20, 22, 21, 21, 20, 23, 23, 22, 22, 22, 20, 23, 20, 22, 20, 21, 22, 21, 22, 22, 22, 20, 21, 20, 22, 20, 21, 22, 22, 22, 22, 20, 23, 23, 23;

    22. 21, 22, 22, 21, 22, 23, 24, 23, 24, 23, 24, 24, 23, 24, 23, 24, 24, 23, 23, 24, 21, 23, 24, 21, 21, 22, 23, 24, 21, 21, 24, 23, 23, 21, 23, 21, 23, 23, 23, 21;

    23. 24, 23, 23, 22, 24, 23, 25, 23, 25, 24, 25, 24, 25, 24, 24, 25, 25, 25, 23, 23, 24, 25, 24, 22, 23, 22, 25, 25, 24, 24, 23, 25, 23, 22, 22, 22, 22, 23, 24, 25;

    24. 23, 25, 25, 24, 24, 23, 26, 26, 23, 26, 23, 24, 24, 25, 24, 23, 24, 25, 26, 24, 25, 24, 24, 26, 24, 25, 25, 23, 25, 26, 26, 25, 25, 25, 23, 26, 26, 25, 24, 23;

    25. 25, 27, 26, 26, 25, 27, 26, 25, 24, 27, 27, 24, 27, 26, 26, 24, 24, 25, 24, 26, 27, 24, 24, 27, 25, 26, 27, 26, 27, 27, 26, 27, 24, 24, 26, 24, 25, 27, 27, 27;

    26. 28, 27, 28, 25, 27, 25, 25, 25, 28, 26, 27, 25, 25, 25, 26, 25, 26, 28, 25, 27, 27, 28, 27, 26, 25, 28, 25, 26, 25, 25, 27, 25, 25, 28, 28, 25, 28, 27, 25, 27;

    27. 27, 28, 26, 28, 27, 28, 28, 29, 27, 27, 28, 29, 28, 28, 27, 27, 28, 28, 28, 29, 27, 29, 26, 26, 26, 29, 29, 28, 26, 29, 26, 29, 28, 27, 27, 28, 27, 28, 29, 27;

    28. 30, 28, 30, 28, 27, 28, 27, 29, 28, 28, 30, 27, 29, 27, 30, 28, 28, 27, 30, 28, 27, 28, 27, 27, 27, 28, 28, 30, 28, 27, 29, 29, 29, 30, 28, 29, 28, 27, 28, 27;

    29. 30, 29, 28, 31, 28, 30, 30, 31, 28, 28, 31, 30, 28, 31, 29, 28, 31, 31, 31, 29, 30, 31, 30, 28, 31, 29, 30, 29, 30, 28, 28, 31, 29, 31, 28, 28, 30, 28, 29, 30;

    30. 30, 31, 32, 29, 30, 32, 31, 29, 30, 32, 30, 30, 30, 32, 32, 31, 32, 31, 32, 30, 30, 29, 30, 31, 32, 30, 31, 31, 29, 32, 29, 30, 30, 30, 29, 30, 30, 32, 31, 31.

Пример выполнения работы

Загрузим пакет stats и подпакеты transform, describe.

> with(stats): with(transform):with(describe):

Введём выборку :

>X:=[39,41,40,42,41,40,42,44,40,43,42,41,43,39,42,41,42,39,41,37,43,41,38,43,42,41,40,41,38,44,40,39,41,40,42,40,41,42,40,43,38,39,41,41,42];

X:=[39,41,40,42,41,40,42,44,40,43,42,41,43,39,42,41,42,39,41,37,43,41, 38,43,42,41,40,41,38,44,40,39,41,40,42,40,41,42,40,43,38,39,41,41,42].

Определим объём выборки (подсчитаем количество значений в выборке):

> n:=count(X);

n=45

Построим статистический ряд частот (варианты расположим в порядке возрастания и каждой варианте поставим в соответствие её частоту − число, показывающее, сколько раз данная варианта встречается в выборке).

> X1:=tally(X);

.

Если работа выполняется в Maple V, R4, то варианты могут оказаться расположенными в произвольном порядке, необходимо ряд переписать так, чтобы они были расположены по возрастанию.

> X2:= statsort(X1);

.

Получим статистический ряд относительных частот (каждой варианте поставим в соответствие её относительную частоту, т.е. частоту, делённую на объём выборки).

> X3:= scaleweight[1/n](X2);

.

Найдём накопленные частоты. Накопленная частота показывает, сколько наблюдалось значений, меньших заданного x:

> X4:=cumulativefrequency(X2);

.

Найдём относительные накопленные частоты:

> X5:=cumulativefrequency(X3);

.

Построим полигон частот. На координатной плоскости отметим точки, абсциссами которых являются варианты, а ординатами – их частоты, и соединим эти точки последовательно отрезками прямых:

> a:=plots[pointplot]([[37,1],[38,3],[39,5],[40,8],[41,12],[42,9],[43,5],

[44,2]]):> b:=plot([[37,1],[38,3],[39,5],[40,8],[41,12],[42,9],[43,5],[44,2]]):

> plots[display]([a,b]);

Построим кумуляту. На координатной плоскости построим точки, абсциссами которых являются варианты, а ординатами – их накопленные частоты, и соединим эти точки отрезками прямых:

a1:=plots[pointplot]([[37,0],[38,X4[1]],[39,X4[2]],[40,X4[3]],[41,X4[4]],[42,X4[5]],[43,X4[6]],[44,X4[7]],[45,X4[8]]], color=black):

b1:=plot([[37,0],[38,X4[1]],[39,X4[2]],[40,X4[3]],[41,X4[4]],[42,X4[5]],[43,X4[6]], [44,X4[7]],[45,X4[8]]],color=green):

    • plots[display]([a1,b1]);

Запишем эмпирическую функцию распределения.

> F:=piecewise(x<=37,0,x>37 and x<=38,X5[1],x>38 and x<=39,X5[2],x>39 and x<=40,X5[3],x>40 and x<=41,X5[4],x>41 and x<=42,X5[5],x>42 and x<=43,X5[6],x>43 and x<=44,X5[7],x>44,X5[8]);

Теперь построим её график.

> plot(F,x=37..45,color=blue);

Найдем выборочную среднюю и её значение в виде числа с плавающей точкой:

> M:=mean(X);evalf(M);

M:=613/15

40.86666667

Определим выборочную моду:

> mode(X);

41

Определим выборочную медиану:

> median(X);

41

Найдём выборочную дисперсию:

>S:=variance(X);evalf(S);

S:=586/225

2.604444444

Найдём несмещённую выборочную дисперсию:

> S1:=n/(n-1)*S; evalf(S1);

S1:=293/110

2.663636364

Вычислим среднеквадратическое отклонение (корень квадратный из дисперсии):

> sigma:=standarddeviation(X);evalf(sigma);

1.613829125