- •Математика
- •Режим доступа к электронному аналогу печатного издания: http://www.Libdb.Sssu.Ru
- •Содержание
- •Предисловие
- •Лабораторная работа 1
- •Варианты заданий
- •Пример выполнения лабораторной работы
- •Контрольные вопросы
- •Лабораторная работа 2 Исследование дискретной и непрерывной случайных величин
- •Пример выполнения задания 1
- •Контрольные вопросы
- •Лабораторная работа 3 Линейная регрессия
- •Контрольные вопросы
- •Лабораторная работа 4
- •Рассмотрим три закона распределения, которые часто используются в теории вероятностей.
- •1. Распределение (читается «хи в квадрате»). Пусть n(0, 1), – независимые нормально распределённые с.В. С.В. Называетсяраспределённой по закону со степенью свободыk.
- •2. Распределение Стьюдента т(k). С.В. , гдеU n(0, 1), называется распределённой по закону Стьюдента со степенью свободы k.
- •3. С.В. , где k1, k2 – натуральные числа, называется распределённой по закону Фишера со степенями свободы k1, k2.
- •1 Доверительный интервал для м.О. Нормально распределённой с.В.
- •2 Доверительный интервал для дисперсии нормально распределённой г.С.
- •Проверка статистических гипотез
- •1. Предварительная обработка реализации выборки
- •F*(X) – статистическая функция распределения; f(X) – функция распределения
- •2. Основные понятия проверки статистических гипотез
- •3. Критерий согласия
- •Лабораторная работа 5
- •Обработка результатов экспериментов, определение точечных оценок числовых характеристик и параметров распределения.
- •Проверка гипотезы о законе распределения
- •Генеральной совокупности по критерию согласия
- •Контрольные вопросы к лабораторным работам 4 и 5
- •Библиографический список
- •Приложение 5 (справочное) Критические точки распределения Стьюдента
- •Приложение 6
- •Учебное издание
3. Критерий согласия
Критерием согласия называют критерии проверки статистических гипотез о виде закона распределения г.с. Примером статистической гипотезы о виде закона распределения г.с. X является: «Г.с. X имеет нормальный (равномерный и т.д.) закон распределения». Такая гипотеза принимается за основную гипотезу H0.
Рассмотрим подробно эффективный критерий согласия Пир-сона .
Пусть проверяется гипотеза «Г.с. X имеет гипотетическую функцию распределения », где– неизвестные параметры распределения, вид функцииF известен, l 1. Рассмотрим случай непрерывного распределения.
На первом этапе по реализации выборки объёма n строится интервальный статистический ряд с k = [1+3.32lg n] +1 частичными промежутками (см. п. 1). Пусть получены равные промежутки с границами в точках . Рассмотрим промежутки:
. (3)
Пусть по выборке найдены точечные оценки неизвестных параметров (методом максимального правдоподобия). Тогда при помощи гипотетической функции распределения можно найти вероятности
(4)
.
Известно, что при достаточно больших значениях объёма выборки n случайная величина
(5)
имеет распределение, близкое к распределению (хи- квадрат) со степенью свободы s = k– l – 1, где k – число интервалов, l – число неизвестных параметров, заменённых их точечными оценками, mi – частота i-го интервала. Если основная гипотеза верна, то величина npi будет близка к частоте ni, т.е. сумма будет мала. В качестве статистики критерия выбирается случайная величина . Тогда при заданном уровне значимости основная гипотеза отвергается, когда . Это равенство эквивалентно. А это означает, что– квантиль распределения порядка 1– со степенью свободы s = k– l – 1.
Таким образом, если выборочное значение статистикиокажется меньше квантили, то основная гипотеза принимается.
Сформулируем кратко критерий проверки гипотезы о виде закона распределения г.с.
1) По данной реализации выборки построить интервальный статистический ряд, найти промежутки (3).
2) Вычислить по реализации выборки точечные оценки неизвестных параметров .
3) Вычислить величины npi (i = 1, …, k) по формулам (4). Проверить выполнение условий npi 5. Если для некоторых интервалов это условие нарушается, то этот интервал объединяется с соседним (при этом складываются вероятности pi и частоты этих интервалов). Эта процедура продолжается до тех пор, пока для всех интервалов не будет выполняться условие npi 5.
4) По формуле (5) вычислить выборочное значениестатистики.
5) По таблице найти квантиль распределения порядка 1– со степенью свободы s = k– l – 1, где k – число интервалов после пересчёта в пункте 3, l – число неизвестных параметров, заменённых их точечными оценками в пункте 2.
6) Если <, то основная гипотеза принимается на уровне значимости ; если , то основная гипотеза отвергается.
Статистические вычисления в Maple
Пакет stats поддерживает разнообразные статистические вычисления и включает в себя следующие подпакеты:
describe − содержит функции для вычисления статистических характеристик данных;
fit − для регрессионного анализа (аппроксимации данных заданными зависимостями);
transform − для преобразования статистических данных;
random − для генерирования случайных массивов данных с заданными свойствами;
statevalf − для получения численных оценок массивов данных;
statplots − для графического представления данных.
Задание. Для изучения некоторой дискретной случайной величины из генеральной совокупности была извлечена выборка объёма .
Получить статистический ряд частот и относительных частот выборки.
Определить накопленные частоты и накопленные относительные частоты.
Построить полигон частот и кумуляту выборки.
Записать эмпирическую функцию распределения и построить её график.
Получить выборочное среднее, моду, медиану, выборочную дисперсию, несмещённую выборочную дисперсию, выборочное сред-неквадратическое отклонение.
Варианты заданий
0, 3, 1, 2, 2, 0, 3, 3, 0, 1, 3, 2, 2, 1, 0, 3, 1, 1, 3, 0, 2, 2, 3, 2, 3, 2, 1, 3, 1, 3, 0, 3, 1, 0, 0, 2, 0, 2, 0, 1;
3, 3, 1, 3, 1, 1, 1, 3, 1, 3, 1, 1, 3, 1, 4, 4, 3, 1, 4, 1, 2, 2, 4, 2, 2, 4, 3, 1, 4, 3, 4, 4, 4, 3, 1, 1, 3, 1, 2, 2;
4, 5, 2, 4, 2, 3, 4, 4, 5, 4, 5, 5, 4, 2, 2, 5, 2, 5, 2, 5, 5, 5, 5, 3, 5, 3, 5, 2, 2, 4, 4, 3, 3, 4, 3, 4, 4, 5, 3, 3;
5, 4, 6, 4, 3, 3, 3, 4, 5, 3, 4, 6, 4, 3, 3, 5, 6, 5, 5, 5, 3, 3, 4, 6, 4, 5, 5, 5, 3, 6, 3, 4, 3, 6, 6, 4, 3, 4, 6, 5;
5, 7, 6, 7, 7, 7, 4, 5, 5, 7, 7, 6, 4, 5, 5, 4, 5, 4, 7, 7, 5, 5, 7, 7, 5, 6, 6, 5, 7, 7, 7, 7, 7, 6, 7, 5, 5, 4, 7, 6;
5, 5, 6, 5, 5, 7, 8, 5, 8, 6, 8, 6, 7, 5, 6, 8, 7, 5, 8, 7, 7, 7, 8, 8, 8, 6, 6, 5, 5, 7, 5, 8, 7, 5, 5, 8, 7, 6, 5, 5;
6, 7, 8, 7, 7, 8, 7, 6, 8, 7, 8, 7, 6, 8, 8, 8, 7, 9, 9, 7, 7, 7, 9, 7, 6, 9, 6, 7, 7, 7, 6, 7, 6, 9, 8, 9, 8, 8, 6, 6;
8, 10, 8, 9, 8, 9, 8, 7, 10, 7, 8, 7, 7, 10, 8, 7, 9, 9, 10, 8, 8, 8, 10, 9, 7, 7, 10, 10, 9, 7, 7, 9, 7, 9, 10, 8, 7, 7, 10, 7;
9, 10, 9, 9, 8, 8, 11, 11, 9, 8, 9, 11, 9, 10, 9, 11, 8, 9, 10, 10, 8, 8, 8, 9, 10, 10, 9, 10, 10, 11, 9, 11, 8, 9, 11, 8, 10, 10, 11, 11;
12, 10, 10, 10, 10, 10, 12, 12, 12, 12, 10, 12, 12, 10, 9, 11, 10, 11, 9, 9, 9, 11, 12, 11, 9, 10, 10, 12, 11, 12, 12, 9, 10, 10, 9, 9, 10, 11, 12, 10;
13, 11, 10, 10, 11, 10, 11, 12, 11, 12, 12, 12, 10, 13, 10, 12, 10, 11, 11, 10, 10, 13, 11, 10, 13, 12, 12, 13, 12, 11, 12, 10, 11, 10, 13, 10, 13, 10, 13, 12;
13, 14, 12, 13, 14, 11, 13, 13, 11, 13, 13, 13, 12, 12, 11, 12, 14, 14, 11, 13, 12, 14, 11, 13, 12, 14, 13, 11, 11, 12, 11, 12, 11, 13, 11, 12, 13, 13, 11, 13;
14, 14, 15, 12, 14, 12, 14, 14, 14, 14, 13, 13, 15, 15, 12, 13, 12, 14, 14, 12, 12, 13, 14, 13, 12, 13, 13, 15, 14, 12, 14, 14, 14, 14, 13, 12, 14, 12, 15, 12;
15, 15, 14, 16, 13, 16, 15, 13, 15, 16, 15, 14, 14, 16, 13, 13, 15, 15, 15, 13, 15, 16, 14, 16, 16, 14, 13, 16, 13, 14, 14, 16, 15, 13, 13, 15, 15, 13, 13, 16;
17, 15, 17, 15, 14, 15, 16, 14, 17, 15, 16, 14, 15, 16, 16, 14, 15, 15, 15, 14, 15, 17, 14, 17, 15, 17, 16, 15, 14, 15, 17, 16, 15, 17, 14, 16, 17, 17, 14, 17;
17, 16, 18, 16, 18, 15, 18, 17, 17, 16, 17, 17, 16, 16, 16, 18, 16, 17, 17, 16, 18, 17, 17, 16, 16, 18, 17, 18, 17, 18, 16, 17, 18, 16, 15, 18, 16, 16, 17, 18;
17, 16, 18, 18, 19, 18, 19, 17, 19, 16, 17, 16, 18, 17, 19, 19, 16, 18, 16, 18, 17, 17, 17, 16, 18, 17, 18, 18, 17, 18, 19, 17, 17, 18, 19, 18, 17, 17, 17, 17;
17, 19, 17, 19, 19, 20, 19, 17, 17, 18, 20, 19, 19, 19, 19, 18, 18, 19, 20, 20, 19, 19, 19, 19, 18, 19, 17, 18, 18, 19, 17, 18, 19, 17, 18, 20, 19, 19, 20, 17;
21, 20, 18, 19, 21, 21, 18, 18, 21, 20, 21, 21, 19, 19, 21, 21, 19, 21, 21, 18, 19, 18, 18, 18, 19, 21, 19, 21, 19, 19, 21, 18, 18, 19, 20, 19, 18, 20, 21, 19;
20, 22, 21, 21, 21, 21, 19, 22, 20, 20, 22, 22, 22, 20, 19, 20, 20, 22, 21, 21, 22, 19, 22, 21, 22, 22, 22, 22, 22, 21, 22, 22, 20, 19, 20, 19, 22, 21, 20, 19;
20, 21, 23, 22, 21, 20, 22, 21, 21, 20, 23, 23, 22, 22, 22, 20, 23, 20, 22, 20, 21, 22, 21, 22, 22, 22, 20, 21, 20, 22, 20, 21, 22, 22, 22, 22, 20, 23, 23, 23;
21, 22, 22, 21, 22, 23, 24, 23, 24, 23, 24, 24, 23, 24, 23, 24, 24, 23, 23, 24, 21, 23, 24, 21, 21, 22, 23, 24, 21, 21, 24, 23, 23, 21, 23, 21, 23, 23, 23, 21;
24, 23, 23, 22, 24, 23, 25, 23, 25, 24, 25, 24, 25, 24, 24, 25, 25, 25, 23, 23, 24, 25, 24, 22, 23, 22, 25, 25, 24, 24, 23, 25, 23, 22, 22, 22, 22, 23, 24, 25;
23, 25, 25, 24, 24, 23, 26, 26, 23, 26, 23, 24, 24, 25, 24, 23, 24, 25, 26, 24, 25, 24, 24, 26, 24, 25, 25, 23, 25, 26, 26, 25, 25, 25, 23, 26, 26, 25, 24, 23;
25, 27, 26, 26, 25, 27, 26, 25, 24, 27, 27, 24, 27, 26, 26, 24, 24, 25, 24, 26, 27, 24, 24, 27, 25, 26, 27, 26, 27, 27, 26, 27, 24, 24, 26, 24, 25, 27, 27, 27;
28, 27, 28, 25, 27, 25, 25, 25, 28, 26, 27, 25, 25, 25, 26, 25, 26, 28, 25, 27, 27, 28, 27, 26, 25, 28, 25, 26, 25, 25, 27, 25, 25, 28, 28, 25, 28, 27, 25, 27;
27, 28, 26, 28, 27, 28, 28, 29, 27, 27, 28, 29, 28, 28, 27, 27, 28, 28, 28, 29, 27, 29, 26, 26, 26, 29, 29, 28, 26, 29, 26, 29, 28, 27, 27, 28, 27, 28, 29, 27;
30, 28, 30, 28, 27, 28, 27, 29, 28, 28, 30, 27, 29, 27, 30, 28, 28, 27, 30, 28, 27, 28, 27, 27, 27, 28, 28, 30, 28, 27, 29, 29, 29, 30, 28, 29, 28, 27, 28, 27;
30, 29, 28, 31, 28, 30, 30, 31, 28, 28, 31, 30, 28, 31, 29, 28, 31, 31, 31, 29, 30, 31, 30, 28, 31, 29, 30, 29, 30, 28, 28, 31, 29, 31, 28, 28, 30, 28, 29, 30;
30, 31, 32, 29, 30, 32, 31, 29, 30, 32, 30, 30, 30, 32, 32, 31, 32, 31, 32, 30, 30, 29, 30, 31, 32, 30, 31, 31, 29, 32, 29, 30, 30, 30, 29, 30, 30, 32, 31, 31.
Пример выполнения работы
Загрузим пакет stats и подпакеты transform, describe.
> with(stats): with(transform):with(describe):
Введём выборку :
>X:=[39,41,40,42,41,40,42,44,40,43,42,41,43,39,42,41,42,39,41,37,43,41,38,43,42,41,40,41,38,44,40,39,41,40,42,40,41,42,40,43,38,39,41,41,42];
X:=[39,41,40,42,41,40,42,44,40,43,42,41,43,39,42,41,42,39,41,37,43,41, 38,43,42,41,40,41,38,44,40,39,41,40,42,40,41,42,40,43,38,39,41,41,42].
Определим объём выборки (подсчитаем количество значений в выборке):
> n:=count(X);
n=45
Построим статистический ряд частот (варианты расположим в порядке возрастания и каждой варианте поставим в соответствие её частоту − число, показывающее, сколько раз данная варианта встречается в выборке).
> X1:=tally(X);
.
Если работа выполняется в Maple V, R4, то варианты могут оказаться расположенными в произвольном порядке, необходимо ряд переписать так, чтобы они были расположены по возрастанию.
> X2:= statsort(X1);
.
Получим статистический ряд относительных частот (каждой варианте поставим в соответствие её относительную частоту, т.е. частоту, делённую на объём выборки).
> X3:= scaleweight[1/n](X2);
.
Найдём накопленные частоты. Накопленная частота показывает, сколько наблюдалось значений, меньших заданного x:
> X4:=cumulativefrequency(X2);
.
Найдём относительные накопленные частоты:
> X5:=cumulativefrequency(X3);
.
Построим полигон частот. На координатной плоскости отметим точки, абсциссами которых являются варианты, а ординатами – их частоты, и соединим эти точки последовательно отрезками прямых:
> a:=plots[pointplot]([[37,1],[38,3],[39,5],[40,8],[41,12],[42,9],[43,5],
[44,2]]):> b:=plot([[37,1],[38,3],[39,5],[40,8],[41,12],[42,9],[43,5],[44,2]]):
> plots[display]([a,b]);
Построим кумуляту. На координатной плоскости построим точки, абсциссами которых являются варианты, а ординатами – их накопленные частоты, и соединим эти точки отрезками прямых:
a1:=plots[pointplot]([[37,0],[38,X4[1]],[39,X4[2]],[40,X4[3]],[41,X4[4]],[42,X4[5]],[43,X4[6]],[44,X4[7]],[45,X4[8]]], color=black):
b1:=plot([[37,0],[38,X4[1]],[39,X4[2]],[40,X4[3]],[41,X4[4]],[42,X4[5]],[43,X4[6]], [44,X4[7]],[45,X4[8]]],color=green):
plots[display]([a1,b1]);
Запишем эмпирическую функцию распределения.
> F:=piecewise(x<=37,0,x>37 and x<=38,X5[1],x>38 and x<=39,X5[2],x>39 and x<=40,X5[3],x>40 and x<=41,X5[4],x>41 and x<=42,X5[5],x>42 and x<=43,X5[6],x>43 and x<=44,X5[7],x>44,X5[8]);
Теперь построим её график.
> plot(F,x=37..45,color=blue);
Найдем выборочную среднюю и её значение в виде числа с плавающей точкой:
> M:=mean(X);evalf(M);
M:=613/15
40.86666667
Определим выборочную моду:
> mode(X);
41
Определим выборочную медиану:
> median(X);
41
Найдём выборочную дисперсию:
>S:=variance(X);evalf(S);
S:=586/225
2.604444444
Найдём несмещённую выборочную дисперсию:
> S1:=n/(n-1)*S; evalf(S1);
S1:=293/110
2.663636364
Вычислим среднеквадратическое отклонение (корень квадратный из дисперсии):
> sigma:=standarddeviation(X);evalf(sigma);
1.613829125