m35674_17
.DOC
ЧАСТЬ III. ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ
МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В СИСТЕМЕ MATHCAD
П р е д у п р е ж д е н и е. Во всех последующих файлах MATHCAD у системной переменной ORIGIN установлено значение 1 вместо значения 0 по умолчанию. Для осуществления этой установки нужно последовательно обратиться к кнопкам «Математика», «Опции» и в появившемся окне переустановить значение переменной.
Описательные статистики
Пусть дана случайная выборка, состоящая из значений признака Х, в виде следующей таблицы:
|
52.2 |
54 |
41 |
42 |
58.2 |
59.3 |
84.8 |
45 |
76.5 |
58.3 |
|
|
21 |
55 |
45 |
21.5 |
46 |
44 |
42.5 |
49 |
48.7 |
75 |
|
|
15.3 |
55 |
23.8 |
46.5 |
53 |
62.8 |
78.5 |
67 |
34.5 |
49.9 |
|
|
49.7 |
63 |
30 |
32 |
42.4 |
22.4 |
52 |
70.4 |
57.2 |
50 |
|
|
23 |
47.8 |
47.4 |
50.8 |
78.3 |
27 |
56.6 |
51.3 |
58.6 |
28.4 |
|
|
51.7 |
50 |
48.8 |
49.4 |
57.5 |
47.4 |
33.5 |
27 |
39.7 |
57.5 |
|
|
18.4 |
35.6 |
28.4 |
37.6 |
49.5 |
26.7 |
54 |
68.6 |
29.3 |
62.7 |
|
|
43.8 |
44 |
69.1 |
46.3 |
76.7 |
37.1 |
69.2 |
39.3 |
30 |
43 |
|
|
85 |
63 |
30 |
43.8 |
64.8 |
22 |
38.8 |
42.3 |
64.8 |
41 |
|
|
30 |
10 |
63 |
48.8 |
71.2 |
54.4 |
47.8 |
31.2 |
46.1 |
17.8 |
|
Для удобства записи вычислений в системе MATHCAD представим эту таблицу в пятью векторами с 20 элементами в каждом:
N100
A(52.2 54 41 42 58.2 59.3 84.8 45 76.5 58.3 21 55 45 21.5 46 44 42.5 49 48.7 75)
B(15.3 55 23.8 46.5 53 62.8 78.5 67 34.5 49.9 49.7 63 30 32 42.4 22.4 52 70.4 57.2 50)
C(23 47.8 47.4 50.8 78.3 27 56.6 51.3 58.6 28.4 51.7 50 48.8 49.4 57.5 47.4 33.5 27 39.7 57.5)
D(18.4 35.6 28.4 37.6 49.5 26.7 54 68.6 29.3 62.7 43.8 44 69.1 46.3 76.7 37.1 69.2 39.3 30 43)
E(85 63 30 43.8 64.8 22 38.8 42.3 64.8 41 30 10 63 48.8 71.2 54.4 47.8 31.2 46.1 17.8)
Объединим эти векторы в единый массив данных:
M augment (A, B, C, D, E)
M = |
|
91 |
92 |
93 |
94 |
95 |
96 |
97 |
98 |
99 |
100 |
1 |
30 |
10 |
63 |
48.8 |
71.2 |
54.4 |
47.8 |
31.2 |
46.1 |
17.8 |
Построим вариационный ряд возрастающих значений данных:
M1 M2:= sort(M1)
|
= |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
10 |
15.3 |
17.8 |
18.4 |
21 |
21.5 |
22 |
22.4 |
23 |
23.8 |
Найдем размах выборки:
R max(M2) min(M2) R = 75
Воспользовавшись формулой Стерджеса, определим длину частичных интервалов, округлив полученное значение до целого числа:
L round L = 10
Число интервалов для построения гистограммы определяем по формуле
k round k = 8
Получим интервальное распределение частот исходной выборки:
Frhistogram (8, M)
|
|
В первой строке вектора приведены середины частичных интервалов, а во второй строке – частоты попадания элементов таблицы в эти интервалы.
Построим полигон относительных частот выборки.
Рис.2. Полигон относительных частот выборки.
Построим гистограмму относительных частот выборки:
Рис 3. Гистограмма относительных частот выборки.
Построим эмпирическую функцию распределения, используя возможности программного модуля MATHCAD:
Рис.4. Эмпирическая функция распределения выборки.
Построим, наконец, кумулятивную кривую для нашей выборки:
Рис.5. Кумулята относительных частот выборки.
Для вычисления точечных и интервальных выборочных оценок неизвестных числовых характеристик теоретического распределения перепишем исходные данные рассматриваемого примера в виде следующей матрицы:
Найдем абсолютные частоты и середины частичных интервалов:
Frhistogram (8, A)
|
|
Вычислим выборочную среднюю распределения , взвешенную по объемам групп:
n rows(A) cols(A) meanFr meanFr 47.81
Вычислим выборочную дисперсию распределения , взвешенную по объемам групп:
DFr DFr = 273.421
Вычислим выборочную дисперсию вторым способом:
DFr1 DFr1 = 273.421
Вычислим среднее квадратическое отклонение Fr, исправленную выборочную дисперсию S2Fr и исправленное среднее квадратическое отклонение SFr выборочного распределения Fr:
Fr Fr 16.535
S2Fr S2Fr = 276.183
SFr SFr = 16.619
Вычислим те же оценки, но используя несгруппированные данные (матрицу данных А). Для этого сначала образуем из матрицы А массив А1, поставив в один ряд строки матрицы А:
A1augment
A1= |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
1 |
52.2 |
54 |
41 |
42 |
58.2 |
59.3 |
84.8 |
45 |
76.5 |
58.3 |
21 |
55 |
45 |
21.5 |
46 |
44 |
Затем используем формулы расчета числовых характеристик по данным, которые не сгруппированы.
Выборочная средняя:
meanA1 meanA1 = 47.312
Выборочные дисперсия и среднее квадратическое отклонение:
var(A1) = 263.136 stdev(A1) = 16.221
Исправленные выборочная дисперсия и среднее квадратическое отклонение:
var(A1) = 265.794 stdev(A1) = 16.303
Рассчитаем доверительные интервалы, покрывающие с надежностью = 0,95 неизвестные математическое ожидание и дисперсию признака X, заданного выборкой в виде матрицы А.
Имеем
0.05 1 = 0.95 1
Получаем
m mean(A1) m = 47.312
s stdev(A1) s = 16.303
Расчет доверительного интервала для математического ожидания нормально распределенного признака X производится по формуле
( L U )
Получаем
( L U ) = ( 44.077 50.547 )
Рис.6. Выборочные данные, среднее и с.к.о.
Построим доверительный интервал для дисперсии и среднего квадратического отклонения признака X. Для этого используется критерий и специальная встроенная в пакет MATHCAD функция qchisq, вычисляющая критические значения критерия для заданного уровня значимости.
Введем уровень значимости:
0.05
Отсюда следует, что уровень надежности, с которой доверительный интервал будет покрывать неизвестную генеральную дисперсию, равен 1 = 0,95.
Используем вычисленное ранее исправленное среднее квадратическое отклонение (стандартное отклонение) s и объем выборки n:
s Stdev(A1) s = 16.303
n length n = 100
Вычисляем критические значения двустороннего критерия при заданном уровне значимости :
qchisq = 77.046
qchisq = 123.225
Вычисляем нижнюю и верхнюю границы доверительного интервала для дисперсии:
L L = 213.541 U U = 341.53
Получаем искомый доверительный интервал:
[213.541; 341.53].
Вычислим границы доверительного интервала для среднего квадратического отклонения генеральной совокупности, выборкой из которой является матрица А:
L L = 14.613 U U = 18.481
Таким образом, искомый доверительный интервал имеет вид
[14.613; 18.481].