Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

m35674_17

.DOC
Скачиваний:
4
Добавлен:
13.11.2022
Размер:
407.55 Кб
Скачать

ЧАСТЬ III. ПРИМЕРЫ РЕШЕНИЯ ЗАДАЧ

МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ В СИСТЕМЕ MATHCAD

П р е д у п р е ж д е н и е. Во всех последующих файлах MATHCAD у системной переменной ORIGIN установлено значение 1 вместо значения 0 по умолчанию. Для осуществления этой установки нужно последовательно обратиться к кнопкам «Математика», «Опции» и в появившемся окне переустановить значение переменной.

Описательные статистики

Пусть дана случайная выборка, состоящая из значений признака Х, в виде следующей таблицы:

52.2

54

41

42

58.2

59.3

84.8

45

76.5

58.3

21

55

45

21.5

46

44

42.5

49

48.7

75

15.3

55

23.8

46.5

53

62.8

78.5

67

34.5

49.9

49.7

63

30

32

42.4

22.4

52

70.4

57.2

50

23

47.8

47.4

50.8

78.3

27

56.6

51.3

58.6

28.4

51.7

50

48.8

49.4

57.5

47.4

33.5

27

39.7

57.5

18.4

35.6

28.4

37.6

49.5

26.7

54

68.6

29.3

62.7

43.8

44

69.1

46.3

76.7

37.1

69.2

39.3

30

43

85

63

30

43.8

64.8

22

38.8

42.3

64.8

41

30

10

63

48.8

71.2

54.4

47.8

31.2

46.1

17.8

Для удобства записи вычислений в системе MATHCAD представим эту таблицу в пятью векторами с 20 элементами в каждом:

N100

A(52.2 54 41 42 58.2 59.3 84.8 45 76.5 58.3 21 55 45 21.5 46 44 42.5 49 48.7 75)

B(15.3 55 23.8 46.5 53 62.8 78.5 67 34.5 49.9 49.7 63 30 32 42.4 22.4 52 70.4 57.2 50)

C(23 47.8 47.4 50.8 78.3 27 56.6 51.3 58.6 28.4 51.7 50 48.8 49.4 57.5 47.4 33.5 27 39.7 57.5)

D(18.4 35.6 28.4 37.6 49.5 26.7 54 68.6 29.3 62.7 43.8 44 69.1 46.3 76.7 37.1 69.2 39.3 30 43)

E(85 63 30 43.8 64.8 22 38.8 42.3 64.8 41 30 10 63 48.8 71.2 54.4 47.8 31.2 46.1 17.8)

Объединим эти векторы в единый массив данных:

M augment (A, B, C, D, E)

M =

91

92

93

94

95

96

97

98

99

100

1

30

10

63

48.8

71.2

54.4

47.8

31.2

46.1

17.8

Построим вариационный ряд возрастающих значений данных:

M1 M2:= sort(M1)

=

1

2

3

4

5

6

7

8

9

10

1

10

15.3

17.8

18.4

21

21.5

22

22.4

23

23.8

Найдем размах выборки:

R max(M2)  min(M2) R = 75

Воспользовавшись формулой Стерджеса, определим длину частичных интервалов, округлив полученное значение до целого числа:

L round L = 10

Число интервалов для построения гистограммы определяем по формуле

k round k = 8

Получим интервальное распределение частот исходной выборки:

Frhistogram (8, M)

В первой строке вектора приведены середины частичных интервалов, а во второй строке – частоты попадания элементов таблицы в эти интервалы.

Построим полигон относительных частот выборки.

Рис.2. Полигон относительных частот выборки.

Построим гистограмму относительных частот выборки:

Рис 3. Гистограмма относительных частот выборки.

Построим эмпирическую функцию распределения, используя возможности программного модуля MATHCAD:

Рис.4. Эмпирическая функция распределения выборки.

Построим, наконец, кумулятивную кривую для нашей выборки:

Рис.5. Кумулята относительных частот выборки.

Для вычисления точечных и интервальных выборочных оценок неизвестных числовых характеристик теоретического распределения перепишем исходные данные рассматриваемого примера в виде следующей матрицы:

Найдем абсолютные частоты и середины частичных интервалов:

Frhistogram (8, A)

Вычислим выборочную среднюю распределения , взвешенную по объемам групп:

n rows(A)  cols(A) meanFr meanFr  47.81

Вычислим выборочную дисперсию распределения , взвешенную по объемам групп:

DFr DFr = 273.421

Вычислим выборочную дисперсию вторым способом:

DFr1 DFr1 = 273.421

Вычислим среднее квадратическое отклонение Fr, исправленную выборочную дисперсию S2Fr и исправленное среднее квадратическое отклонение SFr выборочного распределения Fr:

Fr Fr  16.535

S2Fr S2Fr = 276.183

SFr SFr = 16.619

Вычислим те же оценки, но используя несгруппированные данные (матрицу данных А). Для этого сначала образуем из матрицы А массив А1, поставив в один ряд строки матрицы А:

A1augment

A1=

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1

52.2

54

41

42

58.2

59.3

84.8

45

76.5

58.3

21

55

45

21.5

46

44

Затем используем формулы расчета числовых характеристик по данным, которые не сгруппированы.

Выборочная средняя:

meanA1 meanA1 = 47.312

Выборочные дисперсия и среднее квадратическое отклонение:

var(A1) = 263.136 stdev(A1) = 16.221

Исправленные выборочная дисперсия и среднее квадратическое отклонение:

var(A1) = 265.794 stdev(A1) = 16.303

Рассчитаем доверительные интервалы, покрывающие с надежностью  = 0,95 неизвестные математическое ожидание и дисперсию признака X, заданного выборкой в виде матрицы А.

Имеем

 0.05 1   = 0.95  1  

Получаем

m mean(A1) m = 47.312

s stdev(A1) s = 16.303

Расчет доверительного интервала для математического ожидания нормально распределенного признака X производится по формуле

( L U ) 

Получаем

( L U ) = ( 44.077 50.547 )

Рис.6. Выборочные данные, среднее и с.к.о.

Построим доверительный интервал для дисперсии и среднего квадратического отклонения признака X. Для этого используется критерий и специальная встроенная в пакет MATHCAD функция qchisq, вычисляющая критические значения критерия для заданного уровня значимости.

Введем уровень значимости:

0.05

Отсюда следует, что уровень надежности, с которой доверительный интервал будет покрывать неизвестную генеральную дисперсию, равен 1  = 0,95.

Используем вычисленное ранее исправленное среднее квадратическое отклонение (стандартное отклонение) s и объем выборки n:

s Stdev(A1) s = 16.303

n length n = 100

Вычисляем критические значения двустороннего критерия при заданном уровне значимости :

 qchisq = 77.046

 qchisq = 123.225

Вычисляем нижнюю и верхнюю границы доверительного интервала для дисперсии:

L  L = 213.541 U  U = 341.53

Получаем искомый доверительный интервал:

[213.541; 341.53].

Вычислим границы доверительного интервала для среднего квадратического отклонения  генеральной совокупности, выборкой из которой является матрица А:

L  L = 14.613 U  U = 18.481

Таким образом, искомый доверительный интервал имеет вид

[14.613; 18.481].

166

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]