Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

курсовик Проверка статистических гипотез

.doc
Скачиваний:
25
Добавлен:
15.04.2015
Размер:
240.13 Кб
Скачать

Министерство образования и науки РФ

Российский Государственный Гидрометеорологический Университет

Курсовая работа

по дисциплине «Математическая статистика в информационных технологиях»

на тему:

«Проверка статистических гипотез»

Выполнил:

студент гр.ОИ-309 Андриянов А.В.

Принял:

анкт-Петербург 2008


Митько В.Б.

Санкт-Петербург

2008 г.

Задание:

На основе эмпирически полученных данных осуществить проверку гипотезы о нормальном распределении по критерию Пирсона.

Исходные данные:

Даны наблюдения за уровнем моря с размерностью выборки 200 измерений

Перечень основных вопросов и документов, подлежащих разработке:

  1. Определить размах варьирования измеренной величины;

  2. Объединить выборку в разряды с определением числа разрядов и величины разрядов;

  3. Составить таблицу подсчета частот по интервалам

  4. Данные таблицы подсчета частот представить в виде ряда распределения;

  5. Построить многоугольник частот (полигон), гистограмму и кумулятивную частоту;

  6. Рассчитать доверительные интервалы для оценок математического ожидания и дисперсии

  7. Проверить соответствие эмпирического закона распределения нормальному по критерию Пирсона

Теоретические сведения:

Исходными данными работы служат эмпирически полученные значения наблюдений за уровнем моря. Целью работы является проверка гипотезы о том, что закон распределения полученных значений относится к нормальному закону распределения.

Сведения о проверке статистических гипотез

Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит основной. Различают гипотезы, которые содержат одно и более одного предположений. Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.

В итоге проверки гипотезы могут быть допущены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают α. Ошибка второго рода, состоит в том, что будет принята неправильная нулевая гипотеза. Вероятность ошибки второго рода обозначают β.

Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки гипотезы. Наблюдаемым (эмпирическим) значением Кнабл называют то значение критерия, которое вычислено по выборкам.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых нулевую гипотезу принимают.

Основной принцип проверки статистических гипотез: если наблюдаемое значение крите­рия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое зна­чение критерия принадлежит области принятия гипотезы, то гипотезу принимают.

Критическими точками (границами) kkp называют точки, отделяющие критическую область от области принятия гипотезы. Правосторонней называют критическую область, определяемую неравенством K>kkp, где kkp — положительное число.

Левосторонней называют критическую область, определяемую неравенством K<kkp, где kkp — отрицательное число.

Двусторонней называют критическую область, определяемую неравенством k1<K<k2, где k2>k1. В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенствами ( в предположении, что kкр>0)

K<-kkp, K>kkp,

или равносильным неравенством

|К|>kкр.

Для отыскания критической области задаются уровнем значимости и ищут критические точки, исходя их следующих соотношений:

а) для правосторонней критической области

P(K>kkp)=α (kkp>0);

б) для левосторонней критической области P(K<kkp)=α (kkp<0);

в) для двусторонней симметричной области P(K>kkp)=α/2 (kkp>0), P(K<-kkp)=α/2

Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность крите­рия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

Критерий Пирсона

Критерий Пирсона, или критерий χ2 — наиболее часто употребляемый критерий для про­верки гипотезы о законе распределения. Во многих практических задачах, как и в данной ра­боте, точный закон распределения неизвестен, то есть является гипотезой, которая требует статистической проверки. Сравнение эмпирического F * (x) и теоретического распределений производится с помощью специально подобранной случайной величины — критерия согла­сия. Одним из таких критериев и является критерий Пирсона.

где ni - эмпирические (опытные) частоты случайной величины,n’i = N*pi – теоретические частоты, представляющие произведение числа наблюдений N на вероятности ,pi рассчитанные по предполагаемому теоретическому распределению.

Эта величина в свою очередь является случайной (в силу случайности X) и должна подчи­няться распределению χ2. Перед тем, как сформулировать правило принятия или отвержения гипотезы необходимо учесть, что критерий Пирсона обладает правосторонней критической областью.

Нормальное распределение

Нормальное распределение, также называемое распределением Гаусса, — распределение вероятностей, которое играет важнейшую роль во многих областях знаний, особенно в физике. Физическая величина подчиняется нормальному распределению, когда она подвержена влиянию огромного числа случайных помех. Ясно, что такая ситуация крайне распространена, поэтому можно сказать, что из всех распределений в природе чаще всего встречается именно нормальное распределение — отсюда и произошло одно из его названий.

Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть является с математической точки зрения не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и раз­броса (стандартного отклонения).

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

Для представления о законе распределения нет необходимости строить статистическую функцию распределения по каждому наблюденному значению случайной величины. Этим целям служат группированный статистический ряд и гистограмма. Группированным статистическим рядом называется таблица, где в верхней строчке указаны разряды, в нижней — соответствующие им частоты. Частота каждого события вычисляется как отношение числа опытов, в которых значение случайной величины Х попало в i-ый разряд, к общему числу n произведен­ных опытов. Откладывая по оси абсцисс разряды и строя на каждом разряде как на основании прямоугольник, получим гистограмму — статистический аналог кривой распределения.

Математическое ожидание

Среднее значение, одна из важнейших характеристик распределения вероятностей слу­чайной величины. Для случайной величины X, принимающей последовательность значений y1, y2,..., yk,... с вероятностями, равными соответственно p1, p2,..., pk.

Дисперсия

Дисперсия случайной величины — мера разброса данной случайной величины, т. е. её отклонения от математического ожидания.

Метод произведений вычисления выборочных средней и дисперсии

Пусть выборка задана в виде распределения равноотстоящих вариант и соответствующих им частот. В этом случае удобно находить выборочно среднюю и дисперсию методом произ­ведений по формулам

Хв1*h+С,

Dв=[M2*h -(M1*h)2]*h2, где h — шаг (разность между двумя соседними вариантами);

С — ложный нуль (варианта, которая имеет наибольшую частоту);

ui=(xi-C)/h — условная варианта;

M1*=∑nu/n — условный момент первого порядка;

M2*=∑nu2/n — условный момент второго порядка.

Практическая часть

В качестве средства вычисления величин и построения графиков использовалась программа Microsoft Office Excel 2003.

Исходные данные

Для индивидуализации исходных значений, часть случайных величин была изменена в соответствии с датой рождения автора работы — 03.08.1988.

Таблица исходных данных

Рез. изм

1

-1,0

39

10,0

76

9,0

114

8,0

152

3,0

189

-8,0

2

22,0

40

8,5

77

8,0

115

1,0

153

0,0

190

-4,0

3

7,0

41

0,0

78

8,0

116

9,0

154

8,0

191

0,0

4

0,0

42

3,0

79

8,5

117

8,0

155

1,0

192

3,0

5

-6,5

43

0,0

80

7,5

118

8,0

156

9,0

193

0,0

6

4,0

44

8,0

81

0,0

119

-11,5

157

8,0

194

8,0

7

-4,5

45

1,0

82

3,0

120

-11,5

158

8,0

195

1,0

8

5,0

46

9,0

83

0,0

121

0,0

159

7,0

196

9,0

9

18,5

47

8,0

84

8,0

122

3,0

160

4,5

197

8,0

10

4,5

48

8,0

85

1,0

123

0,0

161

0,0

198

8,0

11

0,0

49

19,0

86

9,0

124

8,0

162

3,0

199

-6,5

12

3,0

50

14,0

87

8,0

125

1,0

163

0,0

200

-8,0

13

0,0

51

0,0

88

8,0

126

9,0

164

8,0

14

8,0

52

3,0

89

4,5

127

8,0

165

1,0

15

1,0

53

0,0

90

5,0

128

8,0

166

9,0

16

9,0

54

8,0

91

0,0

129

1,5

167

8,0

17

8,0

55

1,0

92

3,0

130

-18,0

168

8,0

18

8,0

56

9,0

93

0,0

131

0,0

169

7,0

19

-1,5

57

8,0

94

8,0

132

3,0

170

12,0

20

1,0

58

8,0

95

1,0

133

0,0

171

0,0

21

0,0

59

17,5

96

9,0

134

8,0

172

3,0

22

3,0

60

25,5

97

8,0

135

1,0

173

0,0

23

0,0

61

0,0

98

8,0

136

9,0

174

8,0

24

8,0

62

3,0

99

-3,0

137

8,0

175

1,0

25

1,0

63

0,0

100

-14,0

138

8,0

176

9,0

26

9,0

64

8,0

101

0,0

139

-10,5

177

8,0

27

8,0

65

1,0

102

3,0

140

14,5

178

8,0

28

8,0

66

9,0

103

0,0

141

0,0

179

9,5

29

0,5

67

8,0

104

8,0

142

3,0

180

12,5

30

3,5

68

8,0

105

1,0

143

0,0

181

0,0

31

0,0

69

11,5

106

9,0

144

8,0

182

3,0

32

3,0

70

10,5

107

8,0

145

1,0

183

0,0

33

0,0

71

0,0

108

8,0

146

9,0

184

8,0

34

8,0

72

3,0

109

-1,0

147

8,0

185

1,0

35

1,0

73

0,0

110

-3,0

148

8,0

186

9,0

36

9,0

74

8,0

111

0,0

149

4,0

187

8,0

37

8,0

75

1,0

112

3,0

150

0,0

188

8,0