Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Обработка экспериментальных данных на ЭВМ.doc
Скачиваний:
76
Добавлен:
14.02.2015
Размер:
4.75 Mб
Скачать

Лабораторная работа № 2

Тема: Выявление грубых ошибок выборки и нахождение необходимого объема выборки

Цель работы: Приобретение практических навыков первичной обработки выборки: выявление грубых ошибок и оценка необходимого числа экспериментов

Задания на выполнение лабораторной работы Задание 1. Определение необходимого объема выборки

Требуется определить необходимый объем выборки для оценки математического ожидания по заданным значениям генеральной дисперсии, предельной погрешности и доверительной вероятности (см. табл.1).

Таблица 1

Вариант

Погрешность

Дисперсия

Доверительная вероятность

1

1

30

0,9

2

1

35

0,95

3

1

40

0,99

4

1

45

0,999

5

2

50

0,9

6

2

55

0,95

7

2

60

0,99

8

2

65

0,999

9

3

70

0,9

10

3

75

0,95

11

3

80

0,99

12

3

85

0,999

13

4

90

0,9

14

4

95

0,95

15

4

100

0,99

16

4

105

0,999

Задание 2. Выделение промахов

Используя данные табл.2, определить, нужно ли удалить из ранжированной последовательности максимальное и минимальное значения признака. Считается, что данные принадлежат нормально распределенной генеральной совокупности

Таблица 2

Вариант

Уровень

значимости

Минимальное

значение

x1

Максимальное

значение

xn

Среднее

значение

СКО

1

0,005

2

15

10

2

2

0,01

9

20

15

2,5

3

0,05

9

27

20

3

4

0,1

17

45

25

3,5

5

0,005

10

35

30

4

6

0,01

30

60

35

4,5

7

0,05

15

48

40

5

8

0,1

40

50

45

5,5

9

0,005

23

55

50

6

10

0,01

50

60

55

6,5

11

0,05

30

65

60

7

12

0,1

58

98

65

7,5

13

0,005

62

100

70

8

14

0,01

77

83

75

8,5

15

0,05

70

120

80

9

16

0,1

80

90

85

9,5

Указания по выполнению лабораторной работы

Задание 1

С помощью статистических пакетов программ для ЭВМ определяем квантиль нормированного нормального распределения z.

Необходимый объем выборки вычисляется по формуле:

где 2 – генеральная дисперсия;  - заданная абсолютная погрешность; z – квантиль нормированного нормального распределения или такое значение аргумента функции Лапласа, при котором (z) = .

При расчете квантиля принимают математическое ожидание а = 0, а дисперсию 2 = 1. Полученный результат округляем до ближайшего большего целого числа.

Задание 2

Предположим, что при проведении n экспериментальных измерений какой-либо величины (например, напряжения на конденсаторе) получен вариационный ряд

x1 x2 x3… xn.

Требуется проверить, не являются ли x1 и xn. промахами, т.е. не выделяются ли слишком резко указанные варианты соответственно в меньшую и в большую сторону от средней величины. Другими словами: относятся ли крайние значения вариационного ряда к имеющейся генеральной совокупности или они возникли из-за грубых случайных ошибок.

Нулевой гипотезой в этом случае является предположение о том, что и xn (или x1) принадлежит той же совокупности, что и остальныеn-1 наблюдений. Математически это записывается так:

H0:xn N(,).

Запись N(,) обозначает нормальный закон с математическим ожиданиеми средним квадратичным отклонением.

Проверка нулевой гипотезы состоит в том, что xn (или x1) сравнивается по величине с некоторой критической величиной (точкой). При этомxn сравнивается с верхней (правой) границей области допустимых значений, аx1– с нижней (левой) допустимой границей.

В случае отсеивания максимального значения вариационного ряда критическая область описывается выражением:

P (xn > +z1-) =. (1)

Гипотеза H0 отклоняется в пользу альтернативной гипотезы:

H1:xn N(,),

если xn попадает в критическую область.

Критическая область для минимального значения описывается выражением:

P (x1 < +z) =. (2)

Заметим, что в силу симметричности относительно нуля нормированного нормального распределения в выражении (1) величина z1-> 0, в выражении (2) z < 0, а по модулю эти величины одинаковы.

Пример выполнения лабораторной работы №2

Задание 1

Требуется определить необходимый объем выборки для оценки математического ожидания роста студентов при значениях генеральной дисперсии 2 = 40, предельной погрешности  = 1,5 и надежности  = 0,95.

Решение.

С помощью статистических пакетов программ для ЭВМ определяем квантиль нормированного нормального распределения z = 1,96.

Необходимый объем выборки вычисляется по формуле:

где 2 – генеральная дисперсия;  - заданная абсолютная погрешность; z – квантиль нормированного нормального распределения или такое значение аргумента функции Лапласа, при котором (z) = .

При расчете квантиля принимают математическое ожидание а = 0, а дисперсию 2 = 1.

Выполним расчет для конкретных значений данного примера:

Полученный результат округляем до ближайшего большего целого числа.

Таким образом, для точного определения среднего роста студентов с погрешностью 1,5 см и надежностью  = 0,95 при известной дисперсии 2 = 40 см2 необходимо измерить рост у 69 студентов.

Задание 2

Предположим, что при проведении n экспериментальных измерений какой-либо величины (например, напряжения на конденсаторе) получен вариационный ряд

x1 x2 x3… xn.

Требуется проверить, не являются ли x1 и xn. промахами, т.е. не выделяются ли слишком резко указанные варианты соответственно в меньшую и в большую сторону от средней величины. Другими словами: относятся ли крайние значения вариационного ряда к имеющейся генеральной совокупности или они возникли из-за грубых случайных ошибок.

Нулевой гипотезой в этом случае является предположение о том, что и xn (или x1) принадлежит той же совокупности, что и остальныеn-1 наблюдений. Математически это записывается так:

H0:xn N(,).

Запись N(,) обозначает нормальный закон с математическим ожиданиеми средним квадратичным отклонением.

Проверка нулевой гипотезы состоит в том, что xn (или x1) сравнивается по величине с некоторой критической величиной (точкой). При этомxn сравнивается с верхней (правой) границей области допустимых значений, аx1– с нижней (левой) допустимой границей.

В случае отсеивания максимального значения вариационного ряда критическая область описывается выражением:

P (xn > +z1-) =. (1)

Гипотеза H0 отклоняется в пользу альтернативной гипотезы:

H1:xn N(,),

если xn попадает в критическую область.

Критическая область для минимального значения описывается выражением:

P (x1 < +z) =. (2)

Заметим, что в силу симметричности относительно нуля нормированного нормального распределения в выражении (1) величина z1-> 0, в выражении (2) z < 0, а по модулю эти величины одинаковы.

Перейдем к рассмотрению конкретного примера.

Предположим, что заданы уровень значимости = 0,015, среднее арифметическое значение= 200, среднее квадратичное отклонение (СКО)= 10. Требуется определить, являются или нет промахами элементы вариационного рядаxn = 240 и x1 = 180. Считается, что выборка извлечена из нормально распределенной генеральной совокупности.

Решение.

С помощью статистического пакета программ для ЭВМ по заданной величине уровня значимости = 0,015 находимz = -2,17.

По формуле (2) находим левую границу допустимой области:

+t= 200 – 2,1710 = 178,3.

Так как 180 > 178,3, то минимальное значение вариационного ряда x1 нельзя считать промахом и нужно принять нулевую гипотезу.

Для определения правой границы допустимой области по величине

p= 1-= 1 – 0,015 = 0,985 найдем значениеz1-= 2,17.

По формуле (1) находим правую границу допустимой области:

+ z1-= 200 +2,1710 = 221,7.

Соотношение 240 > 221,7 говорит о том, что величина xn = 240 является промахом и по этой причине нулевую гипотезу следует отклонить в пользу альтернативной.