Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая обработка результатов эксперимента

..pdf
Скачиваний:
31
Добавлен:
15.11.2022
Размер:
1.31 Mб
Скачать

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Пермский национальный исследовательский политехнический университет»

Г.Б. Лялькина, О.В. Бердышев

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТА

Утверждено Редакционно-издательским советом университета

в качестве учебного пособия

Издательство Пермского национального исследовательского

политехнического университета

2013

УДК 519.24+519.81 ББК 22.18

Л97

Рецензенты:

канд. техн. наук, доцент В.В. Аюпов (Пермская государственная сельскохозяйственная академия им. Д.Н. Прянишникова);

канд. физ.-мат. наук, доцент Д.Б. Шумкова (Пермский национальный исследовательский политехнический университет)

Лялькина, Г.Б.

Л97 Математическая обработка результатов эксперимента : учеб. пособие / Г.Б. Лялькина, О.В. Бердышев. – Пермь : Изд-во Перм. нац. исслед. политехн. ун-та, 2013. – 78 с.

ISBN 978-5-398-00988-0

В краткой форме изложены основные принципы планирования эксперимента, включающие процедуры сбора и первичной обработки статистических данных, проверки нормальности распределения и сопоставления характеристик нормально распределенных статистических совокупностей, а также ряд процедур линейного, нелинейного и множественного корреляционного и регрессионного анализа. Приведены практические примеры, наглядно демонстрирующие описываемые методы.

Предназначено для студентов, обучающихся по направлению 280700 «Техносферная безопасность». Может быть полезно студентам и аспирантам технического университета.

УДК 519.24+519.81 ББК 22.18

ISBN 978-5-398-00988-0

© ПНИПУ, 2013

ОГЛАВЛЕНИЕ

 

ВВЕДЕНИЕ...........................................................................................................

5

1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ СЛУЧАЙНЫХ ВЕЛИЧИН..................

8

1.1. Понятие случайной величины и функции ее распределения..............

8

1.2. Числовые характеристики случайных величин..................................

10

1.2.1. Математическое ожидание и дисперсия.................................

11

1.2.2. Показатели корреляции случайных величин..........................

12

1.3. Некоторые распределения функций нескольких случайных

 

аргументов...........................................................................................

15

1.3.1. Распределение Пирсона ...........................................................

15

1.3.2. Распределение Стьюдента........................................................

16

1.3.3. Распределение Фишера – Снедекора......................................

16

Контрольные вопросы.................................................................................

17

2. ПРОЦЕДУРЫ СБОРА ОПЫТНЫХ ДАННЫХ...........................................

18

2.1. Принципы формирования выборочной совокупности......................

19

2.2. Методы сбора статистических данных в случае пассивного

 

эксперимента.......................................................................................

20

2.3. Планирование эксперимента................................................................

21

Контрольные вопросы.................................................................................

23

3. МЕТОДЫ ПЕРВИЧНОЙ ОБРАБОТКИ ОПЫТНЫХ ДАННЫХ...............

24

3.1. Процедура исключения ложных данных............................................

24

3.2. Процедура проверки опытных данных на их случайность

 

и независимость..................................................................................

32

3.2.1. Критерий, основанный на использовании медианы

 

выборки..........................................................................................

33

3.2.2. Критерий «восходящих» и «нисходящих» серий..................

37

Контрольные вопросы.................................................................................

39

4. СТАТИСТИЧЕСКИЙ АНАЛИЗ ВЫБОРОЧНЫХ

 

СОВОКУПНОСТЕЙ ......................................................................................

40

4.1. Статистические оценки числовых характеристик

 

случайных величин.............................................................................

40

 

3

4.2. Подбор закона распределения по экспериментальным данным......

43

4.2.1. Проверка гипотезы о нормальном распределении

 

генеральной совокупности...........................................................

44

4.2.2. Сравнение исправленной выборочной дисперсии

 

с предполагаемой генеральной дисперсией

 

нормальной совокупности ...........................................................

48

4.2.3. Сравнение средней выборочной с предполагаемой

 

генеральной средней нормальной совокупности.......................

51

4.3. Совместное исследование двух случайных величин.........................

55

4.3.1. Сравнение исправленных выборочных дисперсий

 

двух нормальных генеральных совокупностей..........................

55

4.3.2. Сравнение генеральных средних двух нормальных

 

совокупностей с известными дисперсиями................................

58

4.3.3. Сравнение генеральных средних двух нормальных

 

совокупностей с неизвестными дисперсиями............................

60

4.3.4. Проверка гипотезы о значимости выборочного

 

коэффициента корреляции...........................................................

63

Контрольные вопросы.................................................................................

65

5. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ..................................

66

5.1. Парная регрессия ..................................................................................

67

5.2. Множественная регрессия....................................................................

70

5.2.1. Проверка значимости коэффициентов линейного

 

уравнения множественной регрессии.........................................

71

5.2.2. Проверка значимости линейного уравнения

 

множественной регрессии в целом .............................................

73

5.2.3. Оценка точности линейного уравнения множественной

 

регрессии.......................................................................................

74

Контрольные вопросы.................................................................................

75

Список рекомендуемой литературы.................................................................

76

4

ВВЕДЕНИЕ

Многие процессы, протекающие в техносфере, могут быть описаны статистическими совокупностями данных, формируемыми в результате их функционирования. Этими процессами необходимо управлять. Как следствие, специалист по безопасности в техносфере должен иметь представление о целях и возможностях построения на основе статистических данных математических моделей как инструмента управления. Описывая состояние некоторой системы с помощью конечного набора числовых показателей, мы прибегаем к количественной математической модели этой системы.

Статистические данные – это данные, так или иначе полученные в результате эксперимента. Эксперимент лежит в основе любых научных исследований. Опытные числовые данные исследователь может получить либо активными методами путем измерений, выполненных в ходе специально спланированного эксперимента, меняя по мере необходимости его условия, либо с помощью так называемого пассивного эксперимента, условия которого исследователь не может менять по своему усмотрению. В ходе пассивного эксперимента исследователь только регистрирует опытные значения или выбирает их из совокупности известных статистических данных.

В результате пассивного или активного эксперимента получаются выборочные совокупности измеряемых величин, по своей сути имеющие случайный характер. Поэтому модели, построенные на их основе, всегда будут иметь вероятностный характер. Отсюда следует, что сбор и обработка статистических данных должны опираться на строгие методы математической статистики, методологической основой которых является теория вероятностей.

Цель математической обработки совокупности экспериментальных данных – построение полезной аналитической модели исследуемого явления или процесса на основе конечной выборочной совокупности экспериментальных данных.

5

Но не всегда эксперимент заканчивается получением искомой аналитической модели. Поэтому прежде, чем строить модель, необходимо выяснить, имеет ли вообще смысл делать это на основе имеющейся совокупности. Может оказаться, что нарушены процедуры сбора данных и полученная выборочная совокупность не отражает исследуемые свойства генеральной совокупности значений случайной величины в достаточной степени. В частности, может оказаться, что объем выборочной совокупности мал, или сами данные имеют малую точность, или данных достаточно и они достаточно точны, но при этом они неудачно сгруппированы и представляют свойства только части генеральной совокупности. Наконец, может оказаться, что выдвинутая в начале исследования гипотеза о существовании зависимости между случайными величинами неверна и устанавливать вид этой зависимости бессмысленно.

Корректность математической модели и возможность ее применения на практике зависят от того, насколько грамотно спланирован эксперимент, насколько корректно с точки зрения математической статистики проведены процедуры сбора, обработки и анализа результатов эксперимента и, наконец, насколько корректно выполнена интерпретация полученных результатов. При этом следует отметить, что любые аналитические модели, которые мы собираемся строить на основе опытных данных, не могут иметь точность, превышающую точность измерения самих данных.

С помощью методов сбора и обработки опытных данных решают следующие важнейшие задачи статистического анализа:

1)сбор и первичная обработка выборочных данных;

2)оценка числовых характеристик выборочных данных и подбор законов их распределения;

3)корреляционно-регрессионный анализ статистических совокупностей;

4)построение и оценка точности полученных регрессионных зависимостей.

Интерпретация полученных результатов и оценка точности прогнозов, которые можно выполнить с помощью полученных регресси-

6

онных моделей, завершают процедуры обработки экспериментальных данных.

Впервом разделе настоящего пособия в краткой форме приведены основные понятия теории случайных величин, указаны их важнейшие числовые характеристики и намечены пути использования приведенных сведений при математической обработке опытных данных.

Во втором разделе перечислены некоторые способы сбора экспериментальных данных, отмечены их особенности, способствующие формированию репрезентативных выборочных совокупностей.

Третий раздел посвящен процедурам первичной обработки собранных опытных данных, в том числе их проверке на случайность

инезависимость.

Вчетвертом разделе изложены основные понятия статистического анализа, а также приведены сведения и формулы, необходимые для выполнения процедур проверки статистических гипотез.

Пятый раздел посвящен основам корреляционного анализа, а также процедурам построения эмпирических зависимостей на основе метода наименьших квадратов.

7

1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ СЛУЧАЙНЫХ ВЕЛИЧИН

Вначале коротко рассмотрим основные понятия теории случайных величин, понятие функции распределения случайной величины, важнейшие числовые характеристики случайных величин и их свойства, а также наиболее часто используемые на практике законы распределения вероятностей.

1.1.Понятие случайной величины

ифункции ее распределения

Величину X называют случайной, если в результате опыта она принимает одно из своих возможных значений, но заранее неизвестно, какое именно. При этом предполагается, что событие {X A}, состоящее в том, что значение этой величины попадет в произвольное подмножество A D из множества D всех ее возможных значений, является случайным, но вероятность P(X A) этого события известна.

Ограничимся случаем одномерной случайной величины X, т.е. величины, принимающей действительные значения x из некоторого множества D R, где R – множество действительных чисел.

В общем случае такая случайная величина считается заданной, если известен закон распределения вероятностей P(X<x) событий {X<x} для каждого действительного значения x D этой величины. Функцию

F(x) = P(X<x)

(1.1)

называют интегральной функцией распределения вероятностей значений случайной величины X или, коротко, функцией распределения величины X. Задание множества D и функции распределения F(x) полностью определяет случайную величину.

Функция распределения F(x) является монотонно неубывающей при любых x D, а ее значения заполняют промежуток [0;1]: 0 ≤ F(x) ≤ 1 (или (0;1)), причем F() = 0, F(+ ) = 1.

8

В частном случае множество D всех возможных значений величины X может оказаться дискретным, т.е. может состоять из конечного (i = 1,2,…,n) или счетного (i = 1,2,…) числа отдельных изолированных значений xi. В этом случае случайная величина X называется дискретной.

Дискретная случайная величина X считается заданной, если известен закон распределения вероятностей pi для каждого из событий X = xi, т.е. для всех возможных значений индекса i определена веро-

ятность pi = P(X = xi).

Закон распределения pi = P(X = xi) дискретной случайной величины X в случае конечного числа ее значений (i = 1,2,…,n) часто представляют не только аналитически, но и графически в форме полигона (многоугольника распределения) или таблично [10]. Интегральная функция распределения дискретной случайной величины представляет собой ступенчатую монотонно неубывающую функцию.

Примером дискретной случайной величины в теории надежности может служить число отказов технического объекта на заданном промежутке времени [12].

Другой вид случайных величин – это непрерывные случайные величины. Случайная величина называется непрерывной, если ее

функция распределения F(x) – это непрерывная функция, обладающая кусочно-непрерывной производной. Другие виды случайных величин рассмотрены, например, в учебнике [10].

Для задания непрерывной случайной величины можно пользоваться не только интегральной функцией распределения F(x), но и ее производной F(x) = f(x), чаще называемой плотностью распределения вероятностей.

Вероятность P(a X < b) того, что значения случайной величины X попадут в промежуток [a;b), вычисляется с помощью интегральной функции F(x) по следующей формуле:

P(a X < b) = F(b − 0) − F(a + 0).

(1.2)

Для непрерывных случайных величин формула (1.2) может быть представлена через плотность распределения вероятностей в виде следующего интеграла [10]:

9

P(a<X<b) = b

f (x)dx = F(b) − F(a).

(1.3)

a

 

 

Для непрерывной случайной величины вероятность ее попадания в любую отдельную точку xi равна нулю:

P(X = xi) = F(X = xi + 0) − F(X = xi − 0) = 0.

Примером непрерывной случайной величины в теории надежности может служить время наступления отказа технического объек-

та [12].

1.2. Числовые характеристики случайных величин

Наиболее часто применяемый на практике закон распределения дискретных случайных величин – это биномиальное распределение, определяемое формулой Бернулли. Для описания массовых редких событий (при больших значениях объема выборки n и при малых значениях вероятности p каждого из отдельных событий) используют предельную форму биномиального распределения – закон распределения Пуассона [10, 11, 14]. Примеры использования этих законов в теории надежности технических систем можно найти в учебном пособии [12].

Для описания непрерывных случайных величин часто используют нормальный и показательный законы распределения. В теории надежности популярностью пользуется также закон распределения вероятностей Вейбулла – Гнеденко [12, 14].

Плотность распределения вероятностей показательного распределения с параметром λ > 0 при x ≥ 0 задается формулой f(x) = λeλx.

Плотность распределения нормально распределенной случайной величины X задается формулой

f (x)=

1

 

(xa)2

 

, x (–∞, ∞).

 

 

exp

2σ2

 

(1.4)

σ 2π

 

 

 

 

 

10

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]