Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
37.doc
Скачиваний:
5
Добавлен:
30.04.2022
Размер:
623.62 Кб
Скачать

10. Практические задания

Использовав выборки наблюдений заданий лабораторной работы № 1, выровнять статистические ряды с помощью нормального распределения. При построении гисто­грамм проверить разбивку интервала изменения случайной величины Х на 6 частей.

Лабораторная работа n3 сглаживание экспериментальных зависимостей по методу наименьших квадратов

1. При обработке опытных данных часто приходится решать задачу, целью которой является исследование зависимости одной физической величины Y от другой физической величины X. Предполагается, что эти величины связанны некоторой зависимостью

(1)

где - искомые параметры.

2. На практике функция (1) (уравнение регрессии) выбирается в виде полинома

(2)

Иногда употребляются и другие элементарные функции: дробно-линейная, степенная, логарифмическая и т.д.

3. Геометрическая задача подбора аналитической функции состоит в проведении такой кривой вида (2) (линии регрессии), которая возможно “ближе” примыкает к системе точек (xi yi), (i = 1, 2, …, n), образовавшихся в результате n реализаций случайных величин X, Y

Результаты реализаций оформляются в виде таблицы.

xi

x1

x2

xm

yi

y1

y2

ym

4. Наибольшее распространение для решения этой задачи получил метод наименьших квадратов (МНК).

Согласно МНК наилучшей функцией приближения (уравнением регрессии) будет такая, для которой сумма квадратов отклонений

(3)

будет минимальной.

Выбор функции “близости“ в виде (3) обеспечивает несмещенные и состоятельные оценки параметрам когда случайные величины X и Y подчинены нормальному закону распределения .

5. использование нескольких условий существования экстремума функции нескольких переменных, определяет так называемую систему уравнений для отыскивания параметров

(4)

или в развернутом виде

(5)

Решение одним из методов (например по правилу Крамера) системы (5) относительно параметров дает искомые оценки, и, следовательно, определяет аналитический вид функции (2).

6. Если уравнение регрессии линейно т.е.

то его адекватность проверяется при помощи коэффициента корреляции, оценка которого

(6)

где - оценка корреляционного момента

x, y – оценки среднеквадратичных отклонений случайных величин X, Y соответственно.

Чем ближе коэффициент корреляции приближается к +1 или –1, тем сильнее линейная связь и, следовательно, точнее регрессионное уравнение описывает заданную статистику.

7. Если уравнение регрессии нелинейно, то его адекватность проверяется корреляционным отношением, оценка которого

(7)

Yi – значение величины Y, полученное по уравнению регрессии в точке xi

Чем ближе корреляционное отношение к 1, тем теснее связь, точнее регрессионное уравнение описывает заданную статистику.

8. Значимость коэффициента корреляции проверяется по t - критерию Стьюдента

(8)

с  = n - 2 степенями свободы. Если вычисленная по формуле (8) величина по модулю меньше, чем в статистической табл. tкр(, q), то полагают, что теоретический коэффициент корреляции равен нулю, т.е. не значим, в противном случае значим, и его надо учитывать.

9. Значимость корреляционного отношения проверяется по критерию Фишера

(9)

(m –1 – число параметров в уравнении регрессии) с числами степеней свободы 1 = m и 2 = n – (m+1). Если вычисленная по формуле (9) величина Fp больше чем выбранная из статистической таблицы Fкр(1, 2, q), то значим и его надо учитывать.

10.1 Выбрать вид регрессионного уравнения

10.2 Исследуя таблицу исходных данных, составить систему нормальных уравнений вида (5)

10.3 Решить систему нормальных уравнений относительно параметров

Записать аналитический вид регрессионного уравнения.

Вычислить оценки коэффициента корреляции или корреляционного отношения.

Проверить значимость полученных оценок.

Построить на графике теоретическую кривую и отложить значения таблицы (для наглядности).

Сделать выводы и оформить работу.

11. Пример. Вычислить параболическую регрессию Y на X для данных, сведенных в таблицу.

Xi

1

2

3

4

5

6

7

Yi

1.33

2.57

4.17

5.0

5.33

6.50

6.0

C доверительной вероятностью  = 0.95 проверить ее адекватность.

11.1. По условию задачи уравнение регрессии надо выбирать в виде

(10)

II.2. Составим систему нормальных уравнений вида (5) при m = 2; n = 7.

(11)

Для вычисления коэффициентов при составим вспомогательную таблицу

N

xi

yi

X2i

X3i

X4i

XiYi

X2iYi

1

1

1.33

1

1

1

1.33

1.33

2

2

2.57

4

8

16

5.14

10.28

3

3

4.17

9

27

81

12.51

37.53

4

4

5.0

16

64

256

20.0

80

5

5

5.33

25

125

625

26.65

133.25

6

6

5.50

36

216

1296

33

198.00

7

7

6.0

49

343

24.01

42

294

28

29.90

140

784

4676

140.63

764.39

Тогда систему нормальных уравнений можно записать так

(12)

для решения этой системы сначала разделим числовые коэффициенты каждого уравнения на коэффициенты при ,получим

(13)

решаем систему по правилу Крамера

= 0,б

= 0,53 = - 0,017

; ;

11.3. Уравнением регрессии будет

Y = 1.07 + 00.88X - 0.017X2

11.4. Так как уравнение регрессии нелинейно, то будем вычислять корреляционное отношение по формуле (7)

Найдем

Для удобства опять воспользуемся таблицей

N

Yi

y

yi-Yi

yi-

(yi-Yi)

(yi- )2

1

1.33

1.93

-0.6

-2.94

0.36

8.64

2

2.57

2.76

-0.19

-1.7

0.036

2.89

3

4.17

3.56

0.61

-0.1

0.372

0.01

4

5.

4.32

0.68

0.73

0.462

0.583

5

5.33

5.05

0.28

1.06

0.078

1.124

6

5.5

5.74

-0.24

1.23

0.058

1.513

7

6.0

6.39

-0.39

1.73

0.152

2.99

1.518

17.7

Величина корреляционного отношения близка к 1.

11.5. Проверим значимость полученного корреляционного отношения при

m = 2; n = 7

Тогда

т.к.  = 0.95 то q = 5%

По таблице 5 приложения для 1 = 2; 2 = 4; q = 5% находим FКР = 6.9 и т.к. 18.51>6.9 то полученный критерий значим.

11.6. Для наглядности построим графики регрессионного уравнения и отложим точки исходной статистики (смотри предыдущую таблицу) .

11.7. Уравнение регрессии

Y = 1.07 + 0.88X - 0.017X2

адекватно описывает исходную статистику и может быть используемо для дальнейших исследований.

12. Практические задания.

12.1. Количество Y вещества в % оставшегося в системе через T минут от начала химической реакции, дается таблицами. Составить параболическое уравнение регрессии между Y и T и проверить его аддитивность с доверительной вероятностью  = 0,095. Варианты заданий получить у преподавателя. 12.2. Выпуск некоторым предприятием промышленной продукции Y (млн. руб.) по годам X характеризуется данными таблиц.

Найти зависимость Y и X в виде параболы и проверить ее адекватность с доверительной вероятностью  = 0,95. Варианты заданий получить у преподавателя.

12.3. В опыте исследовалась зависимость глубины проникновения Y (мм) тела в преграду от удельной энергии  Кгм/см (энергии, приходящейся на квадратный сантиметр площади). Экспериментальные данные приведены в таблицах. Требуется подобрать прямую, выражающую зависимость Y от  и проверить ее адекватность с доверительной вероятностью  = 0,8. Варианты заданий получить у преподавателя.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]