Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Курсовые / Курсачи ЭКТ 2-2 / 3 вар / курсач по терверу 3вар

.doc
Скачиваний:
16
Добавлен:
17.04.2013
Размер:
502.27 Кб
Скачать

Министерство общего и профессионального образования

Российской федерации

Московский государственный институт электронной техники

(Технический университет)

Курсовая работа

“ Анализ данных в линейной регрессионной модели ”

по курсу

Теория вероятностей и

математическая статистика ”

Преподаватель: Епихин В.Н.

Студент: группа ЭКТ-24

Брагин К. Р.

Москва 2004

Теоретическая часть.

1.Статистическое описание и выборочные характеристики

двумерного случайного вектора.

Пусть ,­- выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Выборочная линейная регрессия на по выборке , определяется уравнением

Выборочные средние находятся по формулам

.

Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:

Отсюда

Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам

Аналогично определяется выборочная линейная регрессия на :

коэффициенты и которой находятся по формулам

Для контроля правильности расчетов используют соотношение

Прямые регрессии пересекутся в точке .

2.Линейная регрессия.

В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид

Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .

Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют «разброс» относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:

где - случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.

Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,

-получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;

-проверить статистические гипотезы о параметрах модели;

-проверить достаточно ли хорошо модель согласуется с результатами наблюдений.

Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :

Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:

Величина , определяемая выражением

называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

которое записывается в виде

,

где

Величина называется суммой квадратов, обусловленной регрессией.

Полезной характеристикой линейной регрессии является коэффициент детерминации ,

вычисляемый по формуле

Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.

В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:

.

3.Однофакторный дисперсионный анализ.

Пусть результаты наблюдений составляют независимых выборок, полученных нормально распределенных генеральных совокупностей, которые имеют различные средние и равные дисперсии . Проверяется гипотеза о равенстве средних На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае нас интересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку.

Пусть обозначает -й элемент -й выборки, -выборочное среднее -й выборки, т.е.

;

- общее выборочное среднее, т.е.

где -общее число наблюдений,

Общая сумма квадратов отклонений от общего среднего может быть представлена так:

Это основное тождество дисперсионного анализа. Запишем его в виде

где -общая сумма квадратов отклонений наблюдений от общего среднего, - сумма квадратов отклонений выборочных средних от общего среднего , - сумма квадратов отклонений наблюдений от выборочных средних.

Данное тождество легко проверяется, если учесть, что

и

в силу определения и

Если верна гипотеза : , то статистики и независимы и имеют распределение с и степенями свободы. Следовательно, статистики и являются несмещенными оценками дисперсии . Значительное превышение величины над значением величины можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с и степенями свободы, т.е.

Эта статистика используется для проверки гипотезы : . Гипотеза не противоречит результатам наблюдений, если выборочное значение статистики меньше квантили . В этом случае и являются несмещенными оценками параметров и . Если то гипотеза отклоняется и следует считать, что среди средних имеется хотя бы два не равных друг другу.

Практическая часть.

x

y

mx

x^2

y^2

x*y

sum(x^2)

yreg

ei

ei^2

Qe

1,93

6,88

3,0338

3,7249

47,3344

13,2784

501,4519

7,149503

-0,2695

0,072632

19,82971

3,86

8,8

my

14,8996

77,44

33,968

sum(y^2)

8,707206

0,092794

0,008611

s^2

1,34

6,89

8,0404

1,7956

47,4721

9,2326

3279,108

6,673314

0,216686

0,046953

0,413119

4,22

7,82

17,8084

61,1524

33,0004

sum(x*y)

8,997762

-1,17776

1,387123

3,45

8,62

11,9025

74,3044

29,739

1252,947

8,376295

0,243705

0,059392

3,91

8,72

15,2881

76,0384

34,0952

8,747561

-0,02756

0,00076

4,06

7,75

16,4836

60,0625

31,465

8,868626

-1,11863

1,251324

2,78

7,92

7,7284

62,7264

22,0176

7,835538

0,084462

0,007134

3,08

7,22

9,4864

52,1284

22,2376

8,077668

-0,85767

0,735594

2,83

7,71

8,0089

59,4441

21,8193

7,875893

-0,16589

0,02752

3,55

7,96

12,6025

63,3616

28,258

8,457005

-0,49701

0,247014

3,15

9,18

9,9225

84,2724

28,917

8,134165

1,045835

1,093771

2,65

6,9

7,0225

47,61

18,285

7,730615

-0,83062

0,689921

0,98

5,75

0,9604

33,0625

5,635

6,382758

-0,63276

0,400383

3,67

7,47

13,4689

55,8009

27,4149

8,553857

-1,08386

1,174746

4,67

9,44

21,8089

89,1136

44,0848

9,360957

0,079043

0,006248

2,04

6,95

4,1616

48,3025

14,178

7,238284

-0,28828

0,083108

4,72

10,57

22,2784

111,7249

49,8904

9,401312

1,168688

1,365832

2,29

6,98

5,2441

48,7204

15,9842

7,440059

-0,46006

0,211654

3,72

9,46

13,8384

89,4916

35,1912

8,594212

0,865788

0,749589

3,1

8,02

9,61

64,3204

24,862

8,09381

-0,07381

0,005448

4,41

10,16

19,4481

103,2256

44,8056

9,151111

1,008889

1,017857

4,26

8,55

18,1476

73,1025

36,423

9,030046

-0,48005

0,230444

2,64

7,02

6,9696

49,2804

18,5328

7,722544

-0,70254

0,493568

2,69

7,28

7,2361

52,9984

19,5832

7,762899

-0,4829

0,233191

3,41

8,72

11,6281

76,0384

29,7352

8,344011

0,375989

0,141368

3,44

7,97

11,8336

63,5209

27,4168

8,368224

-0,39822

0,158582

2,81

7,81

7,8961

60,9961

21,9461

7,859751

-0,04975

0,002475

2,67

8,25

7,1289

68,0625

22,0275

7,746757

0,503243

0,253254

3,08

8,36

9,4864

69,8896

25,7488

8,077668

0,282332

0,079711

3,69

8

13,6161

64

29,52

8,569999

-0,57

0,324899

1,57

7,55

2,4649

57,0025

11,8535

6,858947

0,691053

0,477554

2,91

8,06

8,4681

64,9636

23,4546

7,940461

0,119539

0,01429

2,77

9,06

7,6729

82,0836

25,0962

7,827467

1,232533

1,519138

2,87

7,95

8,2369

63,2025

22,8165

7,908177

0,041823

0,001749

3,29

8,3

10,8241

68,89

27,307

8,247159

0,052841

0,002792

1,25

8,14

1,5625

66,2596

10,175

6,600675

1,539325

2,369521

3,85

9,36

14,8225

87,6096

36,036

8,699135

0,660865

0,436743

1,84

6,34

3,3856

40,1956

11,6656

7,076864

-0,73686

0,542969

3,32

7,97

11,0224

63,5209

26,4604

8,271372

-0,30137

0,090825

4,56

9,8

20,7936

96,04

44,688

9,272176

0,527824

0,278598

3,68

8,55

13,5424

73,1025

31,464

8,561928

-0,01193

0,000142

1,45

6,73

2,1025

45,2929

9,7585

6,762095

-0,0321

0,00103

4,03

8,63

16,2409

74,4769

34,7789

8,844413

-0,21441

0,045973

2,7

8,16

7,29

66,5856

22,032

7,77097

0,38903

0,151344

2,61

8,75

6,8121

76,5625

22,8375

7,698331

1,051669

1,106008

2,58

7,64

6,6564

58,3696

19,7112

7,674118

-0,03412

0,001164

2,78

7,45

7,7284

55,5025

20,711

7,835538

-0,38554

0,14864

2,52

7,38

6,3504

54,4644

18,5976

7,625692

-0,24569

0,060365

2,01

7,07

4,0401

49,9849

14,2107

7,214071

-0,14407

0,020756