Курсовые / Курсачи ЭКТ 2-2 / 3 вар / курсач по терверу 3вар
.doc
Министерство общего и профессионального образования
Российской федерации
Московский государственный институт электронной техники
(Технический университет)
Курсовая работа
“ Анализ данных в линейной регрессионной модели ”
по курсу
“ Теория вероятностей и
математическая статистика ”
Преподаватель: Епихин В.Н.
Студент: группа ЭКТ-24
Брагин К. Р.
Москва 2004
Теоретическая часть.
1.Статистическое описание и выборочные характеристики
двумерного случайного вектора.
Пусть ,- выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.
Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.
Выборочная линейная регрессия на по выборке , определяется уравнением
Выборочные средние находятся по формулам
.
Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:
Отсюда
Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам
Аналогично определяется выборочная линейная регрессия на :
коэффициенты и которой находятся по формулам
Для контроля правильности расчетов используют соотношение
Прямые регрессии пересекутся в точке .
2.Линейная регрессия.
В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид
Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .
Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют «разброс» относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:
где - случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.
Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,
-получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;
-проверить статистические гипотезы о параметрах модели;
-проверить достаточно ли хорошо модель согласуется с результатами наблюдений.
Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :
Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:
Величина , определяемая выражением
называется остаточной суммой квадратов.
В практических вычислениях остаточную сумму квадратов получают из тождества
которое записывается в виде
,
где
Величина называется суммой квадратов, обусловленной регрессией.
Полезной характеристикой линейной регрессии является коэффициент детерминации ,
вычисляемый по формуле
Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.
В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:
.
3.Однофакторный дисперсионный анализ.
Пусть результаты наблюдений составляют независимых выборок, полученных нормально распределенных генеральных совокупностей, которые имеют различные средние и равные дисперсии . Проверяется гипотеза о равенстве средних На практике такая задача возникает при исследовании влияния, которое оказывает изменение некоторого фактора на измеряемую величину. Например, если измерения проводятся на различных приборах, то можно исследовать влияние фактора «прибор» на результаты измерений. В данном случае нас интересует вопрос, имеют ли различные приборы одну и ту же систематическую ошибку.
Пусть обозначает -й элемент -й выборки, -выборочное среднее -й выборки, т.е.
;
- общее выборочное среднее, т.е.
где -общее число наблюдений,
Общая сумма квадратов отклонений от общего среднего может быть представлена так:
Это основное тождество дисперсионного анализа. Запишем его в виде
где -общая сумма квадратов отклонений наблюдений от общего среднего, - сумма квадратов отклонений выборочных средних от общего среднего , - сумма квадратов отклонений наблюдений от выборочных средних.
Данное тождество легко проверяется, если учесть, что
и
в силу определения и
Если верна гипотеза : , то статистики и независимы и имеют распределение с и степенями свободы. Следовательно, статистики и являются несмещенными оценками дисперсии . Значительное превышение величины над значением величины можно объяснить различием средних в группах. Отношение этих оценок имеет распределение Фишера с и степенями свободы, т.е.
Эта статистика используется для проверки гипотезы : . Гипотеза не противоречит результатам наблюдений, если выборочное значение статистики меньше квантили . В этом случае и являются несмещенными оценками параметров и . Если то гипотеза отклоняется и следует считать, что среди средних имеется хотя бы два не равных друг другу.
Практическая часть.
x |
y |
mx |
x^2 |
y^2 |
x*y |
sum(x^2) |
yreg |
ei |
ei^2 |
Qe |
1,93 |
6,88 |
3,0338 |
3,7249 |
47,3344 |
13,2784 |
501,4519 |
7,149503 |
-0,2695 |
0,072632 |
19,82971 |
3,86 |
8,8 |
my |
14,8996 |
77,44 |
33,968 |
sum(y^2) |
8,707206 |
0,092794 |
0,008611 |
s^2 |
1,34 |
6,89 |
8,0404 |
1,7956 |
47,4721 |
9,2326 |
3279,108 |
6,673314 |
0,216686 |
0,046953 |
0,413119 |
4,22 |
7,82 |
|
17,8084 |
61,1524 |
33,0004 |
sum(x*y) |
8,997762 |
-1,17776 |
1,387123 |
|
3,45 |
8,62 |
|
11,9025 |
74,3044 |
29,739 |
1252,947 |
8,376295 |
0,243705 |
0,059392 |
|
3,91 |
8,72 |
|
15,2881 |
76,0384 |
34,0952 |
|
8,747561 |
-0,02756 |
0,00076 |
|
4,06 |
7,75 |
|
16,4836 |
60,0625 |
31,465 |
|
8,868626 |
-1,11863 |
1,251324 |
|
2,78 |
7,92 |
|
7,7284 |
62,7264 |
22,0176 |
|
7,835538 |
0,084462 |
0,007134 |
|
3,08 |
7,22 |
|
9,4864 |
52,1284 |
22,2376 |
|
8,077668 |
-0,85767 |
0,735594 |
|
2,83 |
7,71 |
|
8,0089 |
59,4441 |
21,8193 |
|
7,875893 |
-0,16589 |
0,02752 |
|
3,55 |
7,96 |
|
12,6025 |
63,3616 |
28,258 |
|
8,457005 |
-0,49701 |
0,247014 |
|
3,15 |
9,18 |
|
9,9225 |
84,2724 |
28,917 |
|
8,134165 |
1,045835 |
1,093771 |
|
2,65 |
6,9 |
|
7,0225 |
47,61 |
18,285 |
|
7,730615 |
-0,83062 |
0,689921 |
|
0,98 |
5,75 |
|
0,9604 |
33,0625 |
5,635 |
|
6,382758 |
-0,63276 |
0,400383 |
|
3,67 |
7,47 |
|
13,4689 |
55,8009 |
27,4149 |
|
8,553857 |
-1,08386 |
1,174746 |
|
4,67 |
9,44 |
|
21,8089 |
89,1136 |
44,0848 |
|
9,360957 |
0,079043 |
0,006248 |
|
2,04 |
6,95 |
|
4,1616 |
48,3025 |
14,178 |
|
7,238284 |
-0,28828 |
0,083108 |
|
4,72 |
10,57 |
|
22,2784 |
111,7249 |
49,8904 |
|
9,401312 |
1,168688 |
1,365832 |
|
2,29 |
6,98 |
|
5,2441 |
48,7204 |
15,9842 |
|
7,440059 |
-0,46006 |
0,211654 |
|
3,72 |
9,46 |
|
13,8384 |
89,4916 |
35,1912 |
|
8,594212 |
0,865788 |
0,749589 |
|
3,1 |
8,02 |
|
9,61 |
64,3204 |
24,862 |
|
8,09381 |
-0,07381 |
0,005448 |
|
4,41 |
10,16 |
|
19,4481 |
103,2256 |
44,8056 |
|
9,151111 |
1,008889 |
1,017857 |
|
4,26 |
8,55 |
|
18,1476 |
73,1025 |
36,423 |
|
9,030046 |
-0,48005 |
0,230444 |
|
2,64 |
7,02 |
|
6,9696 |
49,2804 |
18,5328 |
|
7,722544 |
-0,70254 |
0,493568 |
|
2,69 |
7,28 |
|
7,2361 |
52,9984 |
19,5832 |
|
7,762899 |
-0,4829 |
0,233191 |
|
3,41 |
8,72 |
|
11,6281 |
76,0384 |
29,7352 |
|
8,344011 |
0,375989 |
0,141368 |
|
3,44 |
7,97 |
|
11,8336 |
63,5209 |
27,4168 |
|
8,368224 |
-0,39822 |
0,158582 |
|
2,81 |
7,81 |
|
7,8961 |
60,9961 |
21,9461 |
|
7,859751 |
-0,04975 |
0,002475 |
|
2,67 |
8,25 |
|
7,1289 |
68,0625 |
22,0275 |
|
7,746757 |
0,503243 |
0,253254 |
|
3,08 |
8,36 |
|
9,4864 |
69,8896 |
25,7488 |
|
8,077668 |
0,282332 |
0,079711 |
|
3,69 |
8 |
|
13,6161 |
64 |
29,52 |
|
8,569999 |
-0,57 |
0,324899 |
|
1,57 |
7,55 |
|
2,4649 |
57,0025 |
11,8535 |
|
6,858947 |
0,691053 |
0,477554 |
|
2,91 |
8,06 |
|
8,4681 |
64,9636 |
23,4546 |
|
7,940461 |
0,119539 |
0,01429 |
|
2,77 |
9,06 |
|
7,6729 |
82,0836 |
25,0962 |
|
7,827467 |
1,232533 |
1,519138 |
|
2,87 |
7,95 |
|
8,2369 |
63,2025 |
22,8165 |
|
7,908177 |
0,041823 |
0,001749 |
|
3,29 |
8,3 |
|
10,8241 |
68,89 |
27,307 |
|
8,247159 |
0,052841 |
0,002792 |
|
1,25 |
8,14 |
|
1,5625 |
66,2596 |
10,175 |
|
6,600675 |
1,539325 |
2,369521 |
|
3,85 |
9,36 |
|
14,8225 |
87,6096 |
36,036 |
|
8,699135 |
0,660865 |
0,436743 |
|
1,84 |
6,34 |
|
3,3856 |
40,1956 |
11,6656 |
|
7,076864 |
-0,73686 |
0,542969 |
|
3,32 |
7,97 |
|
11,0224 |
63,5209 |
26,4604 |
|
8,271372 |
-0,30137 |
0,090825 |
|
4,56 |
9,8 |
|
20,7936 |
96,04 |
44,688 |
|
9,272176 |
0,527824 |
0,278598 |
|
3,68 |
8,55 |
|
13,5424 |
73,1025 |
31,464 |
|
8,561928 |
-0,01193 |
0,000142 |
|
1,45 |
6,73 |
|
2,1025 |
45,2929 |
9,7585 |
|
6,762095 |
-0,0321 |
0,00103 |
|
4,03 |
8,63 |
|
16,2409 |
74,4769 |
34,7789 |
|
8,844413 |
-0,21441 |
0,045973 |
|
2,7 |
8,16 |
|
7,29 |
66,5856 |
22,032 |
|
7,77097 |
0,38903 |
0,151344 |
|
2,61 |
8,75 |
|
6,8121 |
76,5625 |
22,8375 |
|
7,698331 |
1,051669 |
1,106008 |
|
2,58 |
7,64 |
|
6,6564 |
58,3696 |
19,7112 |
|
7,674118 |
-0,03412 |
0,001164 |
|
2,78 |
7,45 |
|
7,7284 |
55,5025 |
20,711 |
|
7,835538 |
-0,38554 |
0,14864 |
|
2,52 |
7,38 |
|
6,3504 |
54,4644 |
18,5976 |
|
7,625692 |
-0,24569 |
0,060365 |
|
2,01 |
7,07 |
|
4,0401 |
49,9849 |
14,2107 |
|
7,214071 |
-0,14407 |
0,020756 |
|