Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
15
Добавлен:
17.04.2013
Размер:
381.44 Кб
Скачать

Министерство общего и профессионального образования

Российской федерации

Московский государственный институт электронной техники

(Технический университет)

Курсовая работа

“ Анализ данных в линейной регрессионной модели ”

по курсу

Теория вероятностей и

математическая статистика ”

Преподаватель: Бардушкин В.В.

Студент: группа ЭКТ-27

Выборнов А.С.

Москва 2004

Теоретическая часть.

1.Статистическое описание и выборочные характеристики

двумерного случайного вектора.

Пусть ,­- выборка объема из наблюдений случайного двумерного вектора. Предварительное представление о двумерной генеральной совокупности можно получить, изображая элементы выборки точками на плоскости с выбранной декартовой системой координат. Это представление выборки называется диаграммой рассеивания.

Распределением двумерной выборки называется распределение двумерного дискретного случайного вектора, принимающего значения , с вероятностями, равными . Выборочные числовые характеристики вычисляются как соответствующие числовые характеристики двумерного случайного вектора дискретного типа.

Выборочная линейная регрессия на по выборке , определяется уравнением

Выборочные средние находятся по формулам

.

Вычислим суммы квадратов отклонений от среднего и произведений отклонений от средних:

Отсюда

Коэффициенты и называются выборочными коэффициентами регрессии. Они вычисляются по формулам

Аналогично определяется выборочная линейная регрессия на :

коэффициенты и которой находятся по формулам

Для контроля правильности расчетов используют соотношение

Прямые регрессии пересекутся в точке .

2.Линейная регрессия.

В регрессионном анализе изучается связь между зависимой переменной и одной или несколькими независимыми переменными. Пусть переменная зависит от одной переменной . При этом предполагается, что переменная принимает фиксированные значения, а зависимая переменная имеет случайный разброс из-за ошибок измерения, влияния неучтенных факторов и т.д. Каждому значению переменной соответствует некоторое вероятностное распределение случайной величины . Предположим, что случайная величина в среднем линейно зависит от значений переменной . Это означает, что условное математическое ожидание случайной величины при заданном значении переменной имеет вид

Функция переменной, определяемая правой частью формулы, называется линейной регрессией на , а параметры и - параметрами линейной регрессии. На практике параметры линейной регрессии неизвестны и их оценки определяют по результатам наблюдений переменных и .

Пусть проведено независимых наблюдений случайной величины при значениях переменной при этом измерения величины дали следующие результаты: Так как эти значения имеют «разброс» относительно регрессии, то связь между переменными и можно записать в виде линейной регрессионной модели:

где - случайная ошибка наблюдений, причем Значение дисперсии ошибок наблюдений неизвестно, и оценка ее определяется по результатам наблюдений.

Задача линейного регрессионного анализа состоит в том, чтобы по результатам наблюдений ,

-получить наилучшие точечные и интервальные оценки неизвестных параметров и модели;

-проверить статистические гипотезы о параметрах модели;

-проверить достаточно ли хорошо модель согласуется с результатами наблюдений.

Разности между наблюдаемыми значениями переменной при ,и расчетными значениями называются остатками и обозначаются :

Качество аппроксимации результатов наблюдений , выборочной регрессии определяется величиной остаточной дисперсии, вычисляемой по формуле:

Величина , определяемая выражением

называется остаточной суммой квадратов.

В практических вычислениях остаточную сумму квадратов получают из тождества

которое записывается в виде

,

где

Величина называется суммой квадратов, обусловленной регрессией.

Полезной характеристикой линейной регрессии является коэффициент детерминации ,

вычисляемый по формуле

Коэффициент детерминации равен той доле разброса результатов наблюдений , относительно горизонтальной прямой , которая объясняется выборочной регрессией.

В случае линейной регрессии на между коэффициентом и выборочным коэффициентом корреляции имеется следующее соотношение:

.

Соседние файлы в папке 6 вар